क्या कई तुलनाओं के लिए एक बहु प्रतिगमन में p-मानों को समायोजित करना एक अच्छा विचार है?


54

मान लेते हैं कि आप एक सामाजिक विज्ञान शोधकर्ता / अर्थशास्त्री हैं जो किसी सेवा की माँग के प्रासंगिक भविष्यवाणियों को खोजने की कोशिश कर रहे हैं। आपके पास मांग का वर्णन करने वाले 2 परिणाम / आश्रित चर हैं (सेवा हाँ / नहीं, और अवसरों की संख्या का उपयोग करके)। आपके पास 10 भविष्यवक्ता / स्वतंत्र चर हैं जो सैद्धांतिक रूप से मांग की व्याख्या कर सकते हैं (उदाहरण के लिए, आयु, लिंग, आय, मूल्य, दौड़, आदि)। दो अलग-अलग कई रजिस्ट्रियों को चलाने से 20 गुणांक अनुमान और उनके पी-मान प्राप्त होंगे। अपने प्रतिगमन में पर्याप्त स्वतंत्र चर के साथ आप जल्द या बाद में आश्रित और स्वतंत्र चर के बीच सांख्यिकीय महत्वपूर्ण सहसंबंध के साथ कम से कम एक चर पाएंगे।

मेरा प्रश्न: क्या यह एक अच्छा विचार है कि यदि मैं प्रतिगमन में सभी स्वतंत्र चर को शामिल करना चाहता हूं, तो कई परीक्षणों के लिए पी-मान को सही करना है? पूर्व काम के किसी भी संदर्भ की बहुत सराहना की जाती है।


हम्म् ... दिलचस्प समस्या - एक चर के साथ द्विभाजन प्रतिगमन [तरह की] निरंतर और एक द्विस्पर्शी। सामान्य एमवीएन प्रतिगमन सिद्धांत कहता है कि दो द्विभाजित सामान्य प्रतिक्रियाओं में से प्रत्येक पर अलग-अलग प्रतिगमन कर रहे हैं - और फिर एक साथ परिणाम piecing - सही विश्लेषण है - सभी निष्पक्ष रैखिक अनुमानकर्ताओं के बीच प्रतिगमन अनुमानकों के vc मैट्रिक्स को कम करने के गॉस-मार्कोव अर्थ में - और एमवीएन मामले में, सभी निष्पक्ष आकलनकर्ताओं के बीच]। क्या 'अलग प्रतिगमन' अभी भी सबसे अच्छा एक कर सकता है जब एक प्रतिगमन रसद है? [निष्पक्षता उस मामले में थोड़ा खिंचाव लगती है,
एक्ससेप

जवाबों:


48

ऐसा लगता है कि आपका प्रश्न आम तौर पर अच्छे भविष्यवक्ताओं की पहचान करने की समस्या को संबोधित करता है। इस मामले में, आपको कुछ प्रकार के दंडित प्रतिगमन का उपयोग करने पर विचार करना चाहिए (चर या सुविधा चयन से निपटने के तरीके भी प्रासंगिक हैं), उदाहरण के लिए L1, L2 (या एक संयोजन, तथाकथित इलास्टनेट ) दंड (संबंधित प्रश्नों के लिए देखो) इस साइट, या आर दंडित और लोचदार पैकेज, दूसरों के बीच)।

अब, अपने प्रतिगमन गुणांक (या समतुल्य आपके सहसंबंध गुणांक) के लिए पी-मानों को सही करने के बारे में अति-आशावाद (जैसे बोन्फ्रोनी या बेहतर, कदम-नीचे तरीकों के साथ) से बचाने के लिए, ऐसा लगता है कि यह केवल प्रासंगिक होगा यदि आप विचार कर रहे हैं एक मॉडल और उन भविष्यवाणियों की तलाश करें जो व्याख्या किए गए विचरण के एक महत्वपूर्ण हिस्से का योगदान करते हैं, यदि आप मॉडल चयन नहीं करते हैं (स्टेप वाइज चयन या श्रेणीबद्ध परीक्षण के साथ)। यह लेख एक अच्छी शुरुआत हो सकती है: प्रतिगमन गुणांक के लिए टेस्ट में बोनफेरोनी समायोजन । विदित हो कि इस तरह के सुधार से आपको बहुसंस्कृति के मुद्दे की रक्षा नहीं होगी, जो रिपोर्ट किए गए पी-मूल्यों को प्रभावित करता है।

आपके डेटा को देखते हुए, मैं कुछ प्रकार के पुनरावृत्त मॉडल चयन तकनीकों का उपयोग करने की सलाह दूंगा। उदाहरण के लिए, stepAICफ़ंक्शन सटीक AIC द्वारा स्टेपवाइज़ मॉडल चयन करने की अनुमति देता है। आप भी अपने भविष्यवाणियों के सापेक्ष महत्व का अनुमान लगा सकते हैं, उनके योगदान के आधार पर बूस्ट्रेप ( relaimpo पैकेज देखें )। मुझे लगता है कि विशेष रूप से पुष्टिकरण मॉडल में रिपोर्टिंग प्रभाव आकार माप या समझाया विचरण का% पी-मूल्य से अधिक जानकारीपूर्ण है।R2

यह ध्यान दिया जाना चाहिए कि स्टेप वाइज दृष्टिकोणों में भी कमियां हैं (उदाहरण के लिए, वॉल्ड परीक्षण सशर्त परिकल्पना के अनुरूप नहीं हैं, जैसा कि स्टेप वाइज प्रक्रिया से प्रेरित है), या जैसा कि फ्रैंक मेल द्वारा आर मेलिंग पर संकेत दिया गया है , "एआईसी पर आधारित स्टेपवाइज वेरिएबल सभी है पी-मानों के आधार पर चरणबद्ध चर चयन की समस्याएं। एआईसी पी-मूल्य का केवल एक प्रतिबंध है "(लेकिन एआईसी उपयोगी रहता है यदि भविष्यवक्ताओं का सेट पहले से ही परिभाषित है); एक संबंधित प्रश्न - एक रैखिक प्रतिगमन मॉडल में एक चर महत्वपूर्ण है? - चर चयन के लिए एआईसी के उपयोग के बारे में दिलचस्प टिप्पणियाँ ( @Rob , दूसरों के बीच) को उठाया । मैं अंत में संदर्भों के एक जोड़े को जोड़ रहा हूं ( @Stephan द्वारा प्रदान किए गए कागजात सहित)); P.Mean पर कई अन्य संदर्भ भी हैं ।

फ्रैंक हरेल ने रिग्रेशन मॉडलिंग रणनीति पर एक किताब लिखी है जिसमें इस समस्या के आसपास बहुत चर्चा और सलाह शामिल हैं (p4.3, पीपी। 56-60)। उन्होंने सामान्यीकृत रैखिक मॉडल ( डिजाइन देखें या आरएमएस पैकेज देखें ) से निपटने के लिए कुशल आर दिनचर्या विकसित की । इसलिए, मुझे लगता है कि आपको निश्चित रूप से इस पर एक नज़र डालनी होगी (उसके हैंडआउट उसके होमपेज पर उपलब्ध हैं)।

संदर्भ

  1. व्हिंघम, एमजे, स्टीफंस, पी, ब्रैडबरी, आरबी, और फ्रीकटन, आरपी (2006)। हम अभी भी पारिस्थितिकी और व्यवहार में स्टेप वाइज मॉडलिंग का उपयोग क्यों करते हैं? जर्नल ऑफ़ एनिमल इकोलॉजी , 75 , 1182-1189।
  2. ऑस्टिन, पीसी (2008)। बूटस्ट्रैप मॉडल चयन में पिछड़े चर उन्मूलन की तुलना में प्रामाणिक और शोर चर का चयन करने के लिए समान प्रदर्शन था: एक सिमुलेशन अध्ययनजर्नल ऑफ क्लिनिकल एपिडेमियोलॉजी , 61 (10) , 1009-1017।
  3. ऑस्टिन, पीसी और तू, जेवी (2004)। लॉजिस्टिक रिग्रेशन के लिए स्वचालित चर चयन विधियाँ तीव्र रोधगलन मृत्यु दर की भविष्यवाणी करने के लिए अस्थिर मॉडल का उत्पादन करती हैंजर्नल ऑफ़ क्लिनिकल एपिडेमियोलॉजी , 57 , 1138–1146।
  4. ग्रीनलैंड, एस (1994)। कई जोखिमों के महामारी विज्ञान विश्लेषण के लिए पदानुक्रमित प्रतिगमनपर्यावरणीय स्वास्थ्य परिप्रेक्ष्य , 102 (सप्ल 8) , 33-39।
  5. ग्रीनलैंड, एस (2008)। सामान्य महामारी विज्ञान में कई तुलना और एसोसिएशन का चयनइंटरनेशनल जर्नल ऑफ एपिडेमियोलॉजी , 37 (3) , 430-434।
  6. बेइने, जे, एटनफू, ईजी, हामिद, जेएस, टू, टी और सुंग एल (2009)। भविष्य कहनेवाला मॉडल को विकसित करने और मान्य करने में चर के सापेक्ष महत्व का निर्धारणबीएमसी चिकित्सा अनुसंधान पद्धति , 9 , 64।
  7. बर्सैक, जेड, गॉस, सीएच, विलियम्स, डीके, और होसमर, डीडब्ल्यू (2008)। लॉजिस्टिक रिग्रेशन में चर का उद्देश्यपूर्ण चयनजीव विज्ञान और चिकित्सा के लिए स्रोत कोड , 3 , 17।
  8. ब्रोमबिन, सी, फिनोस, एल, और सलामासो, एल (2007)। सामान्यीकृत रैखिक मॉडल में स्टेप वाइज पी-वैल्यू को समायोजित करनाएकाधिक तुलना प्रक्रियाओं पर अंतर्राष्ट्रीय सम्मेलन । - step.adj()R someMTP पैकेज में देखें।
  9. विएगैंड, आरई (2010)। चर चयन के लिए कई स्टेप वाइज एल्गोरिदम का उपयोग करने का प्रदर्शनचिकित्सा में सांख्यिकी , 29 (15), 1647-1659।
  10. मून्स केजी, डंडर्स एआर, स्टेयरबर्ग ईडब्ल्यू, और हरेल फे (2004)। द्विआधारी परिणामों की भविष्यवाणी करने के लिए अधिकतम संभावित संभावना अनुमान। जर्नल ऑफ क्लिनिकल एपिडेमियोलॉजी , 57 (12) , 1262-1270।
  11. टिबशिरानी, ​​आर (1996)। प्रतिगमन संकोचन और लसो के माध्यम से चयनरॉयल सांख्यिकीय सोसायटी बी , 58 (1) , 267288 जर्नल।
  12. एफ्रोन, बी, हस्ती, टी, जॉनस्टोन, आई, और टिबशिरानी, ​​आर (2004)। कम से कम कोण प्रतिगमनसांख्यिकी के इतिहास , 32 (2) , 407-499।
  13. फ्लोम, पीएल और कैसेल, डीएल (2007)। स्टेप वाइज स्टेप वाइज: क्यों स्टेप वाइज और इसी तरह के सिलेक्शन के तरीके खराब हैं, और आपको क्या इस्तेमाल करना चाहिएNESUG 2007 की कार्यवाही
  14. शेटलैंड, ईएस, कैन, ई।, और बार्टन, एमबी (2001)। स्टेपवाइज लॉजिस्टिक रिग्रेशन के खतरों और सूचना मानदंडों और आउटपुट डिलीवरी सिस्टम का उपयोग करके उन्हें कैसे बचाना हैSUGI 26 कार्यवाही (पीपी। 222–226)।

10
मुझे बुरा नहीं लगता, लेकिन एक टिप्पणी की सराहना की जाएगी (इसलिए मैं खुद को सीख सकता हूं, समझ सकता हूं कि क्या गलत था, और मेरे भविष्य की प्रतिक्रियाओं में सुधार करें)।
chl

3
+1, अच्छा उत्तर और लेखक और पाठकों दोनों को यह समझने में मदद करने के लिए कि क्या कमी हो सकती है, को समझने के लिए एक व्याख्या छोड़ने के बारे में chl की टिप्पणी को सुरक्षित करना। धन्यवाद।
ars

मैं दूसरे प्रकार के दंडित प्रतिगमन (उदाहरण के लिए, लास्सो) का उपयोग करने की सिफारिश करता हूं।
एस। कोलासा - मोनिका

10
@chl: मैं स्टेपवाइज प्रेडिक्टर चयन की सिफारिश करने से नाखुश हूँ। आमतौर पर, यह पी-वैल्यू पर आधारित होता है ("पी के साथ एक भविष्यवक्ता को छोड़ दें। 15, इसे शामिल करें यदि पी <.05") और पक्षपाती अनुमान और खराब भविष्यवाणिय प्रदर्शन (व्हिटिंगम एट अल।, 2006), हम अभी भी क्यों करते हैं। पारिस्थितिकी और व्यवहार में स्टेपवाइज मॉडलिंग का उपयोग करें? जे एनिमल इकोल, 75, 1182-1189)। हालांकि, एआईसी-आधारित स्टेपवाइज एप्रोच में वही कमजोरी है - फ्रैंक हरेल ने सोम, 09 अगस्त 2010 16:34:19 -0500 (सीडीटी) पर आर-हेल्प टू थ्रेड में पोस्ट में चर्चा की "थ्रेड में लॉजिस्टिक रिग्रेशन (एसएएस -) आउटपुट की तरह) ”।
एस। कोलासा -

क्या टिप्पणियों में लिंक शामिल करने का कोई तरीका है?
एस। कोलासा - मोनिका

25

बहुत हद तक आप जो चाहें प्रदान कर सकते हैं, बशर्ते कि आप जिस भी मॉडल को बनाए रखने के लिए यादृच्छिक डेटा पर परीक्षण करने के लिए यादृच्छिक पर पर्याप्त डेटा रखते हैं। एक 50% विभाजन एक अच्छा विचार हो सकता है। हां, आप रिश्तों का पता लगाने की कुछ क्षमता खो देते हैं, लेकिन आपको जो हासिल होता है वह बहुत बड़ा है; अर्थात्, प्रकाशित होने से पहले अपने काम को दोहराने की क्षमता । कोई फर्क नहीं पड़ता कि आप कितना सांख्यिकीय तकनीकों को सहन करने के लिए लाते हैं, आप पुष्टि डेटा पर लागू होने पर कितने "महत्वपूर्ण" भविष्यवाणियों को पूरी तरह से बेकार होने पर चौंक जाएंगे।

ध्यान रखें, भविष्यवाणी के लिए "प्रासंगिक" का अर्थ कम पी-मूल्य से अधिक है। आखिरकार, इसका मतलब केवल यह है कि यह एक विशेष रूप से डेटासेट में पाया गया एक संबंध है, जो संयोग के कारण नहीं है। भविष्यवाणी के लिए यह वास्तव में अधिक महत्वपूर्ण है कि वे वेरिएबल्स का पता लगाएं जो कि भविष्यवाणियां (मॉडल को ओवर-फिटिंग किए बिना) पर पर्याप्त प्रभाव डालते हैं; यह है कि, "वास्तविक" होने की संभावना वाले चर खोजने के लिए और, जब मूल्यों की एक उचित सीमा में विविध (न केवल आपके नमूने में हो सकने वाले मूल्य हो सकते हैं!), भविष्यवाणियां सराहना के कारण भिन्न होने का कारण बनती हैं। जब आपके पास किसी मॉडल की पुष्टि करने के लिए होल्ड-आउट डेटा होता है, तो आप आंशिक रूप से "महत्वपूर्ण" चर को बनाए रखने में अधिक सहज हो सकते हैं, जिसमें कम पी-मान नहीं हो सकते हैं।

इन कारणों के लिए (और chl के ठीक उत्तर पर निर्माण), हालांकि मुझे स्टेपवाइज़ मॉडल, AIC तुलना और बोनफ़्रोनी सुधार काफी उपयोगी लगते हैं (विशेषकर नाटक में सैकड़ों या हजारों संभावित भविष्यवक्ताओं के साथ), ये एकमात्र वैरिएंट नहीं होने चाहिए जिनमें से चर अपना मॉडल दर्ज करें। सिद्धांत द्वारा खर्च किए गए मार्गदर्शन की दृष्टि न खोएं: या तो एक मॉडल में होने के लिए मजबूत सैद्धांतिक औचित्य वाले चर को आमतौर पर रखा जाना चाहिए, भले ही वे महत्वपूर्ण न हों, बशर्ते वे अ- सशस्त्र समीकरण नहीं बनाते हैं ( जैसे, संपार्श्विकता) ।

एनबी : जब आप एक मॉडल पर बस गए हैं और होल्ड-आउट डेटा के साथ इसकी उपयोगिता की पुष्टि की है, तो अंतिम अनुमान के लिए होल्ड-आउट डेटा के साथ बनाए रखा डेटा को फिर से जोड़ना ठीक है। इस प्रकार, सटीक के संदर्भ में कुछ भी नहीं खोया है जिसके साथ आप मॉडल गुणांक का अनुमान लगा सकते हैं।


धन्यवाद! यदि आपके पास मूल डेटा तक पहुँच नहीं है, लेकिन केवल प्रतिगमन गुणांक की एक तालिका है, तो क्या बोनफेरोनी आपकी एकमात्र पसंद है?
मिकेल एम

4
संभवतः आपके पास p-मान :-) भी हैं। लेकिन केवल उन और गुणांक के साथ, यह कल्पना करना मुश्किल है कि आप एक बोन्फ्रोनी समायोजन के अलावा और क्या कर सकते हैं। (जब मैं किसी भी पेपर को कई परीक्षणों के साथ पढ़ता हूं, तो मैं हमेशा ऐसा समायोजन करता हूं: यह उन परिणामों को जीतने का एक त्वरित तरीका है जो कबाड़ होने की संभावना है।) अधिकांश लोग चर के लिए सारांश आंकड़े भी प्रदान करते हैं: आप श्रेणियों या एसडीएस का उपयोग कर सकते हैं गुणांक का अनुमान लगाने के लिए कि प्रत्येक व्याख्यात्मक चर का पूर्वानुमान पर कितना प्रभाव हो सकता है।
whuber

आपकी व्याख्या के लिए धन्यवाद, esp। क्रॉस-मान्यता पर। मैं आपके अंतिम तर्क की सराहना करता हूं, अर्थात हमें सैद्धांतिक प्रासंगिकता (पी-वैल्यू से परे) को भी देखना होगा।
chl

19

मुझे लगता है कि यह एक बहुत अच्छा सवाल है; यह विवादास्पद कई परीक्षण "समस्या" के दिल में पहुंच जाता है जो महामारी विज्ञान से अर्थमिति तक के क्षेत्रों को ग्रस्त करता है। आखिर हम कैसे जान सकते हैं कि हमें जो महत्व मिला है, वह सहज है या नहीं? हमारा बहुउपयोगी मॉडल कितना सही है?

शोर चर को प्रकाशित करने की संभावना को ऑफसेट करने के लिए तकनीकी दृष्टिकोण के संदर्भ में, मैं दिल से 'व्हीबर' से सहमत होगा कि प्रशिक्षण डेटा के रूप में अपने नमूने के भाग का उपयोग करना और परीक्षण डेटा के रूप में बाकी एक अच्छा विचार है। यह एक दृष्टिकोण है जो तकनीकी साहित्य में चर्चा करता है, इसलिए यदि आप समय लेते हैं, तो आप इसका उपयोग कब और कैसे करें, इसके लिए कुछ अच्छे दिशानिर्देशों का पता लगा सकते हैं।

लेकिन कई परीक्षण के दर्शन पर अधिक सीधे हमला करने के लिए , मैं आपको नीचे दिए गए लेखों को पढ़ने का सुझाव देता हूं, जिनमें से कुछ इस स्थिति का समर्थन करते हैं कि कई परीक्षण के लिए समायोजन अक्सर हानिकारक होता है (लागत शक्ति), अनावश्यक, और यहां तक ​​कि एक तार्किक गिरावट भी हो सकती है। । मैं एक के लिए अपने आप इस दावे को स्वीकार नहीं करता कि एक संभावित भविष्यवक्ता की जांच करने की हमारी क्षमता दूसरे की जांच से कम है। परिवार-वार के रूप में हम किसी दिए गए मॉडल में अधिक भविष्यवक्ताओं शामिल टाइप 1 त्रुटि दर में वृद्धि हो सकती है, लेकिन जब तक हम अपने नमूने का आकार, प्रत्येक के लिए टाइप 1 त्रुटि की संभावना की सीमाओं से परे जाना नहीं अलग-अलगभविष्यवक्ता स्थिर है; और परिवार-वार त्रुटि को नियंत्रित करने से यह स्पष्ट नहीं होता कि कौन सा विशिष्ट शोर है और कौन सा नहीं है। बेशक, साथ ही साथ नकली-तर्क भी हैं।

इसलिए, जब तक आप संभावित चर की अपनी सूची को सीमित कर देते हैं, जो प्रशंसनीय हैं (जैसे, परिणाम के लिए ज्ञात रास्ते होंगे) तो पहले से ही सहजता का जोखिम काफी अच्छी तरह से संभाला जाता है।

हालाँकि, मैं यह कहना चाहूँगा कि एक भविष्य कहनेवाला मॉडल अपने भविष्यवक्ताओं के "सत्य-मूल्य" के कारण उतना ही चिंतित नहीं है जितना कि एक कारण मॉडल; मॉडल में बहुत बड़ा अंतर हो सकता है, लेकिन जब तक हम विचरण की एक बड़ी डिग्री की व्याख्या करते हैं तब तक हम चिंतित नहीं होते हैं। इससे काम आसान हो जाता है, कम से कम एक मायने में।

चीयर्स,

ब्रेंडन, बायोस्टैटिकल कंसल्टेंट

पुनश्च: आप दो अलग-अलग रजिस्टरों के बजाय आपके द्वारा वर्णित डेटा के लिए शून्य-फुलाया हुआ पॉइज़न प्रतिगमन करना चाहते हैं।

  1. Perneger, TV बोन्फ्रोनी समायोजन के साथ क्या गलत हैबीएमजे 1998; 316: 1236
  2. कुक, आरजे एंड फेयरवेल, VT परीक्षण और नैदानिक ​​परीक्षणों के डिजाइन में विश्लेषणजर्नल ऑफ़ द रॉयल स्टैटिस्टिकल सोसाइटी , सीरीज़ ए 1996; वॉल्यूम। 159, नंबर 1: 93-110
  3. रोथमैन, केजे कोई समायोजन कई तुलनाओं के लिए आवश्यक हैंमहामारी विज्ञान 1990; वॉल्यूम। 1, नंबर 1: 43-46
  4. मार्शल, जेआर डेटा ड्रेजिंग और उल्लेखनीयतामहामारी विज्ञान 1990; वॉल्यूम। 1, नंबर 1: 5-7
  5. ग्रीनलैंड, एस एंड रॉबिन्स, कई तुलनाओं के लिए जेएम Empirical-Bayes समायोजन कभी-कभी उपयोगी होते हैंमहामारी विज्ञान 1991; वॉल्यूम। 2, नंबर 4: 244-251

Cont'd: 2. कुक आरजे और विदाई VT डिजाइन और नैदानिक ​​परीक्षणों के विश्लेषण में गुणन विचार। जर्नल ऑफ़ द रॉयल स्टैटिस्टिकल सोसाइटी, सीरीज़ ए 1996; वॉल्यूम। 159, नंबर 1: 93-110
ब्रेंडेन

आपकी टिप्पणियों के लिए धन्यवाद, ब्रेंडेन, विशेष रूप से भविष्यवाणी बनाम कारण स्पष्टीकरण के बारे में अंतिम एक। और साइट पर आपका स्वागत है! मुझे उम्मीद है कि भविष्य में आपके कई और योगदान देखने को मिलेंगे।
whuber

Cont'd: 3. Rothman KJ कई तुलनाओं के लिए कोई समायोजन आवश्यक नहीं है। महामारी विज्ञान 1990; वॉल्यूम। 1, नंबर 1: 43-46 4. मार्शल जेआर डेटा ड्रेजिंग और उल्लेखनीयता। महामारी विज्ञान 1990; वॉल्यूम। 1, नंबर 1: 5-7 5. ग्रीनलैंड एस और रॉबिन्स जेएम एम्पैरिकल-बेस समायोजन कई तुलनाओं के लिए कभी-कभी उपयोगी होते हैं। महामारी विज्ञान 1991; वॉल्यूम। 2, नंबर 4: 244-251
ब्रेंडेन

(+1) आपको निम्नलिखित सूत्र में रुचि हो सकती है: आंकड़े . stackexchange.com/questions/3252/… । ऐसा लगता है कि हम बहुत सारे लिंक साझा करते हैं :-)
chl

6

यहां अच्छे जवाब हैं। मुझे कुछ छोटे बिंदु जोड़ने दें, जो मुझे कहीं और नहीं दिखते।

सबसे पहले, आपकी प्रतिक्रिया चर की प्रकृति क्या है? विशेष रूप से, क्या वे एक-दूसरे से संबंधित हैं? यदि आप स्वतंत्र (सैद्धांतिक रूप से) / यदि दो मॉडल से अवशिष्ट (स्वतंत्र रूप से) हैं, तो उन्हें केवल दो अलग-अलग रजिस्टर करना चाहिए। अन्यथा, आपको एक बहुभिन्नरूपी प्रतिगमन पर विचार करना चाहिए। ('बहुभिन्नरूपी' का अर्थ है> 1 प्रतिक्रिया चर; बहु 'का अर्थ है> 1 पूर्वसूचक चर।)

दूसरी बात यह है कि मॉडल एक वैश्विक परीक्षण के साथ आता है , जो सभी भविष्यवक्ताओं का एक साथ परीक्षण है । यह संभव है कि वैश्विक परीक्षण 'गैर-महत्वपूर्ण' हो, जबकि कुछ व्यक्तिगत भविष्यवक्ता 'महत्वपूर्ण' प्रतीत होते हैं। यदि आपको ऐसा होता है, तो आपको विराम देना चाहिए। दूसरी ओर, यदि वैश्विक परीक्षण से पता चलता है कि कम से कम कुछ भविष्यवक्ता संबंधित हैं, जो आपको कई तुलनाओं की समस्या से सुरक्षा प्रदान करता है (यानी, यह सुझाव देता है कि सभी अशक्त सही नहीं हैं)। F


0

आप एक प्रतीत होता है असंबंधित प्रतिगमन और एक एफ परीक्षण का उपयोग कर सकते हैं। अपना डेटा इस तरह से रखें:

Out1 1 P11 P12 0  0   0
Out2 0 0   0   1  P21 P22

ताकि आपके पहले परिणाम के लिए पूर्वसूचक उनके मान हों जब कि परिणाम y चर और 0 अन्यथा और इसके विपरीत हो। तो आपका y दोनों परिणामों की एक सूची है। P11 और P12 पहले परिणाम के लिए दो भविष्यवक्ता हैं और P21 और P22 दूसरे परिणाम के लिए दो भविष्यवक्ता हैं। यदि सेक्स, कहते हैं, दोनों परिणामों के लिए एक भविष्यवक्ता है, तो परिणाम 1 की भविष्यवाणी करने के लिए इसका उपयोग परिणाम की भविष्यवाणी करते समय एक अलग चर / स्तंभ में होना चाहिए। इससे आपके प्रतिगमन में प्रत्येक परिणाम के लिए सेक्स के लिए अलग ढलान / प्रभाव पड़ता है।

इस ढांचे में, आप मानक एफ परीक्षण प्रक्रियाओं का उपयोग कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.