प्रतिगमन गुणांक जो अन्य भविष्यवक्ताओं को शामिल करने के बाद हस्ताक्षर करते हैं


31

कल्पना कीजिए

  • आप चार संख्यात्मक भविष्यवाणियों (IV1, ..., IV4) के साथ एक रेखीय प्रतिगमन चलाते हैं
  • जब केवल IV1 को एक भविष्यवक्ता के रूप में शामिल किया जाता है तो मानकीकृत बीटा होता है +.20
  • जब आप IV2 से IV4 को भी शामिल करते हैं, तो IV1 के मानकीकृत प्रतिगमन गुणांक का चिह्न -.25(यानी, यह नकारात्मक है)।

यह कुछ सवालों को जन्म देता है:

  • शब्दावली के संबंध में, क्या आप इसे "दमन प्रभाव" कहते हैं?
  • इस प्रभाव को समझाने और समझने के लिए आप किन रणनीतियों का उपयोग करेंगे?
  • क्या आपके पास व्यवहार में ऐसे प्रभावों के कोई उदाहरण हैं और आपने इन प्रभावों को कैसे समझाया और समझा?

आप ऐसी स्थिति की व्याख्या कैसे करेंगे जहां गुणांक भविष्यवाणियों को शामिल करते हुए संकेत बदलते हैं लेकिन निश्चित रूप से इसमें कोई बहुसंस्कृति शामिल नहीं है (जैसा कि कम VIF मान सुझाएगा)? दिलचस्प रूप से, हालांकि, जब भविष्यवक्ताओं को शामिल किया गया था, तो संकेत बदल गया कि मैंने शुरू में क्या उम्मीद की थी कि यह (सकारात्मक) हो। यह एक सरल एक स्वतंत्र चर प्रतिगमन में नकारात्मक था (सहसंबंध मैट्रिक्स ने आश्रित चर के साथ एक न्यूनतम नकारात्मक सहसंबंध दिखाया) लेकिन अन्य भविष्यवक्ताओं के साथ तुरंत सकारात्मक रूप से बदल गया।

@ जॉन आप अपनी टिप्पणी को हटा सकते हैं और इस साइट पर एक अलग प्रश्न के रूप में अपना प्रश्न पोस्ट कर सकते हैं (जैसे, "सवाल ऊपर पूछें" का उपयोग करके। यदि आपको लगता है कि आपका प्रश्न इस प्रश्न से संबंधित है, तो इस प्रश्न का लिंक इसमें जोड़ें। आपका नया प्रश्न।
जेरोमी एंग्लीम

2
एक पेपर जो मैंने सेठ दुतेर्ते के साथ लिखा था वह चीजों को स्पष्ट करने में मदद कर सकता है। यह मुख्य रूप से ज्यामितीय दृष्टिकोण से लिखा गया है। यहाँ लिंक है: arxiv.org/abs/1503.02722 । -ब्रायन कार्नेल, बी।, और दुतेर्ते, एस। (2015)। अद्वितीय प्रभावों के निर्देशों के लिए लिस्ट-स्क्वेर्स एस्टिमेट्स और मॉडल-इंडिपेंडेंट एस्टीमेशन के उलट। arXiv प्रीप्रिंट arXiv: 1503.02722।

जवाबों:


26

JoFrhwld के रूप में मल्टीकोलिनरिटी सामान्य रूप से संदिग्ध है। मूल रूप से, यदि आपके चर सकारात्मक रूप से सहसंबद्ध हैं, तो गुणांक नकारात्मक रूप से सहसंबद्ध होंगे, जिससे गुणांक में से एक पर गलत संकेत हो सकता है।

एक चेक एक प्रमुख घटक प्रतिगमन या रिज प्रतिगमन करने के लिए होगा। यह प्रतिगमन स्थान की गतिशीलता को कम करता है, बहुरंगीता को संभालता है। आप पक्षपाती अनुमानों के साथ समाप्त होते हैं, लेकिन संभवतः कम MSE और सही संकेत। आप उन विशेष परिणामों के साथ जाते हैं या नहीं, यह एक अच्छा नैदानिक ​​जाँच है। यदि आपको अभी भी साइन परिवर्तन मिलते हैं, तो यह सैद्धांतिक रूप से दिलचस्प हो सकता है।

अद्यतन करें

जॉन क्रिस्टी के जवाब में टिप्पणी के बाद, यह दिलचस्प हो सकता है। रिवर्सल इन एसोसिएशन (परिमाण या दिशा) सिम्पसन के विरोधाभास, भगवान के विरोधाभास और दमन प्रभाव के उदाहरण हैं। मतभेद अनिवार्य रूप से चर के प्रकार से संबंधित हैं। किसी विशेष "विरोधाभास" या प्रभाव के संदर्भ में सोचने के बजाय अंतर्निहित घटना को समझना अधिक उपयोगी है। एक कारण के परिप्रेक्ष्य में, नीचे दिया गया पेपर यह समझाने का एक अच्छा काम करता है कि मैं आपकी भूख को कम करने के लिए उनके परिचय और निष्कर्ष की लंबाई पर क्यों बोलूंगा।

Tu et al तीन विरोधाभासों के समतुल्य का एक विश्लेषण प्रस्तुत करता है, जिससे यह निष्कर्ष निकलता है कि तीनों किसी तीसरे चर के सांख्यिकीय रूप से नियंत्रित होने पर किसी भी दो चर के सहयोग में होने वाले असंतुलित परिवर्तन को दोहराते हैं। मैं इसे असत्य कहता हूं क्योंकि सशर्त विश्लेषण में उलट या परिमाण में परिवर्तन आम है। या तो बचने के लिए, हमें सशर्त विश्लेषण से पूरी तरह बचना चाहिए। यह सिम्पसन और लॉर्ड के विरोधाभास या दमन प्रभाव के बारे में क्या है, उनके संकेत से परे स्पष्ट है, जो साहित्य में दिखाई देने वाले रुक-रुक कर और कभी-कभी खतरनाक हितों को आकर्षित करता है?

[...]

निष्कर्ष में, यह अधिकतापूर्ण नहीं हो सकता है कि हालांकि सिम्पसन और संबंधित विरोधाभास सांख्यिकीय विश्लेषण का उपयोग करने के खतरों को कारण विश्लेषण के मार्गदर्शन के लिए प्रकट करते हैं, वे न तो उस घटना की व्याख्या करते हैं जिसे वे चित्रित करते हैं और न ही संकेत करते हैं कि उनसे कैसे बचा जाए। स्पष्टीकरण और समाधान कार्य-कारण में निहित हैं जो पृष्ठभूमि के ज्ञान पर निर्भर करता है, न कि सांख्यिकीय मानदंडों पर। यह उच्च समय है जब हमने गलत संकेतों और लक्षणों ('विरोधाभास') का इलाज करना बंद कर दिया था, और बीमारी से निपटने के व्यवसाय ('कारण') के साथ आगे बढ़ गए। हमें गैर-प्रायोगिक डेटा का उपयोग करके कारण विश्लेषण के लिए सहसंयोजक चयन की बारहमासी समस्या पर अपना ध्यान केंद्रित करना चाहिए।


1
रिज या पीसीए प्रतिगमन का पता लगाने के सुझाव के लिए धन्यवाद। आपकी टिप्पणी के बारे में बस एक पक्ष "यदि आपके चर सकारात्मक रूप से सहसंबद्ध हैं, तो गुणांक नकारात्मक रूप से सहसंबंधित होगा, जो उलटफेर पर हस्ताक्षर करने के लिए अग्रणी होगा।": सकारात्मक रूप से सहसंबंधित भविष्यवक्ता आमतौर पर साइन-रिवर्सल का नेतृत्व नहीं करते हैं।
जेरोमे एंग्लीम

क्षमा करें, यह जल्दबाजी में लिखी गई एक पंक्तिबद्ध व्याख्या है। अब तय है, धन्यवाद।
7:12

कारण तंत्र के महत्व के बारे में महान बिंदु।
जेरोमे एंग्लीम

14

मेरा मानना ​​है कि इन जैसे प्रभाव अक्सर मिलीभगत के कारण होते हैं ( इस प्रश्न को देखें )। मुझे लगता है कि जेलमैन और हिल द्वारा बहुस्तरीय मॉडलिंग पर पुस्तक इसके बारे में बात करती है। समस्या यह है कि IV1एक या एक से अधिक भविष्यवाणियों के साथ सहसंबंधित है, और जब वे सभी मॉडल में शामिल होते हैं, तो उनका अनुमान अनिश्चित हो जाता है।

यदि गुणांक फ़्लिपिंग समतुल्यता के कारण होता है, तो यह वास्तव में रिपोर्ट करना दिलचस्प नहीं है, क्योंकि यह आपके भविष्यवक्ताओं के बीच परिणाम के संबंध के कारण नहीं है, बल्कि वास्तव में भविष्यवक्ताओं के बीच संबंध के कारण है।

मैंने इस समस्या को हल करने के लिए जो सुझाव दिया है वह अवशिष्ट है। सबसे पहले, आप के लिए एक मॉडल फिट करते हैं IV2 ~ IV1, फिर उस मॉडल के अवशेषों को इस रूप में लेते हैं rIV2। यदि आपके सभी चर परस्पर संबंधित हैं, तो आपको वास्तव में उन सभी को अवशिष्ट करना चाहिए। आप ऐसा करने के लिए चुन सकते हैं

rIV2 <- resid(IV2 ~ IV1)
rIV3 <- resid(IV3 ~ IV1 + rIV2)
rIV4 <- resid(IV4 ~ IV1 + rIV2 + rIV3)

अब, के साथ अंतिम मॉडल फिट

DV ~ IV1 + rIV2 + rIV3 + rIV4

अब, गुणांक के साथ दिए गए सहसंबंध rIV2के स्वतंत्र प्रभाव का प्रतिनिधित्व करता है । मैंने सुना है कि यदि आप एक अलग क्रम में अवशिष्ट होते हैं, तो आपको वही परिणाम नहीं मिलेगा, और यह कि अवशिष्ट आदेश चुनना वास्तव में आपके शोध के भीतर एक निर्णय कॉल है।IV2IV1


जवाब के लिए धन्यवाद। मेरे ये विचार थे। (ए) मल्टीकोलिनरिटी: मैं सहमत हूं। इसे बदल दें, गुणांक नहीं बदलना चाहिए। (ख) क्या यह दिलचस्प है? मुझे वास्तव में लगता है कि साइन फ़्लिपिंग में कुछ उदाहरणों में दिलचस्प सैद्धांतिक व्याख्या हो सकती है; लेकिन शायद शुद्ध भविष्यवाणी के नजरिए से नहीं। (ग) अवशिष्ट: मैं यह सुनने के लिए उत्सुक हूं कि अन्य लोग इस दृष्टिकोण के बारे में क्या सोचते हैं।
जेरोमे एंग्लीम

मुझे यकीन नहीं है कि अगर मल्टीकोलीनिटी दिलचस्प हो सकती है। आप कुछ परिणाम था कहो O, और अपने पूर्वानुमान मिलता है Incomeऔर Father's Income। तथ्य यह Incomeहै कि Father's Incomeआंतरिक रूप से दिलचस्प है के साथ सहसंबद्ध है, लेकिन यह सच होगा कोई बात नहीं के मूल्य O। यही है, आप स्थापित कर सकते हैं कि Oभविष्यवक्ता सभी आपके परिणाम डेटा एकत्र किए बिना, या यहां तक ​​कि यह भी जानते हैं कि परिणाम क्या है! उन तथ्यों को विशेष रूप से अधिक दिलचस्प नहीं होना चाहिए जब आप जानते हैं कि Oवास्तव में है Education
JoFrhwld

मैं सुझाव दे रहा हूं कि दमनकारी प्रभाव सैद्धांतिक रूप से दिलचस्प हो सकता है, जिनमें से संभवतः बहुस्तरीयता एक स्पष्टीकरण के लिए एक प्रारंभिक बिंदु प्रदान करती है।
जेरोमी एंग्लीम

5

सिम्पसन का विरोधाभास देखें । संक्षेप में मुख्य प्रभाव को तब उलटा किया जा सकता है जब किसी मॉडल में इंटरैक्शन जोड़ा जाता है। लिंक किए गए पृष्ठ पर अधिकांश उदाहरण श्रेणीबद्ध हैं, लेकिन पृष्ठ के शीर्ष पर एक आकृति है जो लगातार कल्पना कर सकता है। उदाहरण के लिए, यदि आपके पास एक श्रेणीबद्ध और निरंतर भविष्यवक्ता है तो निरंतर भविष्यवक्ता आसानी से संकेत को फ्लिप कर सकता है यदि श्रेणीबद्ध को जोड़ा जाए और प्रत्येक श्रेणी के भीतर संकेत समग्र स्कोर की तुलना में भिन्न हो।


अच्छी बात। सिम्पसन के विरोधाभास के सभी उदाहरण श्रेणीबद्ध चर पर लागू होते हैं। क्या सुपरसॉर वैरिएबल की अवधारणा संख्यात्मक समतुल्य है?
जेरोमे एंग्लीम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.