एकाधिक प्रतिगमन में भविष्यवाणियों के बीच उच्च सहसंबंध से कैसे निपटें?


18

मुझे एक लेख में एक संदर्भ मिला जो इस प्रकार है:

तबैकनिक एंड फिडेल (1996) के अनुसार, एक से अधिक बाइरवेट सहसंबंध के साथ स्वतंत्र चर .70 को कई प्रतिगमन विश्लेषण में शामिल नहीं किया जाना चाहिए।

समस्या: मैंने एकाधिक प्रतिगमन डिज़ाइन में उपयोग किया है 3 चर> .80, VIF's के बारे में .2 - .3, .3, सहिष्णुता ~ 4- 5. मैं उनमें से किसी को भी नहीं निकाल सकता (महत्वपूर्ण भविष्यवक्ता और परिणाम)। जब मैंने .80 पर सहसंबद्ध 2 भविष्यवक्ताओं के परिणाम को फिर से प्राप्त किया, तो वे दोनों महत्वपूर्ण बने रहे, प्रत्येक ने महत्वपूर्ण रूपांतरों की भविष्यवाणी की, और इन सभी दो चर में सबसे बड़ा हिस्सा और सभी चर शामिल (5 नियंत्रण) के बीच अर्ध-सहसंबंध गुणांक हैं।

प्रश्न: क्या मेरा मॉडल उच्च सहसंबंधों के बावजूद वैध है? किसी भी संदर्भ बहुत स्वागत किया!


उत्तर देने के लिए आपको धन्यवाद!

मैंने एक गाइडलाइन के रूप में तबैकनिक और फिडेल का उपयोग नहीं किया, मुझे यह संदर्भ एक लेख में मिला जिसमें भविष्यवक्ताओं के बीच उच्च संपार्श्विकता के साथ व्यवहार किया गया था।

इसलिए, मूल रूप से, मेरे पास मॉडल में भविष्यवाणियों की संख्या के लिए बहुत कम मामले हैं (72 के लिए कई श्रेणीबद्ध, डमी कोडित नियंत्रण चर-आयु, कार्यकाल, लिंग, आदि) - 13 चर। द कंडीशन इंडेक्स ~ 29 है जिसमें सभी नियंत्रण हैं और ~ 23 उनके बिना (5 चर)।

मैं किसी भी चर को नहीं छोड़ सकता या उन्हें संयोजित करने के लिए तथ्यात्मक विश्लेषण का उपयोग नहीं कर सकता क्योंकि सैद्धांतिक रूप से उनके पास अपने आप में समझ है। अधिक डेटा प्राप्त करने में बहुत देर हो चुकी है। चूंकि मैं एसपीएसएस में विश्लेषण का संचालन कर रहा हूं, इसलिए रिज रिग्रेशन के लिए एक सिंटैक्स ढूंढना सबसे अच्छा होगा (हालांकि मैंने पहले ऐसा नहीं किया है और परिणामों की व्याख्या करना मेरे लिए नया होगा)।

अगर यह मायने रखता है, जब मैंने स्टेप वाइज रिग्रेशन किया था, तो वही 2 अत्यधिक सहसंबद्ध चर परिणाम के एकल महत्वपूर्ण भविष्यवक्ता बने रहे।

और मुझे अभी भी समझ नहीं आ रहा है कि इनमें से प्रत्येक चर के लिए आंशिक सहसंबंध जो उच्च हैं, इस बात के स्पष्टीकरण के रूप में कि मैंने उन्हें मॉडल में क्यों रखा है (यदि रिज प्रतिगमन नहीं किया जा सकता है)।

क्या आप कहेंगे "रिग्रेशन डायग्नोस्टिक: प्रभावशाली डेटा और कोलीनियरिटी के स्रोतों / डेविड ए। बेल्सले, एडविन कुह और रॉय ई। वेल्श, 1980 की पहचान" मल्टीकोलिनरिटी समझने में सहायक होगी? या अन्य संदर्भ उपयोगी हो सकते हैं?


2
इस स्थिति के एक स्पष्ट उदाहरण के लिए, आँकड़े .stackexchange.com / a / 14528 पर 10 IVs का विश्लेषण देखें । यहां, सभी IVs दृढ़ता से सहसंबद्ध (लगभग 60%) हैं। लेकिन अगर आपने उन सभी को बाहर कर दिया, तो आपके पास कुछ भी नहीं बचा होगा! अक्सर ऐसा होता है कि आप इनमें से कोई भी चर नहीं छोड़ सकते । यह T & F अनुशंसा को अस्थिर बनाता है।
whuber

वास्तव में, तबाकनीक और फिडेल में कई उच्चारण हैं जो मैं कम से कम कुछ संदिग्ध के रूप में मानता हूं ... सिर्फ इसलिए कि कोई किताब में छपी है इसका मतलब यह नहीं है कि यह हमेशा समझ में आता है।
Glen_b -Reinstate मोनिका

जवाबों:


20

मुख्य समस्या सहसंबंध नहीं है, लेकिन संपार्श्विकता है (उदाहरण के लिए, बेल्सले द्वारा काम करता है देखें)। यह सबसे अच्छा शर्त अनुक्रमित (उपलब्ध में का उपयोग कर परीक्षण किया जाता है R, SASऔर शायद अन्य कार्यक्रमों के रूप में अच्छी तरह से। सहसंबंध न तो एक आवश्यक है और न ही समरैखिकता के लिए पर्याप्त शर्त है 10 (Belsley प्रति) पर संकेत मिलता मध्यम समरैखिकता, 30 गंभीर से अधिक। स्थिति अनुक्रमित, लेकिन यह भी निर्भर करता है जिस पर चिरस्थायीता में चर शामिल होते हैं।

यदि आप उच्च संपार्श्विकता पाते हैं, तो इसका मतलब है कि आपके पैरामीटर का अनुमान अस्थिर है। यही है, आपके डेटा में छोटे परिवर्तन (कभी-कभी 4 वें महत्वपूर्ण आंकड़े में) आपके पैरामीटर अनुमानों में बड़े बदलावों का कारण बन सकते हैं (कभी-कभी इसके संकेत को उलट भी देते हैं)। यह बुरी बात है।

उपचार 1 हैं) अधिक डेटा प्राप्त करना 2) एक चर 3 को छोड़ना) चर (जैसे कि आंशिक कम से कम वर्ग) और 4 को मिलाकर) रिज ​​रिग्रेशन का प्रदर्शन करना, जो पक्षपाती परिणाम देता है लेकिन अनुमानों पर विचरण को कम करता है।


तब्ननिक और फ़िडेल ने सामाजिक विज्ञान के लिए एक अच्छी बहुभिन्नरूपी पुस्तक लिखी। वे सांख्यिकीविद् नहीं हैं, लेकिन बहुभिन्नरूपी का उनका ज्ञान पूर्ववर्ती अच्छा है। लेकिन मुझे लगता है कि वे सरल बनाने के लिए अंगूठे के नियम बना सकते हैं और सांख्यिकीय सूक्ष्मता को याद कर सकते हैं। इसलिए मैं इस बात पर अधिक भरोसा करूंगा कि पीटर ने अपने उत्तर में अपने प्रश्नपत्र की तुलना में क्या कहा है।
माइकल आर। चेरिक

धन्यवाद @MichaelChernick मैंने वास्तव में कई प्रतिगमन के लिए कोलिनियरिटी डायग्नोस्टिक्स पर अपना शोध प्रबंध लिखा था।
पीटर Flom - को पुनः स्थापित मोनिका

मुझे लगता है कि आप मेरे जितने बूढ़े हैं और इसलिए आपका काम बेल्सली, कुह और वेल्श और कुक के काम के बाद आया। मुझे पता है कि कुक का काम ज्यादातर अन्य नैदानिक ​​मुद्दों (उत्तोलन और गैर-सामान्यता) पर था, लेकिन क्या उन्होंने मल्टीकोलिनरिटी पर कुछ भी किया? बेशक रिज प्रतिगमन की अवधारणा यहां तक ​​कि मेरे समय से पहले वापस चली जाती है
माइकल आर। चेरिक

1
@ पैटर फ्लॉम: सहसंबंध न तो आवश्यक है और न ही कोलीनैरिटी के लिए पर्याप्त स्थिति है? क्या आप गैर-रैखिक संबंध का उल्लेख कर रहे हैं?
जूलियन

5
यह आवश्यक नहीं है, क्योंकि यदि बड़ी संख्या में चर हैं, तो सभी जोड़े केवल थोड़ा सहसंबद्ध हो सकते हैं, फिर भी उनमें से योग पूरी तरह से कॉलिनियर है। यह पर्याप्त नहीं है क्योंकि ऐसे मामले हैं जहां काफी हद तक उच्च सहसंबंध प्रति अवस्था अनुक्रमितों में परेशानी नहीं देता है
पीटर फ्लोम - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.