संपार्श्विकता का पता लगाने के लिए विभिन्न दृष्टिकोणों के गुण क्या हैं?


11

मैं यह पता लगाना चाहता हूं कि क्या मेरे ओएलएस रिग्रेशन में कोलिनियरिटी एक समस्या है। मैं समझता हूं कि प्रसरण मुद्रास्फीति कारक और स्थिति सूचकांक दो आमतौर पर उपयोग किए जाने वाले उपाय हैं, लेकिन प्रत्येक दृष्टिकोण के गुणों या स्कोर क्या होना चाहिए, इसके बारे में कुछ भी निश्चित करना मुश्किल है।

एक प्रमुख स्रोत जो इंगित करता है कि क्या करना है, और / या क्या स्कोर उपयुक्त हैं, बहुत उपयोगी होगा।

इसी तरह का सवाल पूछा गया था "क्या बहुसंस्कृति के विशिष्ट माप को प्राथमिकता देने का एक कारण है?" लेकिन मैं आदर्श रूप से एक संदर्भ के बाद हूं कि मैं उद्धृत कर सकता हूं।


4
याद रखें कि संपार्श्विकता बहुत हद तक एक डिग्री है , इसलिए भले ही आपको एक ऐसा पाठ मिल जाए जो एक अच्छा, उपयुक्त संख्या देता है, यह ऐसा कुछ नहीं है जिसे आपको "कोई समस्या नहीं" के लिए एक कठिन कट-ऑफ मूल्य के रूप में व्यवहार करना चाहिए "बनाम" हमें एक समस्या है "।
सिल्वरफिश

4
@ सिल्वरफ़िश अच्छी सलाह देती है। Belsley, Kuh और Welsch इस बात पर भी जोर देते हैं कि मौजूद होने पर भी, समान रूप से हानिकारक नहीं है: आपको यह निर्धारित करना होगा कि क्या यह वास्तव में आपके विश्लेषण के लिए समस्या पैदा कर रहा है।
व्हिबर

जवाबों:


11

Belsley, Kuh, और Welsch है प्रश्न के इस प्रकार के लिए पर जाने के लिए पाठ। उनमें "ऐतिहासिक परिप्रेक्ष्य" नामक अनुभाग में पुराने निदानों की व्यापक चर्चा शामिल है। VIF के संबंध में वे लिखते हैं

... अगर हम मानते हैं कि डेटा को केंद्र की लंबाई के लिए केंद्रित और स्केल किया गया है, तो सहसंबंध मैट्रिक्स बस । ...आर एक्स ' एक्सXRXX

हम विचार कर रहे हैं । , विकर्ण तत्व , अक्सर विचरण मुद्रास्फीति कारक, , और उनके नैदानिक ​​मान संबंध जहां शेष व्याख्यात्मक चर पर के कई सहसंबंध गुणांक है । स्पष्ट रूप से एक उच्च VIF एकता के पास एक इंगित करता है, और इसलिए इशारा करता है । यह उपाय इसलिए कोलीनियरिटी के समग्र संकेत के रूप में कुछ उपयोग का है। इसकी कमजोरियाँ, जैसे कि R - 1 r i i VIF i VIF i = 1R1=(XX)1R1riiVIFi आर 2 मैं एक्समैंआर 2 मैं आर

VIFi=11Ri2
Ri2XiRi2R, निर्भरता के पास कई सह-अस्तित्व के बीच भेद करने की अपनी असमर्थता में निहित है और VIF के मूल्यों के बीच अंतर करने के लिए एक सार्थक सीमा की कमी है जिसे उच्च माना जा सकता है और जिन्हें कम माना जा सकता है।

(या ) का विश्लेषण करने के स्थान पर , बीकेडब्ल्यू ने के विलक्षण मूल्य अपघटन की सावधानीपूर्वक नियंत्रित परीक्षा का प्रस्ताव किया । वे यह प्रदर्शित करके प्रेरित करते हैं कि सबसे छोटे एकवचन मूल्यों के लिए सबसे बड़ा अनुपात की स्थिति संख्या है और यह दर्शाती है कि प्रतिगमन अनुमानों की गणना में कंप्यूटिंग त्रुटियों के प्रसार पर शर्त संख्या (कितनी बार तंग) प्रदान करती है। वे विलक्षण मानों से जुड़े घटकों में पैरामीटर अनुमानों अनुमानित अपघटन का प्रयास करते हैं। इस अपघटन की शक्ति प्रकृति को प्रकट करने की क्षमता (कई मामलों में) में निहित हैआर - 1 एक्स एक्स β मैंRR1XXβ^i केवल अपनी उपस्थिति का संकेत देने के बजाय, समरूपता का।

जिस किसी ने भी सैकड़ों वैरिएबल के साथ प्रतिगमन मॉडल बनाया है, वह इस सुविधा की सराहना करेगा! सॉफ़्टवेयर के लिए यह कहना एक बात है कि "आपका डेटा कोलिनियर है, मैं आगे नहीं बढ़ सकता" या यहां तक ​​कि यह कहने के लिए भी "आपका डेटा कोलीनियर है, मैं निम्नलिखित चर बाहर फेंक रहा हूं।" यह पूरी तरह से इसके लिए एक बहुत अधिक उपयोगी बात है कि यह कहने में सक्षम हो "चर का समूह गणना में अस्थिरता पैदा कर रहा है: देखें कि आप उन चर में से बिना कर सकते हैं या विचार कर सकते हैं। उनकी संख्या कम करने के लिए एक प्रमुख घटक विश्लेषण का प्रदर्शन करना। "Xi1,,Xik

अंत में, BKW के माध्यम से संपार्श्विकता का निदान करने की सलाह देते हैं

... निम्नलिखित दोहरी स्थिति:

  1. एक उच्च मूल्य सूचकांक के लिए एक विलक्षण मूल्य को आंका गया है, और जो इसके साथ जुड़ा हुआ है
  2. उच्च विचरण-अपघटन अनुपात दो या दो से अधिक अनुमानित प्रतिगमन गुणांक भिन्नताएं हैं।

(1 के से ) (1 से ) माना स्थिति इंडेक्स की संख्या डेटा मैट्रिक्स के कॉलम के बीच निकट निर्भरता की संख्या की पहचान करती है , और इन उच्च स्थिति इंडेक्स के परिमाण उनके रिश्तेदार "कसने" का एक माप प्रदान करते हैं। " इसके अलावा, प्रत्येक उच्च स्थिति सूचकांक के साथ जुड़े बड़े विचरण-विघटन अनुपात (कहते हैं, से अधिक) का निर्धारण (2) उन चरों की पहचान करता है जो निर्भरता के निकट संगत होते हैं, और उच्च के साथ संयोजन में इन अनुपातों की भयावहता। स्थिति सूचकांक उस डिग्री का एक माप प्रदान करता है जिससे संबंधित प्रतिगमन अनुमान को कोलिनियरिटी की उपस्थिति से नीचा दिखाया गया है।X 0.530X0.5


10
  • R21/(1R2)

    हालांकि, आमतौर पर लागू किए गए VIF आपको इंटरसेप्ट के साथ कोलिनियरिटी के बारे में नहीं बता सकते हैं, क्योंकि इंटरसेप्ट आमतौर पर चुपचाप इन "हेल्पर" रजिस्टरों में शामिल होता है। इसके अलावा, यदि एक रजिस्ट्रार में उच्च वीआईएफ है, तो आप तुरंत नहीं जानते हैं कि अन्य रजिस्टरों को कोलिनियरिटी के लिए कौन जिम्मेदार है। आपको सहायक रजिस्टरों में मानकीकृत गुणांक को देखना होगा।

  • हालत सूचकांक और Belsley, Kuh और Welsch की समरैखिकता अपघटन अनुपात (Belsley, डीए, Kuh, ई और Welsch, आरई प्रतिगमन निदान:। की पहचान करना प्रभावशाली डाटा और Collinearity के सूत्रों का कहना जॉन विले एंड संस, 1980) कर रहे हैं अब तक कठिन समझने के लिए। मैं कुछ साल पहले इन के साथ काम करता था, लेकिन मैं उन्हें यहाँ एक पुनश्चर्या प्राप्त करने का प्रयास नहीं करूँगा;;

    ये निदान करते अवरोधन के साथ समरैखिकता का पता लगाने के लिए अनुमति देते हैं। और आप कोलिनैरिटी के अपघटन अनुपात की जांच कर सकते हैं ताकि यह पता लगाया जा सके कि एक रजिस्ट्रार की कोलिनैरिटी के लिए कौन से अन्य रेजिस्टर होते हैं।


धन्यवाद - बहुत उपयोगी - क्या आप संयोग से जानते हैं कि 10 नियम से अधिक VIF के लिए एक हवाला देते हैं ... मैं बहुत सारे इको-लेक्चर नोट्स में पा सकता हूं, लेकिन ऐसा कुछ भी प्रकाशित नहीं मिल सकता है जो यह कहता हो कि .. ।
कीरेनिया

@kyrenia "10 से अधिक" केवल उस दहलीज से दूर है जिसे मैंने सुझाया है! मुझे आश्चर्य है कि क्या क्षेत्रों में भिन्नता है, या केवल लेखकों के बीच।
सिल्वरफिश

3
2100

@whuber इसके लिए धन्यवाद। यह एक बहुत ही रोचक अवलोकन है और ओपी द्वारा पूछे गए प्रश्न के लिए अत्यधिक प्रासंगिक है: StackExchange प्रणाली के भीतर टिप्पणियों की "दूसरी रैंक" को देखते हुए, मुझे लगता है कि आपको इसे अपने उत्कृष्ट उत्तर में शामिल करने पर विचार करना चाहिए।
सिल्वरफिश

6

उद्धृत करने के लिए व्यापक रूप से उपलब्ध संदर्भों के लिए, पृष्ठ 117 पर फ़ारवे पुस्तक शर्त संख्याओं के आधार पर समस्याओं का पता लगाने के लिए 30 से ऊपर के अंगूठे का नियम प्रदान करती है, और सांख्यिकीय शिक्षा का एक परिचय , पृष्ठ 101, कहता है कि 5 या 10 से ऊपर के VIF मान एक समस्या का संकेत देते हैं ।

बहुसंख्या की पहचान के लिए आप किस पद्धति का उपयोग करते हैं, उससे अधिक महत्वपूर्ण यह है कि आप इससे कैसे निपटेंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.