VIF, हालत सूचकांक और eigenvalues


15

मैं वर्तमान में अपने डेटासेट में बहुस्तरीयता का आकलन कर रहा हूं।

VIF और हालत सूचकांक के दहलीज मूल्य नीचे / ऊपर एक समस्या का सुझाव देते हैं?

वीआईएफ: मैंने सुना है कि वीआईएफ एक समस्या है।10

दो समस्या चर हटाने के बाद, वीआईएफ है प्रत्येक चर के लिए। क्या चर को अधिक उपचार की आवश्यकता है या क्या यह VIF ठीक लगता है?3.96

कंडीशन इंडेक्स: मैंने सुना है कि 30 या उससे अधिक का एक कंडीशन इंडेक्स (CI) एक समस्या है। मेरा उच्चतम सीआई 16.66 है। क्या ये एक दिक्कत है?

अन्य मामले:

  • क्या कोई अन्य डॉस / डॉन्स हैं जिन पर विचार करने की आवश्यकता है?
  • क्या कोई और चीज है जिसे मुझे ध्यान में रखने की आवश्यकता है?

1
कृपया प्रश्न स्पष्ट करें। विशेष रूप से, ये पहले से कुछ टिप्पणियां थीं: @chl से - "आपको एक निश्चित मुद्दे के साथ स्पष्ट प्रश्न (वे अपने आप में दिलचस्प हैं) लिखने पर विचार करना चाहिए, और आपके मूल प्रश्न के लिए प्रासंगिक अतिरिक्त infos के लिए आरक्षित टिप्पणियां का पालन करना चाहिए, नहीं- यूपी"। @Shane द्वारा - "इस वर्तमान प्रश्न के बारे में: इसमें सुधार भी किया जा सकता है क्योंकि इसमें बिना किसी स्पष्ट सामान्य धागे के कई अलग-अलग प्रश्न पूछे जाते हैं। क्या आप सामान्य रूप से मल्टीकोलिनरिटी में रुचि रखते हैं? या क्या आप VIF में रुचि रखते हैं? यह बेहतर होगा कि आप इसे तोड़ दें। विस्तृत जानकारी के लिए।"

जवाबों:


5

बहुसांस्कृतिक समस्या का अध्ययन वास्तव में अधिकांश अर्थमितीय पाठ्यपुस्तकों में किया जाता है। इसके अलावा विकिपीडिया में एक अच्छा लेख है जो वास्तव में अधिकांश प्रमुख मुद्दों को संक्षेप में प्रस्तुत करता है।

व्यवहार में बहुसंस्कृति समस्या को ध्यान में रखना शुरू कर देता है यदि यह पैरामीटर अस्थिरता के कुछ दृश्य संकेत का कारण बनता है (उनमें से अधिकांश गैर (खराब) इन्वर्टिबिलिटी द्वारा निहित हैं एक्सटीएक्स आव्यूह):

  1. डेटा के छोटे उप-नमूनों पर रोलिंग regressions या अनुमानों का प्रदर्शन करते समय पैरामीटर अनुमानों में बड़े बदलाव
  2. पैरामीटर अनुमानों के औसत, बाद वाले तुच्छ हो सकते हैं (द्वारा) टी परीक्षण) भले ही रद्दी-प्रतिगमन एफ परीक्षण परिणामों के उच्च संयुक्त महत्व को दर्शाता है
  3. VIF स्टेटिस्टिक (सहायक प्रतिगमन का औसत मूल्य) केवल सहिष्णुता के स्तर पर आपकी आवश्यकताओं पर निर्भर करता है, अधिकांश व्यावहारिक सुझावों में स्वीकार्य सहिष्णुता को 0.2 या 0.1 से कम होने का अर्थ है जो सहायक रजिस्टरों के संगत औसत आर2समस्या का पता लगाने के लिए 0.9 या 0.8 से अधिक होना चाहिए। इस प्रकार VIF को नियम-से-अंगूठे के 10 और 5 मानों से बड़ा होना चाहिए। छोटे नमूनों में (50 अंक से कम) 5 बेहतर है, बड़े में आप बड़े मूल्यों पर जा सकते हैं।
  4. हालत सूचकांक आपके मामले में VIF का एक विकल्प है और न ही VIF और न ही CI समस्या को छोड़ता है, इसलिए आप इस परिणाम पर सांख्यिकीय रूप से संतुष्ट हो सकते हैं , लेकिन ...

शायद सैद्धांतिक रूप से नहीं, क्योंकि यह हो सकता है (और आमतौर पर मामला है) कि आपको मॉडल में उपस्थित होने के लिए सभी चर की आवश्यकता होती है। प्रासंगिक चर (छोड़ी गई चर समस्या) को छोड़कर, किसी भी तरह से पक्षपाती और असंगत पैरामीटर अनुमान लगाएगा। दूसरी ओर आपको केवल इसलिए ध्यान केंद्रित करने के लिए मजबूर किया जा सकता है क्योंकि आपका विश्लेषण इस पर आधारित है। डेटा-माइनिंग दृष्टिकोण में हालांकि आप सबसे अच्छे फिट की खोज करने में अधिक तकनीकी हैं।

इसलिए विकल्पों का ध्यान रखें (कि मैं खुद का उपयोग करूंगा):

  1. अधिक डेटा पॉइंट प्राप्त करें (याद रखें कि VIF की आवश्यकताएं बड़े डेटा सेट और व्याख्यात्मक चर के लिए छोटी हैं यदि वे धीरे-धीरे भिन्न हो रहे हैं, समय या क्रॉस-सेक्शन में कुछ महत्वपूर्ण बिंदुओं के लिए बदल सकते हैं)
  2. मुख्य घटकों के माध्यम से अव्यक्त कारकों की खोज (उत्तरार्द्ध ऑर्थोगोनल संयोजन हैं इसलिए निर्माण द्वारा बहु- समाप्य नहीं, सभी व्याख्यात्मक चर शामिल हैं)
  3. रिज-रिग्रेशन (यह पैरामीटर अनुमानों में छोटे पूर्वाग्रह का परिचय देता है, लेकिन उन्हें अत्यधिक स्थिर बनाता है)

कुछ अन्य तरकीबें ऊपर उल्लिखित विकि लेख में हैं।


3

मेरा मानना ​​है कि Belsely ने कहा कि CI 10 से अधिक संभावित मध्यम समस्या का संकेत है, जबकि 30 से अधिक गंभीर है।

इसके अलावा, हालांकि, आपको उच्च स्थिति सूचकांकों में चर के सेट द्वारा साझा किए गए विचरण को देखना चाहिए। इस बात पर बहस चल रही है (या पिछली बार मैंने इस साहित्य को पढ़ा था) कि क्या संपार्श्विकता जिसमें एक चर शामिल था और अवरोधन समस्यात्मक था या नहीं, और क्या केंद्र को बंद चर से समस्या से छुटकारा मिला, या बस इसे कहीं और स्थानांतरित कर दिया।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.