रैखिक प्रतिगमन के लिए समरूपता धारणा का उल्लंघन करने के खतरे क्या हैं?


28

एक उदाहरण के रूप ChickWeightमें, आर में सेट किए गए आंकड़ों पर विचार करें । समय के साथ विचरण स्पष्ट रूप से बढ़ता है, इसलिए यदि मैं एक सरल रेखीय प्रतिगमन का उपयोग करता हूं जैसे:

m <- lm(weight ~ Time*Diet, data=ChickWeight)

मेरे सवाल:

  1. मॉडल के कौन से पहलू संदिग्ध होंगे?
  2. क्या समस्याएं Timeरेंज के बाहर एक्सट्रपलेशन करने तक सीमित हैं ?
  3. इस धारणा के उल्लंघन के लिए रैखिक सहिष्णुता कैसे सहिष्णु है (यानी, समस्या का कारण बनने के लिए विषमलैंगिकता कितनी होती है)?

1
उत्तर में वर्णित बातों के अलावा, आपके पूर्वानुमान अंतराल में भी सही कवरेज नहीं होगा।
Glen_b -Reinstate मोनिका

जवाबों:


22

लीनियर मॉडल (या "साधारण न्यूनतम वर्ग") में अभी भी इस मामले में निष्पक्षता संपत्ति है।

त्रुटि के संदर्भ में विषमलैंगिकता के सामने, आपके पास अभी भी निष्पक्ष पैरामीटर अनुमान हैं, लेकिन आप सहसंयोजक मैट्रिक्स पर ढीले हैं: आपका अनुमान (यानी पैरामीटर परीक्षण) बंद हो सकता है। सामान्य फिक्स कोविरियस मैट्रिक्स उर्फ ​​मानक त्रुटियों की गणना के लिए एक मजबूत विधि का उपयोग करना है। जो आप उपयोग करते हैं वह कुछ हद तक डोमेन-निर्भर है लेकिन व्हाइट की विधि एक शुरुआत है।

और पूर्णता के लिए, त्रुटि शर्तों के सीरियल सहसंबंध बदतर है क्योंकि यह पक्षपाती पैरामीटर अनुमानों को जन्म देगा।


मानकों पर परीक्षण / विश्वास अंतराल के साथ मानक त्रुटियों (जैसे व्हाइट की विधि) के मजबूत अनुमान, लेकिन भविष्यवाणी अंतराल के साथ मदद नहीं करते हैं?
kjetil b halvorsen

पैरामीटर वेक्टर के सहसंयोजक का उपयोग भविष्यवाणियों की गणना करने में किया जाता है इसलिए आपके पूर्वानुमान अंतराल भी सामान्य रूप से पक्षपाती होंगे।
मुस्तफा एस आइसा

सही बात। निष्पक्ष होल्ड, अनुमान बंद हो सकता है। अन्य दो पैरा हालांकि सही हैं।
डिर्क एडल्डबुलेटेल

1
इसे पकड़ने के लिए धन्यवाद, और स्पष्ट होने के बजाय (चुपचाप, या "ड्राइव-बाय", डाउनवोट)। मैं शब्दावली के मेरे उपयोग में केवल एक अजीब सा मैला था। अब बेहतर है।
डिर्क एडल्डबुलेटेल

23

Homoscedasticity गॉस मार्कोव मान्यताओं में से एक है जो OLS के लिए सबसे अच्छा रैखिक निष्पक्ष अनुमानक (BLUE) होना आवश्यक है।

गॉस-मार्कोव प्रमेय हमें बता रहा है कि गुणांक लिए कम से कम वर्ग अनुमानक निष्पक्ष है और सभी निष्पक्ष रैखिक अनुमानकर्ताओं के बीच न्यूनतम भिन्नता है, यह देखते हुए कि हम सभी गौस-मार्कोव मान्यताओं को पूरा करते हैं। आप प्रमेय के गणितीय प्रमाण सहित गॉस-मार्कोव प्रमेय के बारे में अधिक जानकारी पा सकते हैं यहाँ । इसके अतिरिक्त, आप OLS मान्यताओं की एक पूरी सूची पा सकते हैं, जिसमें स्पष्टीकरण भी शामिल है कि उनके यहाँ उल्लंघन होने पर क्या होता हैβ

उपरोक्त वेबसाइटों की जानकारी को संक्षेप में बताते हुए, हेटेरोसेडेसिटी आपके सहिंता के अनुमानों में पूर्वाग्रह का परिचय नहीं देती है। हालाँकि, विषमलैंगिकता को देखते हुए, आप विचरण-सहसंयोजक मैट्रिक्स का ठीक से अनुमान लगाने में सक्षम नहीं हैं। इसलिए, गुणांक के मानक त्रुटियां गलत हैं। इसका मतलब यह है कि कोई किसी भी आँकड़ों और पी-मूल्यों की गणना नहीं कर सकता है और फलस्वरूप परिकल्पना परीक्षण संभव नहीं है। कुल मिलाकर, विषमलैंगिकता के तहत OLS अपनी दक्षता खो देता है और अब BLUE नहीं है।

हालांकि, विषमलैंगिकता दुनिया का अंत नहीं है। सौभाग्य से, विषमलैंगिकता के लिए सही करना मुश्किल नहीं है। सैंडविच अनुमानक आपको गुणांक के लिए लगातार मानक त्रुटियों का अनुमान लगाने की अनुमति देता है। फिर भी, सैंडविच अनुमानक के माध्यम से मानक त्रुटियों की गणना एक लागत पर आती है। अनुमानक बहुत कुशल नहीं है और मानक त्रुटियां बहुत बड़ी हो सकती हैं। यदि संभव हो तो मानक त्रुटियों को क्लस्टर करने के लिए कुछ दक्षता वापस पाने का एक तरीका है।

इस विषय पर अधिक विस्तृत जानकारी आप ऊपर बताई गई वेबसाइटों पर पा सकते हैं।


12

समरूपता की अनुपस्थिति मापदंडों के अविश्वसनीय मानक त्रुटि अनुमान दे सकती है। पैरामीटर अनुमान निष्पक्ष हैं। लेकिन अनुमान कुशल नहीं हो सकता है (ब्लू नहीं)। आप नीचे दिए गए लिंक में कुछ और पा सकते हैं


12

लॉग(Y)Yβगलत तरीके से और पूर्ण त्रुटियों के गैर-प्रतिस्पर्धी योग में परिणाम। कभी-कभी विचरण की कमी के कारण मॉडलिंग की अधिक समस्या का संकेत मिलता है।

Yलॉग(Y)


1

अन्य उत्तरों में यहाँ अच्छी जानकारी है, विशेष रूप से आपके पहले प्रश्न के लिए। मैंने सोचा कि मैं आपके पिछले दो प्रश्नों के बारे में कुछ प्रशंसात्मक जानकारी जोड़ूंगा।

  1. विषमलैंगिकता से जुड़ी समस्याएं केवल एक्सट्रपलेशन तक सीमित नहीं हैं। चूँकि वे मुख्य रूप से आत्मविश्वास अंतराल, पी-मान और भविष्यवाणी की सीमाएँ गलत होते हैं, इसलिए वे आपके डेटा की पूरी सीमा में लागू होते हैं।
  2. 4×
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.