एक रेखीय मॉडल की मान्यताओं को सत्यापित करने के लिए अवशिष्ट बनाम सज्जित मूल्यों की व्याख्या करना


34

आर (2005, पी। 59) के साथ फ़रावे के रैखिक मॉडल के निम्नलिखित आंकड़े पर विचार करें।

यहाँ छवि विवरण दर्ज करें

पहला कथानक इंगित करता है कि अवशिष्ट और सज्जित मूल्य असंबंधित हैं, क्योंकि उन्हें एक होमोसिस्टेस्टिक लीनियर मॉडल में होना चाहिए जो सामान्य रूप से वितरित त्रुटियों के साथ हो। इसलिए, दूसरे और तीसरे भूखंड, जो अवशेषों और सज्जित मूल्यों के बीच निर्भरता को इंगित करते हैं, एक अलग मॉडल का सुझाव देते हैं।

लेकिन दूसरा प्लॉट फ़ारवे नोट्स के रूप में, एक विषमकोणीय रैखिक मॉडल का सुझाव क्यों देता है, जबकि तीसरा प्लॉट एक गैर-रेखीय मॉडल का सुझाव देता है?

दूसरे कथानक से प्रतीत होता है कि अवशेषों का निरपेक्ष मूल्य सज्जित मूल्यों के साथ दृढ़ता से सहसंबद्ध है, जबकि तीसरे कथानक में ऐसी कोई प्रवृत्ति स्पष्ट नहीं है। तो अगर यह मामला था, सैद्धांतिक रूप से, विषम विषम रैखिक मॉडल में सामान्य रूप से वितरित त्रुटियों के साथ

Cor(e,y^)=[1111]

(जहाँ बाईं ओर अभिव्यक्ति अवशिष्ट और सज्जित मानों के बीच विचरण-सहसंयोजक मैट्रिक्स है) यह समझाता है कि दूसरे और तीसरे भूखंड फ़ारवे की व्याख्याओं से सहमत क्यों हैं।

लेकिन क्या यह मामला है? यदि नहीं, तो दूसरे और तीसरे भूखंडों की फ़ारवे की व्याख्याओं को कैसे उचित ठहराया जा सकता है? इसके अलावा, तीसरा प्लॉट गैर-रैखिकता को क्यों दर्शाता है? क्या यह संभव नहीं है कि यह रैखिक है, लेकिन यह है कि त्रुटियों को या तो सामान्य रूप से वितरित नहीं किया जाता है, या फिर यह कि उन्हें सामान्य रूप से वितरित किया जाता है, लेकिन शून्य के आसपास नहीं है?


3
तीनों प्लॉटों में से कोई भी सहसंबंध नहीं दिखाता है (कम से कम रैखिक संबंध नहीं है, जो कि उस अर्थ में 'सहसंबंध' का प्रासंगिक अर्थ है जिसमें इसका उपयोग " अवशिष्ट और सज्जित मान असंबद्ध हैं ") किया जा रहा है।
Glen_b -Reinstate मोनिका

1
@Glen_b: धन्यवाद। मैंने उस अनुच्छेद को ठीक किया है जिसका उल्लेख आप "सहसंबंध" के लिए "निर्भरता" को प्रतिस्थापित करके कर रहे थे।
इवान आद

जवाबों:


46

नीचे उन अनुमानित अवधियों के साथ अवशिष्ट भूखंडों और बिंदुओं के प्रसार (सीमाएं जिनमें अधिकांश मूल्य शामिल हैं) फिट किए गए (और इसलिए ) के प्रत्येक मूल्य पर अंकित हैं - सशर्त अर्थ (लाल) और सशर्त माध्य को इंगित करने वाले किसी न किसी सन्निकटन को। ± (लगभग) सशर्त मानक विचलन (बैंगनी) से दोगुना:x±

डायग्नोस्टिक प्लॉट अनुमानित औसत के साथ अनुमानित मूल्य के प्रत्येक मूल्य पर फैलता है

  • xyx

  • yx

क्या यह संभव नहीं है कि यह रैखिक है, लेकिन यह है कि त्रुटियों को या तो सामान्य रूप से वितरित नहीं किया जाता है, या फिर यह कि उन्हें सामान्य रूप से वितरित किया जाता है, लेकिन शून्य के आसपास नहीं है?

वास्तव में नहीं *, उन स्थितियों में भूखंड तीसरे भूखंड के लिए अलग दिखते हैं।

θβ0+θ

(ii) यदि त्रुटियों को आम तौर पर वितरित नहीं किया जाता है तो केंद्र रेखा के अलावा डॉट्स का पैटर्न कहीं और घना हो सकता है (यदि डेटा तिरछा था), तो कहें, लेकिन स्थानीय माध्य अवशिष्ट अभी भी 0 के पास होगा।

गैर-सामान्य त्रुटियाँ

यहां बैंगनी रेखाएं अभी भी (बहुत) लगभग 95% अंतराल का प्रतिनिधित्व करती हैं, लेकिन यह अब सममित नहीं है। (मैं मूल बिंदु को अस्पष्ट करने से बचने के लिए कुछ मुद्दों पर बात कर रहा हूं।)

xyx


1
y^y^x

2
x1x2x1

1
x

σ2IN(0,V)Vσ2IV
इवान एड

1
(ctd) ... जैसा कि आप मेरे जवाब के तहत मेरी पहली टिप्पणी से देख सकते हैं, विशेष रूप से वाक्य की शुरुआत के परिणामस्वरूप "आप कल्पना कर सकते हैं ..." - लेकिन यह बहुत अधिक नियमों से संबंधित है जो इससे संबंधित है मतलब।
Glen_b -Reinstate मोनिका

2

आप ने लिखा

दूसरे कथानक से प्रतीत होता है कि अवशिष्टों का निरपेक्ष मूल्य सज्जित मूल्यों के साथ दृढ़ता से सहसंबद्ध है,

यह "प्रतीत नहीं होता", यह करता है। और यही है कि हेटेरोसेडैस्टिक का मतलब है।

फिर आप सभी 1s का एक मैट्रिक्स देते हैं, जो अप्रासंगिक है; सहसंबंध मौजूद हो सकता है और 1 से कम हो सकता है।

फिर आप लिखते हैं

इसके अलावा, तीसरा प्लॉट गैर-रैखिकता को क्यों दर्शाता है? क्या यह संभव नहीं है कि यह रैखिक है, लेकिन यह है कि त्रुटियों को या तो सामान्य रूप से वितरित नहीं किया जाता है, या फिर यह कि उन्हें सामान्य रूप से वितरित किया जाता है, लेकिन शून्य के आसपास नहीं है?

वे लगभग 0. आधा केंद्र करते हैं या तो 0 से नीचे हैं, आधा ऊपर। यह बताना मुश्किल है कि क्या वे सामान्य रूप से इस भूखंड से वितरित किए जाते हैं, लेकिन आमतौर पर अनुशंसित एक और भूखंड अवशिष्ट का एक सामान्य सामान्य भूखंड है, और यह दिखाएगा कि वे सामान्य हैं या नहीं।


N(0,V)Vσ2I

1
एक मात्रात्मक सामान्य भूखंड केवल सामान्यता को देखता है। पहले साजिश में homoskedasticity के लिए सबूत दृश्य है
फिर से बहाल करते मोनिका - पीटर Flom

@PeterFlom: नेक्रोपोस्ट के लिए क्षमा करें: मैं उस परिमाण के बारे में थोड़ा उलझन में हूँ जिससे हम प्रत्येक बिंदु पर त्रुटि पर विचार करते हैं (xi, yi): क्या हम कई प्रतिक्रियाओं (xi, y1_1), (xi, yi_2) पर विचार करते हैं, ... , (xi, yi_m) इनपुट xi के लिए; i = 1,2, ..., n (डेटा बिंदुओं की संख्या) और फिर yi_j के मानों के लिए माध्य और विचरण ज्ञात करें? मैं सिर्फ इस बात के लिए उलझन में हूं कि एक रेखीय प्रतिगमन y = ax + b, x, y, (या एक बहुवचन एक y + a1x1 + a2x2 + ... चिंता क्यों ai, xi) यादृच्छिक चर हैं और निश्चित नहीं हैं। इसके अलावा, क्या हम यह विश्लेषण प्रत्येक जोड़े के लिए भविष्यवाणियों और प्रत्येक जोड़ी (y, x_i) के साथ y के स्वतंत्र मूल्य के लिए करते हैं?
गैरी

मुझे समझ नहीं आ रहा है कि आप किस उलझन में हैं। प्रत्येक अवलोकन के लिए y का अनुमानित मूल्य और वास्तविक मूल्य y है। अवशिष्ट उनके बीच का अंतर है।
पीटर Flom - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.