एक अवरोधन में शामिल होने पर रेखीय प्रतिगमन में अवशिष्ट हमेशा शून्य क्यों होते हैं?


14

मैं प्रतिगमन मॉडल पर एक पाठ्यक्रम ले रहा हूं और रैखिक प्रतिगमन के लिए प्रदान किए गए गुणों में से एक यह है कि अवरोधन हमेशा शून्य होता है जब एक अवरोधन शामिल होता है।

क्या कोई ऐसा कारण बता सकता है कि यह मामला क्यों है?


3
आप पहले से संबंधित लेकिन सरल सवाल में क्यों एक univariate नमूना में
टटोलना पसंद

3
जैसे ही आप पहचानते हैं कि "शून्य से शून्य" का अर्थ है "व्याख्यात्मक चर में से एक के लिए ऑर्थोगोनल" उत्तर ज्यामितीय रूप से स्पष्ट हो जाता है।
whuber

जवाबों:


18

यह सामान्य समीकरणों से सीधे आता है, अर्थात वे समीकरण जो OLS आकलनकर्ता हल करते हैं,

X(yXb)e=0

कोष्ठक के अंदर वेक्टर निश्चित रूप से अवशिष्ट वेक्टर या के प्रक्षेपण पर एक्स के स्तंभ स्थान के ऑर्थोगोनल पूरक पर होता है , अगर आपको रैखिक बीजगणित पसंद है। अब एक्स मैट्रिक्स में लोगों का एक सदिश भी शामिल है , जिस तरह से पारंपरिक रूप से पहले कॉलम में होना जरूरी नहीं है।yXX

1e=0i=1nei=0

द्वि-चर समस्या में यह देखना और भी सरल है, क्योंकि चुकता अवशिष्टों का योग कम से कम हमें लाता है

i=1n(yiabxi)=0

जब हम अवरोधक को अवरोधन के संबंध में लेते हैं। इसके बाद से हम परिचित अनुमानक को प्राप्त करने के लिए आगे बढ़ते हैं

a=y¯bx¯

जहां हम फिर से देखते हैं कि हमारे अनुमानक का निर्माण इस शर्त को लागू करता है।


17

मामले में आप एक सहज ज्ञान युक्त व्याख्या के लिए देख रहे हैं।

कुछ अर्थों में, रैखिक प्रतिगमन मॉडल एक फैंसी मतलब के अलावा कुछ भी नहीं है। जानने के लिए समांतर माध्य x¯ कुछ मूल्यों पर x1,x2,,xn , हम एक अर्थ में केन्द्रीयता का एक उपाय है कि एक मूल्य पाते हैं कि सभी विचलनों (जहां प्रत्येक विचलन के रूप में परिभाषित किया गया है की राशि ui=xix¯) माध्य मान के दाईं ओर उस अर्थ के बाईं ओर सभी विचलन के योग के बराबर हैं। कोई भी अंतर्निहित कारण नहीं है कि यह उपाय क्यों अच्छा है, अकेले एक नमूने के माध्यम का वर्णन करने का सबसे अच्छा तरीका है, लेकिन यह निश्चित रूप से सहज और व्यावहारिक है। महत्वपूर्ण बिंदु यह है, कि अंकगणित माध्य को इस तरह से परिभाषित करने से, यह आवश्यक रूप से इस प्रकार है कि एक बार जब हमने अंकगणित माध्य का निर्माण किया है, तो इस अर्थ से सभी विचलन शून्य से योग होने चाहिए!

रैखिक प्रतिगमन में, यह अलग नहीं है। हम लाइन फिट ऐसी है कि हमारे फिट मान (जो प्रतिगमन लाइन पर कर रहे हैं) और वास्तविक मान रहे हैं के बीच सभी मतभेदों का योग ऊपर लाइन वास्तव में प्रतिगमन लाइन के बीच सभी मतभेदों और सभी मूल्यों की राशि के बराबर है नीचे लाइन। फिर, कोई अंतर्निहित कारण नहीं है, क्यों यह एक फिट बनाने का सबसे अच्छा तरीका है, लेकिन यह सीधा और सहज रूप से आकर्षक है। जैसे अंकगणित का मतलब है: इस तरह से हमारे फिट किए गए मूल्यों का निर्माण करके, यह जरूरी है कि निर्माण द्वारा, इस तरह से कि लाइन से सभी विचलन शून्य के लिए शून्य के लिए योग करना चाहिए अन्यथा यह सिर्फ एक ओएलएस मंदी नहीं होगा।


2
सीधे, सरल और सहज उत्तर के लिए +1!

महान व्याख्या, लेकिन मुझे यकीन नहीं है, "फिर से, कोई अंतर्निहित कारण नहीं है, यह एक फिट बनाने का सबसे अच्छा तरीका क्यों है, लेकिन यह सीधा और सहज रूप से आकर्षक है।" सही है। यह गाऊस-मार्कोव प्रमेय द्वारा अच्छी तरह से जाना जाता है कि ओएलएस अनुमानक BLUE हैं: सबसे अच्छा (न्यूनतम-भिन्नता) रैखिक निष्पक्ष अनुमान (अनुमानों को पूरा किया जाता है)। अक्सर, हमारी सहज "भावनाओं" के बारे में जो अपील / उचित है वह भी गणितीय रूप से समर्थित है, जैसा कि यहां मामला है।
मेग

3

y^i=β0+β1xi,1+β2xi,2++βpxi,p
SSE=i=1n(ei)2=i=1n(yiyi^)2=i=1n(yiβ0β1xi,1β2xi,2βpxi,p)2
β0
SSEβ0=i=1n2(yiβ0β1xi,1β2xi,2βpxi,p)1(1)=2i=1nei=0
इसलिए, अवशिष्ट रेखीय प्रतिगमन में एक अवरोधन में शामिल होने पर हमेशा शून्य के बराबर होता है।


1

1X

1=Xe,
e1T(yy^)

इसलिए,

1T(yy^)=1T(IH)y=eTXT(IX(XTX)1XT)y=eT(XTXTX(XTX)1XT)y=eT(XTXT)y=0.


0

मैट्रिक्स बीजगणित का उपयोग करके एक सरल व्युत्पत्ति:

e1Te

फिर

1Te=1T(Mxy)MxMx(Mx1)Ty

Mx1x1


मुझे नहीं लगता कि यह सही है।
माइकल आर। चेरिक

यदि आप समझाते हैं कि तब मुझे कुछ सीखने की खुशी क्यों होगी
मिनो

0
  1. ei=yi[1,X][a,b]=yiXba=via
  2. ddaei2ei1=via=0a^=1nvi
  3. ei=ivia=ivinnivi=0

..

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.