सरल रेखीय प्रतिगमन में, अवशिष्टों के विचरण का सूत्र कहां से आता है?


21

मेरे द्वारा उपयोग किए जा रहे पाठ के अनुसार, अवशिष्ट के विचलन का सूत्र निम्न द्वारा दिया गया है:ith

σ2(11n(xix¯)2Sxx)

मुझे यह विश्वास करना कठिन है क्योंकि अवशिष्ट, प्रेक्षित मूल्य और सज्जित मूल्य के बीच का अंतर है ; यदि कोई अंतर के विचरण की गणना करता है, तो कम से कम मैं परिणामी अभिव्यक्ति में कुछ "प्लसस" की उम्मीद करूंगा। व्युत्पत्ति को समझने में किसी भी मदद की सराहना की जाएगी।ithithith


क्या यह संभव है कि पाठ में कुछ " " संकेतों को गलत तरीके से प्रस्तुत किया जा रहा है (या गलत तरीके से) " " संकेत? +
whuber

मैंने यह सोचा था, लेकिन यह पाठ में दो बार हुआ (2 अलग-अलग अध्याय) इसलिए मैंने सोचा कि यह संभव नहीं है। बेशक, सूत्र की व्युत्पत्ति से मदद मिलेगी! :)
एरिक

निगेटिव एक अवलोकन और इसके सज्जित मूल्य के बीच सकारात्मक सहसंबंध का परिणाम है, जो अंतर के विचलन को कम करता है।
Glen_b -Reinstate Monica

@ ग्लेन यह समझाने के लिए धन्यवाद कि यह क्यों पता चला कि सूत्र आपके मैट्रिक्स व्युत्पत्ति के साथ-साथ समझ में आता है।
एरिक

जवाबों:


27

विचरण से संबंधित "प्लस" संकेतों के बारे में अंतर्ज्ञान (इस तथ्य से कि जब हम स्वतंत्र यादृच्छिक चर के अंतर के विचरण की गणना करते हैं, तो हम उनके भिन्न जोड़ते हैं) सही है, लेकिन मोटे तौर पर अधूरा है: यदि यादृच्छिक रूप से शामिल चर स्वतंत्र नहीं हैं। , फिर सहसंयोजक भी शामिल हैं-और सहसंबंध नकारात्मक हो सकते हैं। एक अभिव्यक्ति है कि वहां मौजूद लगभग सवाल में अभिव्यक्ति की तरह सोचा गया कि यह ओपी द्वारा हो "चाहिए" (और मुझे), और यह है की विचरण भविष्यवाणी त्रुटि , निरूपित यह , जहां y 0 = β 0 +e0=y0y^0 :y0=β0+β1x0+u0

Var(e0)=σ2(1+1n+(x0x¯)2Sxx)

भविष्यवाणी की त्रुटि और अनुमान त्रुटि के विचलन (यानी के अवशिष्ट) के बीच महत्वपूर्ण अंतर यह है कि अनुमानित अवलोकन के त्रुटि शब्द का अनुमान लगाने वाले के साथ संबंध नहीं है , क्योंकि मान का उपयोग निर्माण में नहीं किया गया था। अनुमानक और अनुमानों की गणना, एक आउट-ऑफ-नमूना मूल्य होने के नाते।y0

दोनों के लिए बीजगणित बिल्कुल उसी तरह से एक बिंदु तक बढ़ता है ( i के बजाय 0 का उपयोग करता है ), लेकिन फिर विचलन होता है। विशेष रूप से:0i

प्रतिगमन रैखिक सरल में , वार ( यू मैं ) = σ 2 , आकलनकर्ता की विचरण β = ( β 0 , β 1 ) ' अब भी हैyi=β0+β1xi+uiVar(ui)=σ2β^=(β^0,β^1)

Var(β^)=σ2(XX)1

हमारे पास है

XX=[nxixixi2]

इसलिए

(XX)1=[xi2xixin][nxi2(xi)2]1

हमारे पास है

[nxi2(xi)2]=[nxi2n2x¯2]=n[xi2nx¯2]=n(xi2x¯2)nSxx

इसलिए

(XX)1=[(1/n)xi2x¯x¯1](1/Sxx)

जिसका मतलब है कि

Var(β^0)=σ2(1nxi2) (1/Sxx)=σ2nSxx+nx¯2Sxx=σ2(1n+x¯2Sxx)

Var(β^1)=σ2(1/Sxx)

Cov(β^0,β^1)=σ2(x¯/Sxx)

मई के अवशिष्ट के रूप में परिभाषित किया गया हैi

u^i=yiy^i=(β0β^0)+(β1β^1)xi+ui

वास्तविक गुणांक, स्थिरांक के रूप में इलाज कर रहे हैं regressor तय हो गई है (या उस पर सशर्त), और त्रुटि शब्द के साथ शून्य सहप्रसरण है, लेकिन आकलनकर्ता त्रुटि अवधि रूप से संबद्ध है, क्योंकि आकलनकर्ता निर्भर चर होते हैं, और निर्भर चर त्रुटि शब्द है। तो हमारे पास

Var(u^i)=[Var(ui)+Var(β^0)+xi2Var(β^1)+2xiCov(β^0,β^1)]+2Cov([(β0β^0)+(β1β^1)xi],ui)

=[σ2+σ2(1n+x¯2Sxx)+xi2σ2(1/Sxx)+2Cov([(β0β^0)+(β1β^1)xi],ui)

इसे प्राप्त करने के लिए इसे थोड़ा पैक करें

Var(u^i)=[σ2(1+1n+(xix¯)2Sxx)]+2Cov([(β0β^0)+(β1β^1)xi],ui)

बड़े कोष्टक में अवधि भविष्यवाणी त्रुटि के विचरण के साथ ठीक उसी संरचना, केवल परिवर्तन किया जा रहा है कि के बजाय साथ है हम होगा एक्स 0 (और विचरण के लिए किया जाएगा कि 0 और की नहीं यू मैं )। क्योंकि पिछले सहप्रसरण अवधि भविष्यवाणी त्रुटि के लिए शून्य है y 0 और इसलिए यू 0 है नहीं क्योंकि आकलनकर्ता में शामिल है, लेकिन अनुमान त्रुटि के लिए नहीं शून्य y मैं और इसलिए यू मैं नमूना का हिस्सा है और इसलिए यह में शामिल है आकलनकर्ता। हमारे पास हैxix0e0u^iy0u0yiui

2Cov([(β0β^0)+(β1β^1)xi],ui)=2E([(β0β^0)+(β1β^1)xi]ui)

=2E(β^0ui)2xiE(β^1ui)=2E([y¯β^1x¯]ui)2xiE(β^1ui)

कैसे से पिछले प्रतिस्थापन β 0 गणना की जाती है। जारी रखते हुए,β^0

...=2E(y¯ui)2(xix¯)E(β^1ui)=2σ2n2(xix¯)E[(xix¯)(yiy¯)Sxxui]

=2σ2n2(xix¯)Sxx[(xix¯)E(yiuiy¯ui)]

=2σ2n2(xix¯)Sxx[σ2nji(xjx¯)+(xix¯)σ2(11n)]

=2σ2n2(xix¯)Sxx[σ2n(xix¯)+(xix¯)σ2]

=2σ2n2(xix¯)Sxx[0+(xix¯)σ2]=2σ2n2σ2(xix¯)2Sxx

अवशिष्ट के विचरण के लिए इसे अभिव्यक्ति में शामिल करते हुए, हम प्राप्त करते हैं

Var(u^i)=σ2(11n(xix¯)2Sxx)

तो ओपी उपयोग कर रहे पाठ से नफरत करता है।

(मैंने कुछ बीजीय जोड़तोड़ों को छोड़ दिया है, कोई आश्चर्य नहीं कि इन दिनों ओएलएस बीजगणित को कम और कम सिखाया जाता है ...)

कुछ अंतर


1/nप्रतिगमन के नमूने से एक प्रतिगामी के अवलोकन के विचलन का मतलब है, इस अवलोकन के साथ जुड़े अवशिष्ट के छोटे विचरण होंगे ... अधिक विचारणीय अवलोकन, कम अवशिष्ट इसके अवशिष्ट ... यह प्रतिगामी की परिवर्तनशीलता है। अज्ञात त्रुटि-परिवर्तनशीलता के "जगह लेने" द्वारा हमारे लिए काम करता है।

y0x0 y^0अधिक वैज्ञानिक भाषा में भटक जाएगा ... "कम भविष्यवाणी त्रुटि विचरण के अर्थ में इष्टतम भविष्यवक्ता, भविष्यवाणी के तहत चर के मतलब की ओर एक संकोचन का प्रतिनिधित्व करते हैं "। हम आश्रित चर की परिवर्तनशीलता को दोहराने की कोशिश नहीं करते हैं-हम सिर्फ "औसत के करीब" रहने की कोशिश करते हैं।


बहुत स्पष्ट उत्तर के लिए धन्यवाद! मुझे खुशी है कि मेरा "अंतर्ज्ञान" सही था।
एरिक

एलेकोस, मुझे नहीं लगता कि यह सही है।
Glen_b -Reinstate Monica

Var(u^i)=Var(ui)+Var(β^0)+xi2Var(β^1)+2xiCov(β^0,β^1)

@ इससे पहले कि मैं आपको गुमराह करने के लिए माफी माँगता हूँ। मैंने दोनों सूत्रों के लिए कुछ अंतर्ज्ञान प्रदान करने की कोशिश की है।
एलेकोस पापाडोपोलस

+1 आप देख सकते हैं कि मैंने इसके लिए कई प्रतिगमन मामले क्यों किए ... सरल-प्रतिगमन मामले को करने के अतिरिक्त प्रयास पर जाने के लिए धन्यवाद।
Glen_b -Reinstate मोनिका

19

कुछ हद तक जवाब के लिए क्षमा करें, शायद अति-सार और सहज ज्ञान युक्त व्यय की वांछनीय राशि की कमी है, लेकिन मैं वापस आने और बाद में कुछ और विवरण जोड़ने की कोशिश करूंगा। कम से कम यह छोटा है।

H=X(XTX)1XT

Var(yy^)=Var((IH)y)=(IH)Var(y)(IH)T=σ2(IH)2=σ2(IH)

इसलिये

Var(yiy^i)=σ2(1hii)

सरल रेखीय प्रतिगमन के मामले में ... यह आपके प्रश्न का उत्तर देता है।

y^iyi

-

(IH)

H

H2=X(XTX)1XTX(XTX)1XT =X [(XTX)1XTX] (XTX)1XT=X(XTX)1XT=H

(IH)2=I2IHHI+H2=I2H+H=IH


1
(IH)2=(IH)

@ जेक ने अंत में कुछ पंक्तियाँ
जोड़ीं
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.