रैखिक प्रतिगमन: * क्यों * आप वर्गों के योगों का विभाजन कर सकते हैं?


9

यह पोस्ट एक रैखिक प्रतिगमन मॉडल, को संदर्भित करता है । मैंने हमेशा त्रुटि (SSE) के लिए वर्गों के योग में वर्गों (SSTO) के विभाजन को लिया है और विश्वास पर मॉडल (SSR) के लिए वर्गों का योग है, लेकिन एक बार जब मैंने इसके बारे में सोचना शुरू कर दिया, तो मुझे समझ नहीं आया यह क्यों काम करता है ...Yi=β0+β1xi

भाग मैं है समझते हैं:

yi : y का मनाया गया मान

y¯ : सभी का मतलब s हैyi

y^i : किसी दिए गए अवलोकन के x के लिए y का फिट / अनुमानित मूल्य

yiy^i : अवशिष्ट / त्रुटि (यदि चुकता किया गया है और सभी टिप्पणियों के लिए जोड़ा गया है तो यह SSE है)

y^iy¯ : कितना फिट किया गया मॉडल माध्य से भिन्न होता है (यदि चुकता किया गया है और सभी टिप्पणियों के लिए जोड़ा गया है तो यह SSR है)

yiy¯ : कितना मनाया गया मान माध्य से भिन्न होता है (यदि सभी टिप्पणियों के लिए जोड़ा गया और जोड़ा गया है, तो यह SSTO है)।

मैं समझ सकता हूं कि क्यों, एक ही अवलोकन के लिए, बिना किसी चीज़ के, । और मैं समझ सकता हूं कि, यदि आप सभी टिप्पणियों में चीजों को जोड़ना चाहते हैं, तो आपको उन्हें वर्ग में लाना होगा या उन्हें 0 में जोड़ना होगा।(yiy¯)=(y^iy¯)+(yiy^i)

जो हिस्सा मुझे समझ नहीं आ रहा है वह क्यों (उदा। एसएसटीओ = एसएसआर + एसएसई)। ऐसा लगता है कि अगर आपके पास ऐसी स्थिति है जहां , तो , । यहाँ ऐसा क्यों नहीं है?(yiy¯)2=(y^iy¯)2+(yiy^i)2A=B+CA2=B2+2BC+C2A2=B2+C2


5
आपने अपने अंतिम पैराग्राफ में समन छोड़ दिया। एसएसटी = एसएसआर + एसएसई पर एक राशि है , लेकिन आपकी समानता आपने तुरंत पहले लिखी थी, यह वास्तव में वहां हस्ताक्षर के बिना सच नहीं है। i
Glen_b -Reinstate मोनिका

1
अपने अंतिम पैराग्राफ में, आप चाहते हैं (यानी एसएसटीओ = एसएसआर + एसएसई) (जैसे एसएसटीओ = एसएसआर + एसएसई) नहीं। "उदा" अंग्रेजी में लैटिन वाक्यांश " एग्जम्प्लेट ग्राटिया ," या "उदाहरण के लिए" का संक्षिप्त नाम है । "अर्थात" " आईडी एस्ट " के लिए एक संक्षिप्त नाम है और इसे "यही है" के रूप में अंग्रेजी में पढ़ा जा सकता है।
मैथ्यू गुन

जवाबों:


9

ऐसा लगता है कि अगर आपके पास ऐसी स्थिति है जहां , तो , । यहाँ ऐसा क्यों नहीं है?A=B+CA2=B2+2BC+C2A2=B2+C2

वैचारिक रूप से, यह विचार है कि क्योंकि और ऑर्थोगोनल हैं (यानी लंबवत हैं)।BC=0BC


यहाँ रेखीय प्रतिगमन के संदर्भ में, अवशिष्ट पूर्वानुमान के लिए orthogonal हैं । रेखीय प्रतिगमन से पूर्वानुमान एक समान अर्थ में का ऑर्थोगोनल अपघटन बनाता है एक ऑर्थोगोनल अपघटन है।ϵi=yiy^iy^iy¯y(3,4)=(3,0)+(0,4)

रैखिक बीजगणित संस्करण:

करते हैं:

z=[y1y¯y2y¯yny¯]z^=[y^1y¯y^2y¯y^ny¯]ϵ=[y1y^1y2y^2yny^n]=zz^

रैखिक प्रतिगमन (एक निरंतर शामिल) दो वैक्टर के योग में को विघटित करता है : एक पूर्वानुमान और एक अवशिष्टzz^ϵ

z=z^+ϵ

Let डॉट उत्पाद को निरूपित करता है । (आम तौर पर, हो सकता है आंतरिक उत्पाद ।).,.X,Y E[XY]

z,z=z^+ϵ,z^+ϵ=z^,z^+2z^,ϵ+ϵ,ϵ=z^,z^+ϵ,ϵ

जहां अंतिम पंक्ति इस तथ्य से है कि (यानी कि और ओर्थोगोनल हैं)। आप को साबित कर सकते हैं और orthogonal हैं जो साधारण से कम वर्ग के प्रतिगमन का निर्माण कैसे करते हैं, इस आधार पर ।z^,ϵ=0z^ϵ=zz^z^ϵz^

z^ है रैखिक प्रक्षेपण की उपस्पेस द्वारा परिभाषित पर रैखिक अवधि regressors की , , आदि .... अवशिष्ट उस संपूर्ण उप-स्थान पर orthogonal है, इसलिए (जो कि , , आदि ...) की अवधि में निहित है ) ऑर्थोगोनल से ।zx1x2ϵz^x1x2ϵ


ध्यान दें कि जैसा कि मैंने परिभाषित किया है डॉट उत्पाद के रूप में , बस लिखने का एक और तरीका है (यानी SSTO = SSR + SSE).,.z,z=z^,z^+ϵ,ϵi(yiy¯)2=i(y^iy¯)2+i(yiy^i)2


8

पूरा बिंदु दिखा रहा है कि कुछ वैक्टर ऑर्थोगोनल हैं और फिर पाइथागोरस प्रमेय का उपयोग करते हैं।

आइए हम बहुभिन्नरूपी रैखिक प्रतिगमन । हम जानते हैं कि OLS आकलनकर्ता । अब अनुमान पर विचार करेंY=Xβ+ϵβ^=(XtX)1XtY

Y^=Xβ^=X(XtX)1XtY=HY (H मैट्रिक्स को "हैट" मैट्रिक्स भी कहा जाता है)

जहां , पर Y का एक ऑर्थोगोनल प्रोजेक्शन मैट्रिक्स है । अब हमारे पास हैHS(X)

YY^=YHY=(IH)Y

जहाँ ऑर्थोगोनल पूरक पर एक प्रक्षेपण मैट्रिक्स है जो । इस प्रकार हम जानते हैं कि और orthogonal हैं।(IH)S(X)S(X)YY^Y^

अब एकY=X0β0+ϵ

जहाँ और इसी तरह हम OLS आकलनकर्ता और अनुमान है और प्रक्षेपण मैट्रिक्स के साथ पर । इसी तरह हमारे पास है कि और orthogonal हैं। और अबX=[X0|X1]β0^Y0^H0S(X0)YY0^Y0^

Y^Y0^=HYH0Y=HYH0HY=(IH0)HY

जहां फिर से पूरक पर एक ऑर्थोगोनल प्रोजेक्शन मैट्रिक्स है जो । इस प्रकार हमारे पास orthogonality of और । तो अंत में हमारे पास है(IH0)S(X0)S(X0)Y^Y0^Y0^

||YY^||2=||Y||2||Y^||2=||YY0^||2+||Y0^||2||Y^Y0^||2||Y0^||2

और अंत में||YY0^||2=||YY^||2+||Y^Y0^||2

अन्त में, मतलब बस है जब अशक्त मॉडल पर विचार ।Y¯Y0^Y=β0+e


आपके उत्तर के लिए धन्यवाद! आपकी पोस्ट में S () (S (X) के रूप में) क्या है?
१ouse

S(X) मैट्रिक्स के स्तंभों द्वारा निर्मित एक उपX
भूमि है
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.