RSS को chi square times np क्यों वितरित किया जाता है?


28

मैं यह समझना चाहूंगा कि क्यों, OLS मॉडल के तहत, RSS (वर्गों का अवशिष्ट योग) वितरित किया जाता है ( मॉडल में मापदंडों की संख्या होने के नाते, टिप्पणियों की संख्या)।

χ2(np)
pn

मैं इस तरह के एक बुनियादी सवाल पूछने के लिए माफी चाहता हूं, लेकिन मुझे लगता है कि इसका जवाब ऑनलाइन (या मेरे लिए, अधिक एप्लिकेशन उन्मुख, पाठ्यपुस्तकों) में नहीं मिल रहा है।


3
ध्यान दें कि उत्तर प्रदर्शित करना काफी सही नहीं है: RSS का वितरण is ( ) बार a वितरण जहां त्रुटियों का सही रूपांतर है। σ2npχ2(np)σ2
whuber

जवाबों:


36

मैं निम्नलिखित रैखिक मॉडल पर विचार करता हूं: ।y=Xβ+ϵ

अवशिष्ट के सदिश द्वारा अनुमान लगाया जाता है

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ

जहाँ ।Q=IX(XX)1X

उस (चक्रीय क्रमचय के तहत ट्रेस अपरिवर्तनीय है निरीक्षण करें और वह । eigenvalues इसलिए और (नीचे कुछ विवरण) हैं। इसलिए, एक एकात्मक मैट्रिक्स मौजूद है जैसे कि ( यदि वे सामान्य हैं तो केवल एकतरफा मेट्रिसेस द्वारा मैट्रिक्स विकर्ण होते हैं। )Q = Q = Q 2 Q 0 1 Vtr(Q)=npQ=Q=Q2Q01V

VQV=Δ=diag(1,,1np times,0,,0p times)

अब, ।K=Vϵ^

चूंकि , हमारे पास और इसलिए । इस प्रकारϵ^N(0,σ2Q)KN(0,σ2Δ)Knp+1==Kn=0

K2σ2=K2σ2χnp2

साथ ।K=(K1,,Knp)

इसके अलावा, एक एकात्मक मैट्रिक्स है, हमारे पास भी हैV

ϵ^2=K2=K2

इस प्रकार

RSSσ2χnp2

अंत में, देखें कि इस परिणाम का अर्थ है कि

E(RSSnp)=σ2

चूंकि , कम से कम बहुपद की बहुपद बांटता । तो, के eigenvalues और बीच हैं । चूँकि उनकी गुणन द्वारा गुणा किए गए प्रतिजन योगों का योग भी है, इसलिए हमारे पास आवश्यक है कि गुणन साथ एक eigenvalue है और गुणन साथ शून्य एक eigenvalue है ।Q2Q=0Qz2zQ01tr(Q)=np1npp


1
(+1) अच्छा जवाब। एक एकात्मक, के बजाय, ओर्थोगोनल पर ध्यान सीमित कर सकते हैं के बाद से वास्तविक और सममित है। इसके अलावा, क्या है ? मैं इसे परिभाषित नहीं देखता हूं। तर्क को थोड़ा रिजेक्ट करने से, व्यक्ति सामान्य रूप से पतित होने के इस्तेमाल से भी बच सकता है, अगर ऐसा न हो तो इससे कुछ लोग परेशान होते हैं। VQSCR
कार्डिनल

2
@Cardinal। अच्छी बात। SCR ('Somme des Carrés Résiduels' फ्रेंच में) RSS होना चाहिए था।
ओकराम

विस्तृत उत्तर के लिए धन्यवाद Ocram! कुछ चरणों के लिए मुझे और अधिक देखने की आवश्यकता होगी, लेकिन मेरे पास अब सोचने के लिए एक रूपरेखा है - धन्यवाद!
ताल गलिली

@ गलेन_ बी: ओह, मैंने एससीआर को एसआरआर में बदलने के लिए कुछ दिनों पहले एक एडिट किया था। मुझे याद नहीं आया कि मेरी टिप्पणी में एससीआर का उल्लेख है। गलतफहमी के लिए खेद है।
ओकराम

@ गलेन_ बी: इसका मतलब आरएसएस से था: -एस एडिटेड। Thx
ओकराम

9

IMHO, मैट्रिकियल नोटेशन चीजों को जटिल करता है। शुद्ध वेक्टर अंतरिक्ष भाषा क्लीनर है। मॉडल को लिखा जा सकता है जहां का मानक सामान्य डिस्ट्रीब्यूशन on और को माना जाता है कि यह एक वेक्टर उप-वर्ग उप- ।Y=Xβ+ϵY=μ+σGGRnμWRn

अब प्राथमिक ज्यामिति की भाषा चलन में आ गई है। कम से कम वर्गों आकलनकर्ता की के अलावा कुछ नहीं है : नमूदार के orthogonal प्रक्षेपण स्थान पर जो करने के लिए माना जाता है संबंध रखते हैं। अवशिष्टों का सदिश : ऑर्थोगोनल पूरक of में प्रक्षेपण । का आयाम ।μ^μPWYYWμPWYWWRnWdim(W)=ndim(W)

अंत में, और का पर मानक सामान्य वितरण है , इसलिए इसके चुकता मानदंड हैं। के साथ वितरण स्वतंत्रता की डिग्री।

PWY=PW(μ+σG)=0+σPWG,
PWGWχ2dim(W)

यह प्रदर्शन केवल एक प्रमेय का उपयोग करता है, वास्तव में एक परिभाषा-प्रमेय:

परिभाषा और प्रमेय में एक यादृच्छिक वेक्टर एक वेक्टर अंतरिक्ष पर मानक सामान्य वितरण है अगर यह में इसके मान लेता है और इसके निर्देशांक एक ( सभी में) में आधारभूत है के स्वतंत्र एक आयामी मानक सामान्य वितरण कर रहे हैंRnURnUU

(इस परिभाषा-प्रमेय से, कोचरन की प्रमेय इतनी स्पष्ट है कि यह इसके लायक नहीं है)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.