एक लीनियर रिग्रेशन गुणांक की परिकल्पना के परीक्षण के लिए एक टी वितरण का उपयोग क्यों किया जाता है?


17

व्यवहार में, एक रेखीय प्रतिगमन गुणांक के महत्व की जांच करने के लिए एक मानक टी-परीक्षण का उपयोग करना आम बात है। गणना के यांत्रिकी मुझे समझ में आते हैं।

ऐसा क्यों है कि टी-वितरण का उपयोग रैखिक प्रतिगमन परिकल्पना परीक्षण में उपयोग किए जाने वाले मानक परीक्षण सांख्यिकीय को मॉडल करने के लिए किया जा सकता है? मानक परीक्षण आँकड़ा मैं यहां बता रहा हूँ:

T0=β^β0SE(β^)

इस प्रश्न का एक पूर्ण और पूर्ण उत्तर काफी लंबा होगा, मुझे यकीन है। इसलिए जब आप किसी से निपटने के लिए प्रतीक्षा करते हैं, तो आप एक अच्छा विचार प्राप्त कर सकते हैं कि ऐसा क्यों है जो मुझे यहां ऑनलाइन मिले कुछ नोटों को देखकर है: onlinecourses.science.psu.edu/stat501/node/297 । ध्यान दें कि t(np)2=F(1,np)
स्टेट्सटूडेंट

1
मुझे विश्वास नहीं हो रहा है कि यह एक डुप्लिकेट नहीं है, और फिर भी सभी उत्थान (सवाल और जवाब दोनों पर) ... इस बारे में क्या ? या शायद यह कोई डुप्लिकेट नहीं है, जिसका अर्थ है कि (या आज तक था) सुपर-बेसिक विषय अभी भी हैं जो क्रॉस वैलिडेट के अस्तित्व के लगभग सात वर्षों में कवर नहीं किए गए हैं ... वाह ...
रिचर्ड हार्डी

@ रिचर्डहार्डी हम्म, जो एक डुप्लिकेट की तरह लगता है। हालांकि यह अधिक वर्बोज़ है, सवाल विशेष रूप से है: "मैं कैसे के लिए है कि साबित कर सकते हैं β मैं , β मैं - β मैंβ^i"β^iβisβ^itnk
Firebug

जवाबों:


26

यह समझने के लिए कारण है कि हम टी वितरण का उपयोग करें, आप को पता है की अंतर्निहित वितरण है क्या जरूरत है β और वर्गों की बची हुई राशि (के आर एस एस ) इन दो डाल एक साथ आप t- बंटन दे देंगे के रूप में।β^RSS

आसान हिस्सा का वितरण है β जो एक सामान्य वितरण है - इस नोट को देखने के लिए कि β = ( एक्स टी एक्स ) - 1 एक्स टी वाई तो यह रैखिक कार्य है Y जहां Y ~ एन ( एक्स β , σ 2 मैं एन ) । नतीजतन यह भी सामान्य रूप से वितरित किया जाता है, β ~ एन ( β , σ 2 ( एक्स टी एक्स ) -β^β^(XTX)1XTYYYN(Xβ,σ2In)- आप का वितरण पाने मदद की जरूरत है मुझे पता है ββ^N(β,σ2(XTX)1)β^

साथ ही, , जहां n टिप्पणियों और की संख्या है पी अपने प्रतिगमन में इस्तेमाल किया मानकों की संख्या है। इसका प्रमाण थोड़ा और अधिक शामिल है, लेकिन यह भी स्पष्ट रूप से प्राप्त करने के लिए सरल है (यहाँ प्रमाण देखें कि RSS को chi टाइम्स np क्यों वितरित किया गया है? )।RSSσ2χnp2np

इस क्षण तक मैं मैट्रिक्स / वेक्टर संकेतन में सब कुछ पर विचार किया है, लेकिन सादगी उपयोग के लिए की जाने β मैं और उसके सामान्य वितरण का उपयोग करें जो हमें दे देंगे: β मैं - β मैंβ^i

β^iβiσ(XTX)ii1N(0,1)

इसके अतिरिक्त, के ची-चुकता वितरण से हमारे पास वह है: ( एन - पी ) एस 2RSS

(np)s2σ2χnp2

यह पहली ची-स्क्वेर्ड अभिव्यक्ति का एक पुनर्व्यवस्था था और से स्वतंत्र है । इसके अतिरिक्त, हम s 2 = R S S को परिभाषित करते हैंN(0,1) , जिसके लिए एक निष्पक्ष आकलनकर्ता हैσ2। की परिभाषा के अनुसारटीएन-पीपरिभाषा यह है कि द्वारा एक स्वतंत्र ची-वर्ग (स्वतंत्रता की अपनी डिग्री से अधिक) आप एक टी वितरण (प्रमाण देख के लिए देता है एक सामान्य वितरण विभाजित:एक सामान्य से विभाजितs2=RSSnpσ2tnp आपको एक टी-वितरण - प्रमाण देता है जोχ2(s)/sआपको मिलता है:

β^मैं-βमैंरों(एक्सटीएक्स)मैंमैं-1~टीn-पी

कहाँ रों(एक्सटीएक्स)मैंमैं-1=एस(β^मैं)

मुझे पता है अगर यह समझ में आता है।


β^मैं-βमैंσ(एक्सटीएक्स)मैंमैं-1~एन(0,1)

4

उत्तर वास्तव में बहुत सरल है: आप टी-वितरण का उपयोग करते हैं क्योंकि यह विशेष रूप से इस उद्देश्य के लिए डिज़ाइन किया गया था।

ठीक है, यहाँ बारीकियों यह है कि यह विशेष रूप से रैखिक प्रतिगमन के लिए डिज़ाइन नहीं किया गया था। गॉसेट नमूना के वितरण के साथ आया था जो आबादी से खींचा गया था। उदाहरण के लिए, आप एक नमूना खींचते हैंएक्स1,एक्स2,...,एक्सn, और इसके माध्य की गणना करें एक्स¯=Σमैं=1nएक्समैं/n। नमूना माध्य का वितरण क्या हैएक्स¯?

यदि आप सही (जनसंख्या) मानक विचलन जानते थे σ, तो आप कहेंगे कि चर ξ=(एक्स¯-μ)n/σ मानक सामान्य वितरण से है एन(0,1)। मुसीबत जो आप आमतौर पर नहीं जानते हैंσ, और केवल इसका अनुमान लगा सकते हैं σ^। इसलिए, गोस्सेट ने वितरण का अनुमान लगाया जब आपने विकल्प दियाσ साथ में σ^ हर में, और वितरण को अब उनके स्तोत्र "स्टूडेंट टी" के बाद कहा जाता है।

रैखिक प्रतिगमन की तकनीकीता एक ऐसी स्थिति की ओर ले जाती है जहां हम मानक त्रुटि का अनुमान लगा सकते हैं σ^β गुणांक का अनुमान है β^, but we do not know the true σ, therefore Student t distribution is applied here too.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.