नमूना आकार बढ़ने पर टी-वितरण अधिक सामान्य क्यों हो जाता है?


19

विकिपीडिया के अनुसार, मैं समझता हूं कि जब सामान्य रूप से वितरित आबादी से आईआईडी अवलोकन होते हैं तो टी-वितरण टी-मूल्य का नमूना वितरण होता है। हालाँकि, मैं सहज रूप से यह नहीं समझ पा रहा हूँ कि टी-डिस्ट्रीब्यूशन का आकार चर्बी से बदलकर लगभग पूरी तरह से सामान्य क्यों हो जाता है।

मुझे लगता है कि यदि आप एक सामान्य वितरण से नमूना ले रहे हैं तो यदि आप एक बड़ा नमूना लेते हैं तो यह उस वितरण से मिलता जुलता है, लेकिन मुझे नहीं लगता कि यह वसा-पूंछ वाले आकार के साथ क्यों शुरू होता है।

जवाबों:


23

मैं एक सहज व्याख्या देने की कोशिश करूँगा।

टी-स्टेटिस्टिक * में एक अंश और एक भाजक होता है। उदाहरण के लिए, एक नमूना टी-टेस्ट में आँकड़ा है

x¯μ0s/n

* (कई हैं, लेकिन यह चर्चा सामान्य रूप से सामान्य होनी चाहिए कि आप जिनके बारे में पूछ रहे हैं उन्हें कवर करें)

मान्यताओं के तहत, अंश का मतलब 0 और कुछ अज्ञात मानक विचलन के साथ एक सामान्य वितरण है।

मान्यताओं के एक ही सेट के तहत, भाजक अंश के वितरण के मानक विचलन का अनुमान है (अंश पर सांख्यिकीय का मानक त्रुटि)। यह अंश से स्वतंत्र है। इसके वर्ग एक ची वर्ग यादृच्छिक चर स्वतंत्रता की अपनी डिग्री बार (जो भी t- बंटन की df है) से विभाजित है σnumerator

जब स्वतंत्रता की डिग्री छोटी होती है, तो भाजक काफी सही-तिरछा हो जाता है। यह अपने मतलब से कम होने का एक उच्च मौका है, और अपेक्षाकृत छोटा होने का एक अच्छा मौका है। इसी समय, इसके पास कुछ होने की भी संभावना है, यह अपने मतलब से बहुत बड़ा है।

सामान्यता की धारणा के तहत, अंश और भाजक स्वतंत्र होते हैं। इसलिए यदि हम इस टी-स्टेटिस्टिक के वितरण से अनियमित रूप से आकर्षित होते हैं, तो हमारे पास एक सामान्य यादृच्छिक संख्या है जिसे एक दूसरे यादृच्छिक रूप से * सही-तिरछा वितरण से चुना गया मूल्य है जो औसतन 1 के आसपास है।

* सामान्य शब्द के संबंध के बिना

क्योंकि यह हर पर है, भाजक के वितरण में छोटे मान बहुत बड़े टी-मान पैदा करते हैं। हर में दायाँ तिरछा t-आँकड़ा भारी-पूंछ बनाता है। वितरण की दाईं पूंछ, जब हर पर t- वितरण को समान मानक विचलन के साथ एक सामान्य से अधिक तेजी से नुकीला बनाता है

हालांकि, जैसे-जैसे स्वतंत्रता की डिग्री बड़ी होती जाती है, वितरण बहुत अधिक सामान्य दिखने लगता है और इसके अर्थ के आसपास बहुत अधिक "तंग" हो जाता है।

यहाँ छवि विवरण दर्ज करें

जैसे, अंश के वितरण के आकार पर भाजक द्वारा विभाजित करने का प्रभाव स्वतंत्रता की डिग्री के रूप में कम हो जाता है।

अंततः - जैसा कि स्लटस्की का प्रमेय हमें सुझाव दे सकता है - ऐसा हो सकता है कि हर के प्रभाव को स्थिरांक द्वारा विभाजित करने की तरह हो जाता है और टी-स्टेटिस्टिक का वितरण सामान्य के बहुत करीब है।


हर के पारस्परिक के संदर्भ में माना जाता है

व्ह्यूबर ने टिप्पणियों में सुझाव दिया कि यह भाजक के पारस्परिक रूप को देखने के लिए अधिक रोशन हो सकता है। यही है, हम अपने टी-आंकड़ों को अंश (सामान्य) समय पारस्परिक-भाजक (राइट-स्क्यू) के रूप में लिख सकते हैं।

उदाहरण के लिए, ऊपर एक-नमूना-टी आँकड़ा बन जाएगा:

n(x¯μ0)1/s

अब मूल की जनसंख्या के मानक विचलन पर विचार , σ एक्स । हम इसे गुणा और विभाजित कर सकते हैं, जैसे:Xiσx

n(x¯μ0)/σxσx/s

पहला शब्द मानक सामान्य है। दूसरा शब्द (स्केल्ड इनवर्ट-ची-स्क्वेर्ड रैंडम वैरिएबल का वर्गमूल) तो उस मानक को सामान्य मान से मापता है जो या तो 1 से बड़ा या छोटा होता है, "इसे फैलाना"।

सामान्यता की धारणा के तहत, उत्पाद में दो शब्द स्वतंत्र हैं। इसलिए यदि हम इस टी-स्टेटिस्टिक के वितरण से अनियमित रूप से आकर्षित होते हैं, तो हमारे पास एक सही-तिरछा वितरण से एक दूसरे यादृच्छिक रूप से चुने गए मूल्य (सामान्य अवधि के संबंध में) के बिना एक सामान्य यादृच्छिक संख्या (उत्पाद में पहला शब्द) होता है। आम तौर पर 'लगभग 1।

जब df बड़ा होता है, तो मान 1 के बहुत करीब हो जाता है, लेकिन जब df छोटा होता है, तो यह काफी तिरछा होता है और फैलता बड़ा होता है, इस स्केलिंग फैक्टर की बड़ी दाईं पूंछ से पूंछ काफी मोटी होती है:

यहाँ छवि विवरण दर्ज करें


धन्यवाद! इसने बहुत कुछ स्पष्ट किया है, लेकिन मैं अभी भी इसके बारे में थोड़ा अनिश्चित था कि "इसका वर्ग एक चि-वर्ग यादृच्छिक चर है जिसे इसकी स्वतंत्रता की डिग्री (जो कि t-वितरण का df भी है) के समय से विभाजित किया गया है [अंश का मानक विचलन] "। क्या आपने इसका उल्लेख केवल इसलिए किया क्योंकि यह मेरे लिए एक उपयोगी बात थी, या क्या यह मेरे प्रश्न के उत्तर की प्रत्यक्ष प्रासंगिकता है? मैं समझता हूं कि यह हर का वितरण है, जैसा कि हर के वर्ग के वितरण के विपरीत है, जो आपके चित्र में दर्शाया गया है।
user1205901 -

2
सांख्यिकीय का वितरण सामान्य से अधिक भारी होगा, भले ही यह विशेष रूप से इसके df पर ची-स्क्वायर का वर्गमूल न हो ; इस अर्थ में यह सीधे इसे बाहर छोड़ने के जवाब को बदल नहीं सकता है। लेकिन कम से कम यह एक स्पष्टीकरण के रूप में कार्य करता है कि आरेख में स्केल- ची वितरण कहाँ से आया है।
Glen_b -Reinstate Monica

3
मैं सोच रहा हूं कि नमूना मानक विचलन के पारस्परिक आधार पर इस विश्लेषण का संचालन करने के लिए यह थोड़ा अधिक रोशन हो सकता है । कि, एक तर्क के साथ युग्मित किया गया है कि नमूना एसडी नमूना माध्य से स्वतंत्र है (एक महत्वपूर्ण विचार जो थोड़ा अधिक जोर और स्पष्टीकरण, IMHO से लाभान्वित होगा), लोगों को नमूना एसडी के नमूने के माध्य के विभाजन को देखने में मदद करेगा। एक सामान्य वितरण होगा अन्यथा क्या फैलता है। (बेशक यह Gossett की खोज के पूरे मुद्दे था।)
whuber

1
@ जब मैंने इसे पारस्परिक के संदर्भ में चर्चा करते हुए एक खंड जोड़ा है, लेकिन मूल चर्चा को भी बनाए रखा है (यह मुझे अधिक प्रत्यक्ष लगता है, लेकिन मैं सराहना करता हूं कि पारस्परिक के संदर्भ में बहुत से लोग इससे बाहर निकल सकते हैं) । मैं स्वतंत्रता के साथ
Glen_b -Reate Monica

1
टी-स्टेटिस्टिक ( एस / omin) में भाजक का मान ) के लिए औसत पास पर हैσ/s/n । बात लगभग 1 (कम से कम बड़े नमूनों में) है कि हैरों/σ- जो हम पहले साजिश में देखते हैं - और तदनुसारσ/एस(दूसरी साजिश में)। उम्मीद है कि यह स्पष्ट है कि क्यों उन चीजों को 1 के करीब है जब नमूना के बड़ेσका उचित अनुमान देने के लिए पर्याप्त है। σ/ns/σσ/sσ
Glen_b -Reinstate मोनिका

8

@ गेन_ब ने आपको इस बात का अंतर्ज्ञान दिया कि नमूना आकार बढ़ने के साथ टी स्टेटिस्टिक अधिक सामान्य क्यों दिखता है। अब, मैं आपको मामले के लिए थोड़ा और तकनीकी स्पष्टीकरण दूंगा जब आपको पहले से ही सांख्यिकी का वितरण मिल गया था।

n1n

(1+x2n1)n/2n1B(n12,12).

यह दिखाना संभव है

1n1B(n12,12)12π,

तथा

(1+x2n1)n/2exp(x2/2),

n


2
1/n(1+(x/n)2)1tnस्वतंत्रता का दर्जा? यह जानना चाहता है कि अनुक्रम "वसा-पूंछ वाले आकार के साथ शुरू होता है जो यह करता है।"
whuber

2
nn

2

मैं बस कुछ साझा करना चाहता था जिसने एक शुरुआत के रूप में मेरे अंतर्ज्ञान में मदद की (हालांकि यह अन्य उत्तरों की तुलना में कम कठोर है)।

Z,Z1,...,Zn

ZZ12+...+Zn2n

n

n1Zn

E[Z2]=1n आईआईडी जेडमैं2RVs। नमूने का मतलब हैn हो जाता है सुपर बड़ा सिर्फ एक की अपेक्षित मूल्य के बराबर होगा जेडमैं2जो एक है।

ताकि n वास्तव में बड़ा हो जाता है आप बस के साथ छोड़ दिया है जेड1=जेड

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.