नमूना बड़ा होने पर माध्य का अनुमान लगाने के लिए टी-वितरण का उपयोग क्यों नहीं किया जाता है?


17

बेसिक स्टैटिस्टिक्स कोर्स अक्सर एक सामान्य डिस्ट्रीब्यूशन का उपयोग करके जनसंख्या पैरामीटर के माध्य का अनुमान लगाने के लिए सुझाव देते हैं जब नमूना आकार n बड़ा होता है (आमतौर पर 30 या 50 से अधिक)। छात्र के टी-वितरण का उपयोग नमूना के मानक विचलन में अनिश्चितता के लिए छोटे नमूना आकारों के लिए किया जाता है। जब नमूना आकार बड़ा होता है, तो नमूना मानक विचलन जनसंख्या मानक विचलन पर अच्छी जानकारी देता है, जिससे सामान्य-वितरण अनुमान लगाया जा सकता है। मै समझ गया।

लेकिन एक अनुमान का उपयोग क्यों करें जब आप अपना आत्मविश्वास अंतराल प्राप्त कर सकते हैं? नमूना आकार के बावजूद, सामान्य वितरण का उपयोग करने का क्या मतलब है अगर यह सिर्फ कुछ का अनुमान है जो आप टी-वितरण के साथ प्राप्त कर सकते हैं?


@Glen_b हां, जो अंतराल के अनुमानक होंगे। इन अंतरालों के बारे में: "जनसंख्या मानक विचलन (and) ज्ञात नहीं होने पर काम की समस्या होने पर आपको टी-वितरण तालिका का उपयोग करना चाहिए और नमूना का आकार छोटा है (n <30)" (web.pdx.edu/~stbakb/ से) डाउनलोड / PA551 / NormalVersusTdistribution.doc)। जब लोग मानक मानक विचलन (n> 30) होने पर भी ज्ञात नहीं होते हैं, तो हर समय टी-वितरण का उपयोग क्यों नहीं करते हैं?
पैर्टिनैक्स

जवाबों:


15

शीर्षक के संबंध में स्पष्ट करने के लिए, हम माध्य का अनुमान लगाने के लिए टी-वितरण का उपयोग नहीं कर रहे हैं (कम से कम एक बिंदु अनुमान के अर्थ में), लेकिन इसके लिए एक अंतराल का निर्माण करने के लिए।

लेकिन एक अनुमान का उपयोग क्यों करें जब आप अपना आत्मविश्वास अंतराल प्राप्त कर सकते हैं?

यह एक अच्छा सवाल है (जब तक कि हम 'वास्तव में' पर बहुत अधिक जोर नहीं देते हैं, क्योंकि इसके लिए मान्यताओं को वास्तव में टी-वितरित होना वास्तव में पकड़ नहीं होगा)।

"जब जनसंख्या मानक विचलन (not) ज्ञात नहीं है और नमूना आकार छोटा है (तो <30)

जब लोग मानक मानक विचलन (n> 30) होने पर भी ज्ञात नहीं होते हैं, तो हर समय टी-वितरण का उपयोग क्यों नहीं करते हैं?

मैं सलाह के रूप में सबसे अच्छा - संभावित भ्रामक मानता हूँ। कुछ स्थितियों में, टी-डिस्ट्रीब्यूशन का उपयोग तब भी किया जाना चाहिए जब स्वतंत्रता की डिग्री एक बड़ा सौदा होती है।

जहां सामान्य है एक उचित अनुमान विभिन्न चीजों पर निर्भर करता है (और इसलिए स्थिति पर निर्भर करता है)। हालाँकि, चूंकि (कंप्यूटर के साथ) यह केवल t उपयोग करना मुश्किल नहीं है , भले ही डीएफ बहुत बड़ा हो, आपको आश्चर्य होगा कि एन = 30 पर कुछ अलग करने के बारे में चिंता करने की आवश्यकता क्यों है।

यदि नमूना आकार वास्तव में बड़ा है, तो यह एक आत्मविश्वास अंतराल के लिए ध्यान देने योग्य अंतर नहीं करेगा, लेकिन मुझे नहीं लगता कि n = 30 हमेशा 'वास्तव में बड़े' के लिए पर्याप्त रूप से करीब है।


एक परिस्थिति है जिसमें यह t बजाय सामान्य का उपयोग करने के लिए समझ में आ सकता है - जब आपका डेटा स्पष्ट रूप से टी-वितरण प्राप्त करने के लिए शर्तों को पूरा नहीं करता है, लेकिन आप अभी भी मतलब की अनुमानित सामान्यता के लिए बहस कर सकते हैं (यदि n काफी बड़ी है)। हालांकि, उन परिस्थितियों में, अक्सर टी अभ्यास में एक अच्छा सन्निकटन है, और कुछ हद तक 'सुरक्षित' हो सकता है। [ऐसी स्थिति में, मैं सिमुलेशन के माध्यम से जांच करने के लिए इच्छुक हो सकता हूं।]


2
मैंने इस दस्तावेज़ में कहीं पढ़ा है कि α = 5 % होने पर अच्छा है । लेकिन मुझे यकीन नहीं है कि यह पर्याप्त है। n=30α=5%
स्टीफन लॉरेंट

1
@ StéphaneLaurent अधिकांश प्रयोजनों के लिए यह 5% पर ठीक होना चाहिए, लेकिन इस तरह के निर्णय व्यक्ति के लिए बहुत अधिक हैं। ऐसी परिस्थितियां हैं - मैंने आज केवल एक का सामना किया है - जहां उस स्तर की त्रुटि काफी मायने रख सकती है।
Glen_b -Reinstate मोनिका

2
@ StéphaneLaurent आपको जॉनसन, VE (2013) से कुछ अच्छी जानकारी मिल सकती है। सांख्यिकीय साक्ष्य के लिए संशोधित मानकनेशनल एकेडमी ऑफ साइंसेज की कार्यवाही , 110 (48): 19313-19317। यह लेख पोस्ट में फिट बैठता है- क्यों सबसे प्रकाशित शोध निष्कर्ष अनुसंधान की झूठी आलोचना करते हैं ( एक ला हाउ साइंस गोज गलत है )
एलेक्सिस

4
@ StéphaneLaurent आपका लेख मेरे प्रश्न का उत्तर देता है। रिकॉर्ड के लिए, यह निष्कर्ष का एक मोटा अनुवाद है: "छात्र के वितरण में सन्निकटन के रूप में सामान्य वितरण का उपयोग विशेष रूप से 20 वीं सदी की तकनीकी सीमाओं का उत्पाद है। ये सीमाएं आधुनिक सांख्यिकीय सॉफ्टवेयर के साथ गायब हो गई हैं, और अब नहीं है। इन गैर-रूढ़िवादी सन्निकटन का उपयोग करने का कोई कारण "।
पेर्टिनैक्स

2
@ TheThunderChimp कैविट: यदि जनसंख्या भिन्नता ज्ञात है (जैसे जनसंख्या अनुपात का आकलन - एक द्विस्वभाव चर का मतलब), तो मानक सामान्य ( z ), और नहीं t वितरण उपयुक्त है।
एलेक्सिस

7

यह एक ऐतिहासिक अभिरुचि है। आंकड़ों में उनमें से कई हैं।

यदि आपके पास कंप्यूटर नहीं है, तो टी-वितरण का उपयोग करना कठिन था, और सामान्य वितरण का उपयोग करना बहुत आसान था। एक बार जब नमूना आकार बड़ा हो जाता है, तो वे दो वितरण समान हो जाते हैं (कितना बड़ा 'बड़ा' एक और सवाल है)।


1
यह एक गहन प्रश्न के लिए बहुत उथला उत्तर लगता है।
एलेक्सिस

2
पक्का नहीं आपका क्या मतलब है। आपको नहीं लगता कि इसका कारण क्या है? (सबसे उत्कीर्ण उत्तर एक ही बिंदु बनाता है - हालाँकि अधिक स्पष्ट और विस्तृत रूप से।)
जेरेमी मील्स

1
मैं नीचा दिखाती हूं क्योंकि आपका जवाब मुझे पसंद है: क्योंकि इतिहास। अपने प्रश्न का संक्षिप्त पुनरावृत्ति।
एलेक्सिस

2
मुझे यह बताने के लिए धन्यवाद - यह एक अनाम पतन की तुलना में अच्छा है कि मुझे इसका कारण नहीं पता था।
जेरेमी माइल्स

3
ऐतिहासिक रूप से, एक ने इन वितरणों को तालिकाओं में मूल्यों को देखकर "उपयोग" किया। एकमात्र तरीका जिसमें सामान्य वितरण का उपयोग करना आसान होता, यह होता कि किसी को स्वतंत्रता की डिग्री के अनुरूप कॉलम नहीं चुनना पड़ता। यह एक चिंता का विषय है। क्या किया था किताबें बहुत बड़ी बन गयी: सीमा उपयोग किया गया है कि कुछ बिंदु पर यह थोड़ा समझ में स्वतंत्रता की बड़ी डिग्री तालिकाओं को विस्तृत करने में आता है।
whuber

1

ex2n


1
टी आकार का उपयोग करने से होने वाले लाभ का अनुमान लगाने में संख्यात्मक त्रुटियों को किस आकार पर करते हैं ?
जोना

2
निश्चित रूप से आप टी-मूल्यों की मनमानी से गणना कर सकते हैं, और इसलिए वे उतनी ही सटीक हो सकती हैं जितनी मात्रा में आप उनकी तुलना कर रहे हैं।
नील जी

"दूसरे शब्दों में," सटीक "टी-मूल्य" सटीक "नहीं है, और सन्निकटन त्रुटि के भीतर, मान मानक सामान्य के लिए सीडीएफ मूल्य के समान है।" मुझे यकीन नहीं है कि यह अंगूठे का एक विश्वसनीय नियम है।
छायाकार

2
25.9325×1016

1
Whuber, तुम सही हो। मैंने अनुचित रूप से "संख्यात्मक त्रुटि" का उपयोग किया। मेरा मतलब था सभी संख्याओं को संभालने वाली त्रुटियां: इंटीग्रल का संख्यात्मक अनुमान, परिमित परिशुद्धता के साथ काम करने के लिए संख्यात्मक त्रुटियां और ट्रंकेशन के कारण संख्यात्मक त्रुटियां। यदि कोई असीम सटीकता के साथ काम कर सकता है, तो टी-वितरण को सामान्य के साथ बदलने का कोई औचित्य नहीं होगा
VictorZurkowski
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.