क्या टी-टेस्ट के लिए वैध होने के लिए न्यूनतम नमूना आकार आवश्यक है?


70

मैं वर्तमान में एक अर्ध-प्रायोगिक शोध पत्र पर काम कर रहा हूं। मेरे पास चुने हुए क्षेत्र के भीतर कम आबादी के कारण केवल 15 का एक नमूना आकार है और वह केवल 15 मेरे मानदंडों को पूरा करता है। टी-टेस्ट और एफ-टेस्ट के लिए गणना करने के लिए 15 न्यूनतम नमूना आकार है? यदि हां, तो मुझे इस छोटे नमूने के आकार का समर्थन करने के लिए एक लेख या पुस्तक कहां मिल सकती है?

इस पेपर का पिछले सोमवार को पहले से ही बचाव किया गया था और पैनल में से एक को एक सहायक संदर्भ देने के लिए कहा गया था क्योंकि मेरा नमूना आकार बहुत कम है। उन्होंने कहा कि यह कम से कम 40 उत्तरदाताओं होना चाहिए था।


4
यदि अनुमानों की मानें तो एक नमूना आकार 15 से काफी छोटा हो सकता है। क्या टी-डिस्ट्रीब्यूशन की वैधता केवल एक बड़ा नमूना होने का कारण थी?
ग्लेन_ बी

बस स्पष्ट करने के लिए, आप किस तरह का टी-टेस्ट कर रहे हैं: एक नमूना, युग्मित नमूना या दो नमूना।
जेरोमे एंग्लीम

26
ऐतिहासिक रूप से, टी-टेस्ट ("स्टूडेंट" 1908 पेपर में) का बहुत पहला प्रदर्शन आकार चार के आकार के नमूने के लिए किया गया था । वास्तव में, छोटे नमूनों के लिए बेहतर परिणाम प्राप्त करना, प्रसिद्धि के लिए परीक्षण का दावा है: एक बार जब नमूना का आकार 40 या इतने पर पहुंच जाता है, तो टी-परीक्षण उन भिन्न-भिन्न परीक्षणों से अलग नहीं होता है जो शोधकर्ताओं ने 19 वीं शताब्दी में लागू किए थे। आप इस पत्र का एक आधुनिक संस्करण पैनल के सदस्य के साथ साझा कर सकते हैं: york.ac.uk/depts/maths/histstat/student.pdf । खंड VI, पीपी 14-18 में जांच को इंगित करें।
whuber

10
लेकिन आपको इस तथ्य पर विचार करना चाहिए कि छोटे नमूना आकार जैसे 4 काम करता है क्योंकि छात्र के पास उच्च गुणवत्ता वाले डेटा थे: रासायनिक प्रयोगशाला डेटा, प्रयोग, अर्ध-प्रयोग नहीं। आपकी मुख्य समस्या नमूना आकार के साथ नहीं बल्कि प्रतिनिधित्वशीलता के साथ है: आप कैसे जानते हैं कि आपका डेटा किसी भी चीज़ का प्रतिनिधि है?
kjetil b halvorsen

10
@CzarinaFrancoise हम खुद को विज्ञान <10 साल क्यों सीमित करेंगे?
RioRaider

जवाबों:


56

टी टेस्ट मान्य होने के लिए कोई न्यूनतम नमूना आकार नहीं है। वैधता के लिए आवश्यक है कि टेस्ट स्टेटिस्टिक होल्डिंग्स के लिए मान्यताएँ लगभग हों। उन मान्यताओं में एक नमूना मामले में है कि अशक्त परिकल्पना के तहत माध्य 0 के साथ डेटा सामान्य (या लगभग सामान्य) हैं और एक विचरण जो अज्ञात है लेकिन नमूना से अनुमानित है। दो नमूने के मामले में यह है कि दोनों नमूने एक-दूसरे से स्वतंत्र हैं और प्रत्येक नमूने में दो सामान्य नमूने होते हैं जिनमें एक ही माध्य होता है और अशक्त परिकल्पना के तहत एक सामान्य अज्ञात विचरण होता है। वैरिएंट के लिए एक अनुमानित अनुमान का उपयोग किया जाता है।

एक नमूना मामले में अशक्त परिकल्पना के तहत वितरण , स्वतंत्रता के n-1 डिग्री के साथ एक केंद्रीय टी है । नमूना आकार के साथ दो नमूना मामलों में n और हूँ जरूरी बराबर नहीं परीक्षण आँकड़ों के अशक्त वितरण है टी के साथ n + m -2 स्वतंत्रता की डिग्री। कम नमूना आकार के कारण बढ़ी हुई परिवर्तनशीलता का वितरण उस खाते में किया जाता है जिसमें भारी पूंछ होती है जब स्वतंत्रता की डिग्री कम होती है जो कम नमूना आकार से मेल खाती है। इसलिए परीक्षण मान के लिए महत्वपूर्ण मान किसी भी नमूने के आकार (अच्छी तरह से, कम से कम 2 या बड़े आकार) के लिए दिए गए महत्व स्तर का हो सकता है।

कम नमूना आकार के साथ समस्या परीक्षण की शक्ति के संबंध में है। समीक्षक ने महसूस किया हो सकता है कि 15 प्रति समूह एक बड़े नमूने का आकार नहीं था, जिसमें एक सार्थक अंतर का पता लगाने की उच्च शक्ति हो, दोनों साधनों के बीच डेल्टा या एक नमूना समस्या के लिए निरपेक्ष मूल्य में डेल्टा से अधिक का मतलब हो। 40 की आवश्यकता को एक विशेष डेल्टा पर एक निश्चित शक्ति के विनिर्देश की आवश्यकता होगी जो कि n बराबर 40 के साथ प्राप्त की जाएगी, लेकिन 40 से कम नहीं।

मुझे यह जोड़ना चाहिए कि टी परीक्षण के लिए नमूना आपको विचरण या भिन्नता का अनुमान लगाने के लिए पर्याप्त होना चाहिए।


2
लेकिन एक महत्वपूर्ण टिप्पणी है कि परीक्षण है है मान्य है, भले ही डेटा लगभग सामान्य, अगर नमूने का आकार काफी बड़ा है नहीं है। औचित्य थोड़ा गोल है (स्लटस्की के प्रमेय + टी वितरण सामान्य के करीब) और एक जेड-परीक्षण पर उपयोग के औचित्य केवल यह है कि यह छोटे नमूनों में अधिक रूढ़िवादी है। लेकिन यह एक महत्वपूर्ण बात है कि यदि हम गैर-सामान्यता पर संदेह करते हैं, तो बड़े नमूने हमें बचा सकते हैं!
एबी एबी

1
@CliffAB "मान्य" से मेरा मतलब है कि आपके पास लगभग सही महत्व स्तर है, सीमा में n \ _ to \ infty "। लेकिन आम तौर पर लोग I त्रुटि दर से अधिक प्रकार के बारे में परवाह करते हैं (विशेषकर जब यह केवल नमूनों के करीब हो सकता है जो कि नमूना आकार जो भी हाथ में हो उससे बड़ा हो सकता है)। स्पर्शोन्मुख सापेक्ष दक्षता वास्तव में बहुत खराब हो सकती है, इसलिए बड़े नमूनों में छोटे प्रभावों के खिलाफ शक्ति वैकल्पिक विकल्पों की तुलना में बहुत खराब हो सकती है, यहां तक ​​कि जिस प्रकार मैं त्रुटि दर बनती है, वह होनी चाहिए ..
Glen_b

33

उसके लिए सभी सम्मान के साथ, वह नहीं जानता कि वह किस बारे में बात कर रहा है। टी-टेस्ट को छोटे नमूनों के साथ काम करने के लिए डिज़ाइन किया गया था। वास्तव में एक न्यूनतम नहीं है (शायद आप एक नमूना टी-टेस्ट, आईडीके के लिए न्यूनतम 3 कह सकते हैं), लेकिन आपको छोटे नमूनों के साथ पर्याप्त शक्ति के बारे में चिंता है । जब आपके मामले में संभव नमूना आकार अत्यधिक प्रतिबंधित है, तो समझौता विश्लेषण के पीछे विचारों के बारे में पढ़ने में आपकी रुचि हो सकती है ।

एक संदर्भ के लिए जो साबित करता है कि आप छोटे नमूनों के साथ टी-टेस्ट का उपयोग कर सकते हैं, मुझे एक का पता नहीं है, और मुझे संदेह है कि एक मौजूद है। कोई क्यों साबित करने की कोशिश करेगा? विचार सिर्फ मूर्खतापूर्ण है।


6
+1 (आपको और माइकल को)। ब्याज की, तुम भी जरूरत नहीं है दो टिप्पणियों अगर मान्यताओं का एक सेट बनाने के लिए तैयार अनुमान बनाने के लिए!
एंडी डब्ल्यू

4
छोटे नमूने में टी परीक्षण का कारण यह है कि भले ही नमूने सामान्य हों यदि मानक विचलन अज्ञात है तो मानक विचलन का एक नमूना अनुमान द्वारा विभाजित करके सामान्य बात है। बड़े नमूनों में जो अनुमान लगाते हैं कि जनसंख्या मानक विचलन के काफी करीब होगा कि परीक्षण सांख्यिकीय लगभग मानक सामान्य होगा लेकिन छोटे नमूने में यह भारी पूंछ और फिर सामान्य होगा।
माइकल चेरिक

5
स्वतंत्रता के n-1 डिग्री के साथ टी वितरण किसी भी नमूने के आकार के लिए n सटीक परिकल्पना के तहत n वितरण है और छोटे नमूनों में इसे सामान्य के स्थान पर उपयोग करने की आवश्यकता होती है जो इसे अच्छी तरह से अनुमानित नहीं करता है। नमूना आकार के साथ असली मुद्दा दोनों के रूप में गोबर और मैंने कहा कि शक्ति है। यदि आप रेफरी के साथ बहस करना चाहते हैं कि 15 पर्याप्त है तो आपको यह पहचानने की आवश्यकता है कि सार्थक (डेल्टा मैंने उल्लेख किया है) कहे जाने के लिए कितने बड़े अंतर की आवश्यकता है और फिर उस डेल्टा के लिए आपको यह दिखाने की आवश्यकता है कि शक्ति पर्याप्त 0.80 या अधिक है ।
माइकल चेरिक

2
@CzarinaFrancoise के बारे में n> = 30, आँकड़े
स्टीफन लॉरेंट

2
@ गंग स्टूडेंट का मूल (1908!) पेपर साबित करता है कि आप छोटे नमूनों के साथ टी-टेस्ट का उपयोग कर सकते हैं। (इस बारे में अधिक जानकारी के लिए, मूल प्रश्न के लिए मेरे विस्तारित टिप्पणी को देखें।)
whuber

30

जैसा कि मौजूदा उत्तरों में उल्लेख किया गया है, एक छोटे नमूने के आकार के साथ मुख्य मुद्दा कम सांख्यिकीय शक्ति है। स्वीकार्य सांख्यिकीय शक्ति क्या है, इसके बारे में अंगूठे के विभिन्न नियम हैं। कुछ लोग कहते हैं कि 80% सांख्यिकीय शक्ति उचित है, लेकिन अंततः, अधिक बेहतर है। अधिक प्रतिभागियों की लागत और अधिक सांख्यिकीय शक्ति प्राप्त करने के लाभ के बीच आम तौर पर एक व्यापार-बंद भी होता है।

आप R में एक साधारण फ़ंक्शन का उपयोग करके परीक्षण में सांख्यिकीय शक्ति का आकलन कर सकते हैं power.t.test

α=.05

p.2 <-power.t.test(n=15, delta=.2, sd=1, sig.level=.05, type='one.sample')
p.5 <- power.t.test(n=15, delta=.5, sd=1, sig.level=.05, type='one.sample')
p.8 <-power.t.test(n=15, delta=.8, sd=1, sig.level=.05, type='one.sample')

round(rbind(p.2=p.2$power, p.5=p.5$power, p.8=p.8$power), 2)  

    [,1]
p.2 0.11
p.5 0.44
p.8 0.82

इस प्रकार, हम देख सकते हैं कि यदि जनसंख्या प्रभाव का आकार "छोटा" या "मध्यम" है, तो आपके पास कम सांख्यिकीय शक्ति होगी (अर्थात, क्रमशः 11% और 44%)। हालांकि, यदि प्रभाव का आकार आबादी में बड़ा है, तो आपके पास कुछ ऐसा होगा जो "उचित" शक्ति (यानी, 82%) के रूप में वर्णित करेगा।

क्विक-आर वेबसाइट आर का उपयोग करके बिजली विश्लेषण पर आगे की जानकारी प्रदान करती है ।


अच्छा जवाब! इसके अलावा G * पॉवर नामक सांख्यिकीय शक्ति की गणना के लिए एक अच्छा सॉफ्टवेयर है ।
एनरिक

7

यदि दो नमूने एक ही विचरण के साथ सामान्य वितरण से स्वतंत्र सरल यादृच्छिक नमूने हैं, तो दो-नमूना टी-परीक्षण मान्य है और प्रत्येक नमूने का आकार कम से कम दो है (ताकि जनसंख्या के विचरण का अनुमान लगाया जा सके।) शक्ति के विचार हैं। परीक्षण की वैधता के सवाल के लिए अप्रासंगिक। प्रभाव के आकार पर निर्भर करता है कि एक का पता लगाने के लिए, एक छोटा सा नमूना आकार प्रतिरूप हो सकता है, लेकिन एक छोटा सा नमूना आकार परीक्षण को अमान्य नहीं करता है। यह भी ध्यान दें कि किसी भी नमूना आकार के लिए, माध्य वितरण सामान्य होने पर माध्य का नमूना वितरण सामान्य है। बेशक, बड़े नमूना आकार हमेशा बेहतर होते हैं क्योंकि वे मापदंडों के अधिक सटीक अनुमान प्रदान करते हैं। केंद्रीय सीमा प्रमेय हमें बताता है कि नमूना साधन आम तौर पर व्यक्तिगत मूल्यों की तुलना में अधिक वितरित किए जाते हैं, लेकिन जैसा कि कैसेला और बेरो ने बताया है, यह किसी भी विशेष मामले के लिए सामान्यता के दृष्टिकोण की दर के बाद से सीमित उपयोगिता का है। अंगूठे के नियमों पर भरोसा करना नासमझी है। परिणाम देखें रैंड विलकॉक्स की किताबें।


5

हालांकि यह सच है कि टी-वितरण छोटे नमूने के आकार को ध्यान में रखता है, मुझे लगता है कि आपका रेफरी यह स्थापित करने की कठिनाई के बारे में सोच रहा था कि जनसंख्या सामान्य रूप से वितरित की जाती है, जब आपके पास एकमात्र जानकारी अपेक्षाकृत छोटा नमूना है? यह आकार 15 के नमूने के साथ एक बहुत बड़ा मुद्दा नहीं हो सकता है, क्योंकि उम्मीद है कि नमूना काफी बड़ा है, जिसे आम तौर पर वितरित होने वाले कुछ संकेत दिखाने के लिए पर्याप्त है? यदि यह सच है, तो उम्मीद है कि आबादी कहीं न कहीं सामान्य है और केंद्रीय सीमा प्रमेय के साथ संयुक्त है, जो आपको नमूना देने के लिए चाहिए, जिसका मतलब है कि अच्छी तरह से व्यवहार किया जाए।

लेकिन मैं छोटे नमूनों (जैसे आकार चार) के लिए टी-परीक्षणों का उपयोग करने की सिफारिशों के बारे में संदिग्ध हूं जब तक कि आबादी की सामान्यता को कुछ बाहरी जानकारी या यांत्रिक समझ से स्थापित नहीं किया जा सकता है? जनसंख्या वितरण के आकार के रूप में किसी भी सुराग के लिए आकार चार के नमूने में पर्याप्त जानकारी के पास निश्चित रूप से कहीं भी नहीं हो सकता है।


5

सौरो, जे।, और लेविस, जेआर (2016) के पीपी 254-256 से निम्नलिखित पर विचार करें। उपयोगकर्ता अनुभव की मात्रा: उपयोगकर्ता अनुसंधान, 2 एड के लिए व्यावहारिक सांख्यिकी। कैम्ब्रिज, MA: मॉर्गन-कॉफ़मैन (आप https://www.amazon.com/Quantifying-User-Experience-Second-Statistics/dp/0128023082/ ) पर देख सकते हैं ।


क्या आपको कम से कम 30 उपयोगकर्ताओं का परीक्षण करने की आवश्यकता है?

एक तरफ

संभवतः हममें से अधिकांश जिन्होंने एक परिचयात्मक सांख्यिकी वर्ग लिया है (या किसी ऐसे व्यक्ति को जानते हैं जिन्होंने इस तरह का वर्ग लिया है) ने अंगूठे के नियम को सुना है कि साधनों का अनुमान लगाने या तुलना करने के लिए, आपके नमूना का आकार कम से कम 30 होना चाहिए। केंद्रीय सीमा प्रमेय के अनुसार, जैसा कि नमूना आकार बढ़ता है, अंतर्निहित वितरण की सामान्यता की परवाह किए बिना, माध्य का वितरण अधिक से अधिक सामान्य हो जाता है। कुछ सिमुलेशन अध्ययनों से पता चला है कि विभिन्न प्रकार के वितरणों के लिए (लेकिन सभी नहीं - ब्रैडली, 1978 देखें), जब एन = 30 होता है, तो इसका वितरण सामान्य हो जाता है।

एक और विचार यह है कि टी-स्कोर के बजाय जेड-स्कोर का उपयोग करना थोड़ा सरल है क्योंकि जेड-स्कोर को स्वतंत्रता की डिग्री के उपयोग की आवश्यकता नहीं है। जैसा कि तालिका 9.1 और अंजीर। 9.2 में दिखाया गया है, जब तक आपके पास स्वतंत्रता की 30 डिग्री हो जाती है, तब तक t का मान z के मूल्य के बहुत करीब हो जाता है। नतीजतन, एक भावना हो सकती है कि आपको छोटे नमूनों से निपटने की ज़रूरत नहीं है, जिनके लिए छोटे-नमूना आंकड़ों (कोहेन, 1990) की आवश्यकता होती है। ...

दूसरी ओर

जब किसी नमूने की लागत महंगी होती है, जैसा कि आम तौर पर कई प्रकार के उपयोगकर्ता अनुसंधानों में होता है (उदाहरण के लिए, प्रयोज्य प्रयोज्य परीक्षण), तो आवश्यक नमूना आकार का सही अनुमान लगाना महत्वपूर्ण है, इस समझ के साथ कि यह एक अनुमान है। परिस्थितियों के दिए गए सेट के लिए 30 बिल्कुल सही नमूना है कि संभावना बहुत कम है। जैसा कि नमूना आकार आकलन पर हमारे अध्यायों में दिखाया गया है, एक अधिक उपयुक्त दृष्टिकोण सांख्यिकीय परीक्षण के महत्व स्तरों की गणना के लिए सूत्र लेना है और, n के लिए हल करने के लिए बीजगणित का उपयोग करके, उन्हें नमूना आकार अनुमान सूत्रों में परिवर्तित करें। फिर वे सूत्र आवश्यक नमूना आकार का अनुमान लगाने के लिए आपको दिए गए स्थिति के बारे में जानने या अनुमान लगाने के लिए विशिष्ट मार्गदर्शन प्रदान करते हैं।

यह विचार कि टी-डिस्ट्रीब्यूशन (z- डिस्ट्रीब्यूशन के विपरीत) के साथ भी आपको कम से कम 30 का सैंपल साइज होना चाहिए, जो डिस्ट्रीब्यूशन के विकास के इतिहास के साथ असंगत है। 1899 में, रसायन विज्ञान और गणित में डिग्री के साथ ऑक्सफोर्ड में न्यू कॉलेज के हाल ही में स्नातक विलियम एस गॉसेट गिनीज शराब की भठ्ठी में शामिल होने वाले पहले वैज्ञानिकों में से एक बन गए। “अपने दिन के दिग्गजों की तुलना में, उन्होंने बहुत कम प्रकाशित किया, लेकिन उनका योगदान महत्वपूर्ण है। ... पकने की प्रक्रिया की प्रकृति, तापमान और सामग्री में इसकी परिवर्तनशीलता के साथ, इसका मतलब है कि लंबे समय तक बड़े नमूने लेना संभव नहीं है "(काउल्स, 1989, पी। 108-109)।

इसका मतलब यह था कि गॉसेट अपने काम में जेड-स्कोर का उपयोग नहीं कर सकते थे - वे सिर्फ छोटे नमूनों के साथ अच्छी तरह से काम नहीं करते हैं। छोटे नमूनों के साथ सांख्यिकीय परीक्षणों के लिए जेड-वितरण की कमियों का विश्लेषण करने के बाद, उन्होंने गिनीज की नीतियों के कारण छद्म नाम "छात्र" के तहत प्रकाशित अपनी टी टेबल बनाने के लिए स्वतंत्रता की डिग्री के कार्य के रूप में आवश्यक समायोजन किया। कर्मचारियों द्वारा (साल्सबर्ग, 2001)। तालिकाओं के प्रकाशन के लिए काम में, गॉसेट ने मोंटे कार्लो सिमुलेशन (स्टिगलर, 1999) के शुरुआती संस्करण का प्रदर्शन किया। उसने अपराधियों पर उठाए गए भौतिक मापों के साथ लेबल किए गए 3000 कार्ड तैयार किए, उन्हें फेरबदल किया, फिर उन्हें 4 के आकार के 750 समूहों में निपटा दिया- एक नमूना आकार 30 से बहुत छोटा।

हमारी सिफारिश है

यह विवाद अध्याय 6 में शामिल "आठ पर्याप्त" बनाम "आठ पर्याप्त नहीं है" तर्क के समान है, लेकिन फॉर्मेटिव रिसर्च के बजाय सारांश पर लागू होता है। किसी भी शोध के लिए, परीक्षण करने के लिए उपयोगकर्ताओं की संख्या परीक्षण के उद्देश्य और आपके द्वारा एकत्रित किए जाने वाले डेटा के प्रकार पर निर्भर करती है। "जादुई संख्या" 30 में कुछ अनुभवजन्य तर्क है, लेकिन हमारी राय में, यह बहुत कमजोर है। जैसा कि आप इस पुस्तक में कई उदाहरणों से देख सकते हैं कि नमूना आकार 30 (कभी-कभी कम, कभी-कभी अधिक) के बराबर नहीं होते हैं, हम अंगूठे के इस नियम को बहुत अधिक संबंध में नहीं रखते हैं। जैसा कि सारांश अनुसंधान के लिए हमारे नमूना आकार अध्याय में वर्णित है, एक अध्ययन के लिए उपयुक्त नमूना आकार वितरण के प्रकार, डेटा की अपेक्षित परिवर्तनशीलता, आत्मविश्वास और शक्ति के वांछित स्तर, पर निर्भर करता है।

जैसा कि चित्र 9.2 में दिखाया गया है, बहुत छोटे नमूनों के साथ टी-वितरण का उपयोग करते समय (जैसे, 5 से कम स्वतंत्रता की डिग्री के साथ), टी के बहुत बड़े मान टाइप I त्रुटियों के नियंत्रण के संबंध में छोटे नमूना आकारों के लिए क्षतिपूर्ति करते हैं ( अंतर का दावा करना महत्वपूर्ण है जब यह वास्तव में नहीं है)। इन छोटे आकार के नमूने के साथ, आपका आत्मविश्वास अंतराल आपके द्वारा बड़े नमूनों के साथ प्राप्त किए गए से अधिक व्यापक होगा। लेकिन एक बार जब आप 5 डिग्री से अधिक स्वतंत्रता के साथ काम कर रहे होते हैं, तो z के मूल्य और t के मूल्य के बीच बहुत कम अंतर होता है। T से z के दृष्टिकोण के दृष्टिकोण से, स्वतंत्रता के 10 डिग्री से पिछले बहुत कम लाभ है।

जेड-वितरण की तुलना में टी-वितरण का उपयोग करना अधिक जटिल नहीं है (आपको स्वतंत्रता की डिग्री के लिए सही मूल्य का उपयोग करने के लिए सुनिश्चित होना चाहिए), और टी-वितरण के विकास का कारण था छोटे नमूनों के विश्लेषण को सक्षम करें। यह कम स्पष्ट तरीकों में से एक है जिसमें प्रयोज्य चिकित्सकों को बीयर ब्रूइंग के विज्ञान और अभ्यास से लाभ होता है। आंकड़ों के इतिहासकार व्यापक रूप से एक ऐतिहासिक घटना (बॉक्स, 1984; गायल्स, 1989; स्टिगलर, 1999) के रूप में छात्र के टी-टेस्ट के गॉसेट प्रकाशन को मानते हैं। रोनाल्ड ए। फिशर (आधुनिक आँकड़ों के पिता में से एक) को एक पत्र में टी तालिकाओं की एक प्रारंभिक प्रतिलिपि है, गॉसेट ने लिखा, "आप शायद एकमात्र ऐसे व्यक्ति हैं जो कभी भी उनका उपयोग करेंगे" (बॉक्स, 1978)। गॉसेट को बहुत सी चीजें सही लगीं, लेकिन वह निश्चित रूप से गलत हो गई।

प्रतिक्रिया दें संदर्भ

बॉक्स, GEP (1984)। सांख्यिकी के विकास में अभ्यास का महत्व। टेक्नोमेट्रिक्स, 26 (1), 1-8।

बॉक्स, जेएफ (1978)। फिशर, एक वैज्ञानिक का जीवन। न्यूयॉर्क, एनवाई: जॉन विली।

ब्रैडली, जेवी (1978)। मजबूती? गणितीय और सांख्यिकीय मनोविज्ञान के ब्रिटिश जर्नल, 31, 144-152।

कोहेन, जे। (1990)। चीजें जो मैंने (अब तक) सीखी हैं। अमेरिकन मनोवैज्ञानिक, 45 (12), 1304-1312।

काउल्स, एम। (1989)। मनोविज्ञान में सांख्यिकी: एक ऐतिहासिक परिप्रेक्ष्य। हिल्सडेल, एनजे: लॉरेंस एर्लबम।

सालसबर्ग, डी। (2001)। चाय का स्वाद चखने वाली महिला: बीसवीं शताब्दी में विज्ञान के आंकड़ों ने किस तरह क्रांति ला दी। न्यूयॉर्क, एनवाई: डब्ल्यूएच फ्रीमैन।

स्टिगलर, एसएम (1999)। मेज पर सांख्यिकी: सांख्यिकीय अवधारणाओं और विधियों का इतिहास। कैम्ब्रिज, एमए: हार्वर्ड यूनिवर्सिटी प्रेस।


3

Czarina एक बूटस्ट्रैप टी-परीक्षण द्वारा प्राप्त परिणामों के साथ अपने पैरामीट्रिक टी-परीक्षण के परिणामों की तुलना करने के लिए दिलचस्प लग सकता है। स्टैटा 13/1 के लिए निम्न कोड एक असमान परिवर्तन के साथ दो-नमूना टी-टेस्ट (पैरामीट्रिक टी-टेस्ट: पी-मूल्य = 0.1493; बूटस्ट्रैप टी-टेस्ट: पी-वैल्यू = 0.1543) के विषय में एक काल्पनिक उदाहरण की नकल करता है।

set obs 15
g A=2*runiform()
g B=2.5*runiform()
ttest A == B, unpaired unequal
scalar t =r(t)
sum A, meanonly
replace A=A-r(mean) + 1.110498 ///1.110498=combined mean of A and B
sum B, meanonly
replace B=B-r(mean) + 1.110498
bootstrap r(t), reps(10000) nodots///
saving(C:\Users\user\Desktop\Czarina.dta, every(1) double replace) : ///
ttest A == B, unpairedunequal
use "C:\Users\user\Desktop\Czarina.dta", clear
count if _bs_1<=-1.4857///-1.4857=t-value from parametric ttest
count if _bs_1>=1.4857
display (811+732)/10000///this chunk of code calculates a bootstrap p-value///
to be compared with the parametric ttest p-value

3

टी-टेस्ट के उपयोग को सही ठहराने के दो अलग-अलग तरीके हैं।

  • आपका डेटा सामान्य रूप से वितरित किया जाता है और आपके पास प्रति समूह कम से कम दो नमूने हैं
  • आपके पास प्रत्येक समूह में बड़े नमूना आकार हैं

यदि इनमें से कोई भी मामला पकड़ में आता है, तो टी-टेस्ट को एक वैध परीक्षा माना जाता है। इसलिए यदि आप यह अनुमान लगाने के लिए तैयार हैं कि आपका डेटा सामान्य रूप से वितरित किया गया है (जो कई शोधकर्ता जो छोटे नमूने एकत्र करते हैं), तो आपको चिंता करने की कोई बात नहीं है।

हालाँकि, कोई व्यक्ति आपत्ति कर सकता है कि आप अपने परिणाम प्राप्त करने के लिए इस धारणा पर भरोसा कर रहे हैं, खासकर यदि आपका डेटा तिरछा होना जाना जाता है। फिर वैध अनुमान के लिए आवश्यक नमूना आकार का प्रश्न बहुत ही उचित है।

नमूना आकार की कितनी बड़ी आवश्यकता होती है, दुर्भाग्य से इसके लिए कोई वास्तविक ठोस जवाब नहीं है; अधिक आपके डेटा को तिरछा कर दिया, सन्निकटन को उचित बनाने के लिए आवश्यक बड़ा नमूना आकार। 15-20 प्रति समूह को आमतौर पर उचित बड़ा माना जाता है, लेकिन अंगूठे के अधिकांश नियमों के अनुसार, काउंटर उदाहरण मौजूद हैं: उदाहरण के लिए, लॉटरी टिकट रिटर्न में (जहां 1, कहते हैं, 10,000,000 अवलोकन एक बाहरी परिणाम है), आपको सचमुच की आवश्यकता होगी इन परीक्षणों के पहले लगभग 100,000,000 अवलोकन उपयुक्त होंगे।


1

मैं बूस्टर्ड टी-टेस्ट की उपयोगिता के बारे में जानकारी देता हूं। मैं यह भी सलाह देता हूं, एक तुलना के रूप में, http://www.indiana.edu/~kruschke/BEST/BEST.pdf पर क्रूसके द्वारा पेश की गई बायेसियन पद्धति पर एक नज़र डालें । सामान्य तौर पर, "कितने विषय?" इसका उत्तर तब तक नहीं दिया जा सकता जब तक कि आपको इस बात का अंदाजा न हो कि समस्या के हल में एक महत्वपूर्ण प्रभाव का आकार क्या होगा। यही है, और उदाहरण के लिए, यदि परीक्षण एक नई दवा की प्रभावकारिता के बारे में एक काल्पनिक अध्ययन था, तो अमेरिकी खाद्य और औषधि प्रशासन के लिए पुराने की तुलना में नई दवा को सही ठहराने के लिए प्रभाव का आकार न्यूनतम आकार का हो सकता है।

इसमें बहुत अजीब बात है और कई अन्य चर्चाओं में यह बताने की थोक इच्छा है कि कुछ डेटा का सिर्फ कुछ सैद्धांतिक वितरण है, जैसे कि गौसियन। सबसे पहले, हमें पोज देने की जरूरत नहीं है, हम छोटे नमूनों के साथ भी जांच कर सकते हैं। दूसरा, किसी भी विशिष्ट सैद्धांतिक वितरण को क्यों प्रस्तुत करें? केवल डेटा को एक अनुभवजन्य वितरण के रूप में ही क्यों नहीं लिया जाता है?

यकीन है, छोटे नमूने के आकार के मामले में, यह मानते हुए कि कुछ वितरण से आए डेटा विश्लेषण के लिए अत्यधिक उपयोगी है। लेकिन, ब्रैडले एफ्रॉन को पैराफेयर करने के लिए, ऐसा करने के लिए आपने डेटा की एक अनंत राशि बनाई है। कभी-कभी यह ठीक हो सकता है यदि आपकी समस्या उचित है। कुछ समय यह नहीं है।


1

जहां तक ​​धारणा दो नमूना मामले के लिए जाते हैं; यह है कि दोनों नमूने एक-दूसरे से स्वतंत्र हैं और प्रत्येक नमूने में दो सामान्य नमूनों वाले iid सामान्य चर होते हैं और शून्य परिकल्पना के तहत एक समान अज्ञात विचरण होता है।

मानक त्रुटि के लिए Satterwaite अनुमोदन का उपयोग करते हुए वेल्च टी-टेस्ट भी है। यह एक 2 नमूना टी-परीक्षण है जो असमान रूपांतरों को मानता है।

वेल्च का टी-टेस्ट

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.