अनपेक्षित टी-परीक्षण के लिए न्यूनतम नमूना आकार


16

क्या टी-टेस्ट के लिए वैध होने के लिए आवश्यक न्यूनतम नमूना आकार निर्धारित करने के लिए "नियम" है?

उदाहरण के लिए, तुलना को 2 आबादी के साधनों के बीच किया जाना चाहिए। एक जनसंख्या से 7 डेटा पॉइंट हैं और दूसरे से केवल 2 डेटा पॉइंट हैं। दुर्भाग्य से, प्रयोग बहुत महंगा और समय लेने वाला है, और अधिक डेटा प्राप्त करना संभव नहीं है।

क्या एक टी-टेस्ट का उपयोग किया जा सकता है? क्यों या क्यों नहीं? कृपया विवरण प्रदान करें (जनसंख्या संस्करण और वितरण ज्ञात नहीं हैं)। यदि एक टी-टेस्ट का उपयोग नहीं किया जा सकता है, तो क्या एक गैर पैरामीट्रिक परीक्षण (मैन व्हिटनी) का उपयोग किया जा सकता है? क्यों या क्यों नहीं?


2
यह प्रश्न इस पृष्ठ के दर्शकों के लिए समान सामग्री और ब्याज को कवर करेगा: क्या टी-परीक्षण के लिए वैध होने के लिए न्यूनतम नमूना आकार आवश्यक है?
गंग -

इस प्रश्न को भी देखें जहां छोटे नमूने के आकार के साथ परीक्षण पर चर्चा की गई है।
Glen_b -Reinstate मोनिका

जवाबों:


8

मैं गैर-पैरामीट्रिक मान-व्हिटनी यू परीक्षण का उपयोग करने की सिफारिश यहां एक अप्रकाशित t -est के बजाय करना चाहूंगा ।

T -est के लिए कोई पूर्ण न्यूनतम नमूना आकार नहीं है , लेकिन जैसा कि नमूना आकार छोटा होता है, परीक्षण इस धारणा के प्रति अधिक संवेदनशील हो जाता है कि दोनों नमूने सामान्य वितरण के साथ आबादी से खींचे गए हैं। इस छोटे नमूने के साथ, विशेष रूप से केवल दो के एक नमूने के साथ, आपको यह सुनिश्चित करने की आवश्यकता होगी कि जनसंख्या वितरण सामान्य था - और यह बाहरी ज्ञान पर आधारित होना चाहिए, क्योंकि ऐसे छोटे नमूने अपने बारे में बहुत कम जानकारी देते हैं उनके वितरण की सामान्यता या अन्यथा। लेकिन आप कहते हैं कि "जनसंख्या संस्करण और वितरण ज्ञात नहीं हैं" (मेरे पुनरावृत्तियों)।

मान-व्हिटनी यू परीक्षण को वितरण के पैरामीट्रिक रूप के बारे में किसी भी धारणा की आवश्यकता नहीं है, केवल इस धारणा की आवश्यकता है कि दो समूहों के वितरण शून्य परिकल्पना के तहत समान हैं।


6
बहुत छोटे नमूना आकार के लिए एक अच्छी सिफारिश नहीं। 7 और 2 नमूनों के साथ, यू-परीक्षण विफल हो जाएगा, चाहे समूहों के बीच का अंतर कितना बड़ा हो। एक उदाहरण के लिए मेरे उत्तर को देखें।
एलेफसिन

2
मैं @AlefSin क्या कहता दूसरा होगा। यदि आपके लिए वैध निष्कर्ष निकालना महत्वपूर्ण है (और न केवल एक पी-मूल्य प्राप्त करें) तो उतनी ही अधिक गूढ़ धारणाएं आप बेहतर बना सकते हैं। यदि उचित पृष्ठभूमि की जानकारी है तो आप और भी धारणाएँ जोड़ सकते हैं यदि आपने अपने विश्लेषण को बायेसियन फ्रेमवर्क में किया है।
रासमस बैथ

2
एक समस्या यह है कि इस तरह के छोटे नमूने के आकार के साथ, विल्कोक्सन-मान-व्हिटनी विशिष्ट महत्व के स्तर को प्राप्त नहीं कर सकता है। 7 और 2 के सैंपल साइज़ के साथ आपको कभी भी 5% के स्तर पर परिणाम महत्वपूर्ण नहीं मिलेगा, चाहे कितना भी अंतर क्यों न हो। विचार करें (१.०१ (,१,०३१,१.०२०,१.०२०,१.०२१,१.०१०१,१.०२४) बनाम ()१३.२, .5१४.५) - ५% के स्तर पर महत्वपूर्ण नहीं!
Glen_b

3
उस ने कहा, अगर किसी के पास और n 2 = 2 है , तो एक बहुत अच्छा तर्क है कि किसी को शायद इस बात पर विचार करना चाहिए कि क्या 5% का परीक्षण पहली बार में समझ में आता है। दो त्रुटि प्रकारों की लागत का एक उचित मूल्यांकन काफी अलग विकल्प हो सकता है। n1=7n2=2
Glen_b -Reinstate Monica

6

(अस्वीकरण: मैं आज अच्छी तरह से टाइप नहीं कर सकता: मेरा दाहिना हाथ फ्रैक्चर हो गया है!)

अन्य उत्तरों में गैर-पैरामीट्रिक परीक्षण का उपयोग करने की सलाह के विपरीत, आपको यह विचार करना चाहिए कि बहुत छोटे नमूना आकारों के लिए वे विधियां बहुत उपयोगी नहीं हैं। यह समझना आसान है कि क्यों: अत्यंत छोटे आकार वाले अध्ययनों में, समूहों के बीच कोई अंतर तब तक स्थापित नहीं किया जा सकता जब तक कि बड़े प्रभाव आकार का अवलोकन न किया जाए। गैर-पैरामीट्रिक तरीके, हालांकि, समूहों के बीच अंतर की भयावहता की परवाह नहीं करते हैं। इस प्रकार भले ही दो समूहों के बीच का अंतर बहुत बड़ा हो, एक छोटे से नमूने के आकार के साथ एक गैर-पैरामीट्रिक परीक्षण हमेशा शून्य परिकल्पना को अस्वीकार करने में विफल होगा।

इस उदाहरण पर विचार करें: दो समूह, सामान्य वितरण, एक ही विचरण। समूह 1: औसत 1.0, 7 नमूने। समूह 2: औसत 5, 2 नमूने। औसत के बीच एक बड़ा अंतर है।

wilcox.test(rnorm(7, 1), rnorm(2, 5))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 5)
W = 0, p-value = 0.05556

गणना किया गया पी-मान 0.05556 है जो अशक्त परिकल्पना (0.05 पर) को अस्वीकार नहीं करता है। अब, भले ही आप 10 के कारक द्वारा दोनों साधनों के बीच की दूरी बढ़ाएँ, आपको समान पी-मान मिलेगा:

wilcox.test(rnorm(7, 1), rnorm(2, 50))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 50)
W = 0, p-value = 0.05556

अब मैं आपको टी-टेस्ट के साथ उसी सिमुलेशन को दोहराने के लिए आमंत्रित करता हूं और बड़े (औसत 5 बनाम 1) और विशाल (औसत 50 बनाम 1) अंतर के मामले में पी-मूल्यों का निरीक्षण करता हूं।


5

टी-टेस्ट के लिए कोई न्यूनतम नमूना आकार नहीं है; टी-परीक्षण, वास्तव में, छोटे नमूनों के लिए डिज़ाइन किया गया था। पुराने दिनों में जब टेबल छापी जाती थी, तो आपने बहुत छोटे नमूनों के लिए टी-टेस्ट टेबल देखी (जैसा कि df द्वारा मापा गया)।

बेशक, अन्य परीक्षणों की तरह, यदि एक छोटा सा नमूना है केवल काफी बड़ा प्रभाव सांख्यिकीय रूप से महत्वपूर्ण होगा।


लेकिन क्या इसके विपरीत भी एक समस्या होगी? यानी, आउटलेयर हो सकता है जो गलत परिकल्पना को गलत तरीके से खारिज करने के लिए नमूना हो सकता है? या मतभेदों का पता लगाने के लिए कम शक्ति एक बड़ी समस्या है? इस विशेष स्थिति में मैं साधनों के बीच एक महत्वपूर्ण अंतर देख रहा हूं, लेकिन यह नहीं जानता कि यह "विश्वास" कितना है।
जॉनी

2
N = 2 के साथ आप निश्चित रूप से आबादी में आउटलेर्स के प्रभाव से कमजोर हैं; कैसे 2 का एक नमूना नमूने के भीतर एक बाहरी हो सकता है? :-) मैं इस स्थिति में कोई भी अनुमान लगाने की कोशिश नहीं करूंगा। संभावनाएं "सत्य" पर पाने के लिए खराब हैं, और आप खुद को आलोचना के लिए खुला छोड़ देंगे।
rolando2

2
विश्वास अंतराल व्यापक होने का कारण ठीक है क्योंकि आप एक बाहरी परिणाम प्राप्त कर सकते हैं। लेकिन टी-टेस्ट अभी भी मानता है कि नमूने एक सामान्य आबादी से हैं।
पीटर Flom - को पुनः स्थापित मोनिका

2

मेरा मानना ​​है कि आपके पास एक समूह से 7 डेटा बिंदु हैं, और दूसरे समूह के 2 डेटा बिंदु हैं, दोनों ही आबादी के सबसेट हैं (जैसे पुरुषों का सबसेट और महिलाओं का सबसेट)।

टी-टेस्ट के लिए गणित इस विकिपीडिया पृष्ठ से प्राप्त किया जा सकता है । हम असमान नमूना आकार (7 बनाम 2) और असमान भिन्नताओं के साथ एक स्वतंत्र दो-नमूना टी-परीक्षण मानेंगे, इसलिए उस पृष्ठ के बारे में आधा-अधूरा है। आप देख सकते हैं कि गणना साधन और मानक विचलन पर आधारित है। एक समूह में केवल 7 विषयों और दूसरे में 2 विषयों के साथ, आप मान या मानक विचलन के लिए अच्छे अनुमान नहीं लगा सकते हैं। 2 विषयों वाले समूह के लिए, इसका मतलब बस मूल्य है जो दो डेटा बिंदुओं के बीच में बिल्कुल निहित है, इसलिए यह अच्छी तरह से अनुमानित नहीं है। 7 विषयों वाले समूह के लिए, नमूना आकार दृढ़ता से भिन्नता को प्रभावित करता है (और इसलिए मानक विचलन, जो कि विचरण के वर्गमूल हैं) क्योंकि चरम मान एक छोटा सा नमूना होने पर बहुत अधिक मजबूत प्रभाव डालते हैं।

उदाहरण के लिए, यदि आप मानक विचलन के लिए विकिपीडिया पृष्ठ पर मूल उदाहरण देखते हैं, तो आप देखेंगे कि मानक विचलन 2 है, और विचरण (मानक विचलन) इसलिए 4 है। लेकिन अगर हमारे पास केवल पहले दो डेटा बिंदु थे (9 और 1), विचरण 10/2 = 5 होगा और मानक विचलन 2.2 होगा और यदि हमारे पास केवल अंतिम दो मान (4 और 16) हैं, तो विचरण 20/2 = 10 होगा और मानक विचलन 3.2 होगा। हम अभी भी उन्हीं मूल्यों का उपयोग कर रहे हैं, उनमें से बस कम है, और हम अपने अनुमानों पर प्रभाव देख सकते हैं।

यही कारण है कि छोटे नमूने के आकार के साथ विभेदक आंकड़ों का उपयोग करने के साथ समस्या है, आपके परिणाम विशेष रूप से नमूने से दृढ़ता से प्रभावित होंगे।

अद्यतन: क्या कोई कारण है कि आप केवल विषय के आधार पर परिणामों की रिपोर्ट नहीं कर सकते हैं और संकेत दे सकते हैं कि यह खोजपूर्ण कार्य है? केवल दो मामलों के साथ, डेटा एक केस स्टडी के समान है, और इन दोनों (1) को लिखना महत्वपूर्ण है और (2) स्वीकृत अभ्यास।


धन्यवाद मिशेल। यह जानना रोचक और उपयोगी है। हालाँकि, आप व्यावहारिक दृष्टिकोण से क्या सलाह देंगे? इस स्थिति को देखते हुए, आगे बढ़ने का सबसे अच्छा तरीका क्या है? धन्यवाद!
जॉनी ने २३'१२

हाय जॉनी हैरान हो गया। आपकी सटीक स्थिति के बारे में अधिक जानकारी के बिना मैं अधिक मार्गदर्शन देने में असमर्थ महसूस करता हूं।
मिशेल

किस तरह की जानकारी की आवश्यकता है?
जॉनी

1
हाय फिर, अपने अध्ययन के डिजाइन पर अधिक जानकारी, जैसे कि आपका डेटा क्या है, आपने इसे कैसे एकत्र किया, आपके समूह क्या हैं, टिप्पणियों का चयन कैसे किया गया। सब मुझे पता है कि आपने 9 अवलोकनों (लोगों? चूहों? न्यूरॉन्स; पनीर के ब्लॉक? विकिरण आवृत्तियों?) के साथ एक प्रयोग किया था जो दो समूहों से हैं।
मिशेल

मान लीजिए कि मस्तिष्क में सफेद पदार्थ का औसत रक्त प्रवाह एमआरआई का उपयोग करके मनुष्यों में मापा गया था। समूह नियंत्रण (7 लोग) और उम्र / लिंग एक विशेष विकार (2 लोग) के साथ रोगियों से मेल खाते हैं।
जॉनी

1

दिलचस्प संबंधित लेख: 'बेहद कम सैम्पल आकारों के साथ छात्र के टी-टेस्ट का उपयोग करना' जेसीएफ डी विंटर (प्रैक्टिकल एसेसमेंट, रिसर्च एंड इवैल्यूएशन में) http://goo.gl/ZAUmGW


0

मैं आपको उन निष्कर्षों की तुलना करने की सलाह दूंगा जो आपको टी-टेस्ट और मैन-व्हिटनी टेस्ट दोनों के साथ मिलते हैं, और बॉक्सप्लेट और प्रत्येक जनसंख्या के माध्य की प्रोफाइल संभावना पर भी एक नज़र डालते हैं।


हाय @Demian, मुझे यकीन नहीं है कि एक बॉक्सप्लॉट भी मददगार होगा जब एक समूह का एक नमूना आकार 2 हो। अन्यथा, हां, मुझे लगता है कि विशेष रूप से समूहों में निरंतर डेटा की कल्पना करने में बॉक्सप्लॉट बहुत सहायक होते हैं।
मिशेल

0

Stata 13/SE code for a bootstrap ttestछोटे नमूनों पर किए गए एक टटेस्ट के रूप में, संभवतः टीस्ट आवश्यकताओं को पूरा नहीं करता है (मुख्य रूप से, आबादी की सामान्यता जिसमें से दो नमूने मधुमक्खी खींचे जाते हैं), मैं एफ्रोन बी का अनुसरण करते हुए, बूटस्ट्रैप टीटेस्ट (असमान सहक्रियाओं के साथ) करने की सलाह दूंगा। तिब्शीरानी आर.जे. बूटस्ट्रैप के लिए एक परिचय। बोका रैटन, FL: चैपमैन एंड हॉल / CRC, 1993: 220-224। स्टाटा 13 / एसई में जॉनी पॉज़ल्ड द्वारा उपलब्ध कराए गए डेटा पर बूटस्ट्रैप टीटेस्ट के लिए कोड ऊपर की छवि में बताया गया है।


आपके उत्तर में गंभीर प्रारूपण मुद्दे हैं, क्या आप इसे संपादित करना चाहेंगे?
अमीबा का कहना है कि 10

मैंने उत्तर के समीक्षा किए गए संस्करण में स्वरूपण मुद्दों को हल करने की कोशिश की है। यह इंगित करने के लिए अमीबा के लिए धन्यवाद।
कार्लो लेजजारो

0

2 का एक नमूना आकार के साथ, सबसे अच्छी बात यह है कि व्यक्तिगत संख्याओं को स्वयं देखें और सांख्यिकीय विश्लेषण से भी परेशान न हों।


1
वर्तमान में यह एक टिप्पणी की तरह अधिक पढ़ता है। हालांकि यह एक अच्छी बात है, मूल समस्या के उचित जवाब के लिए, इस मुद्दे की कुछ चर्चा स्वयं की उम्मीद की जा सकती है, भले ही अंततः यह निष्कर्ष निकाला जाए कि यह कुछ और करने के लिए अधिक समझ में आता है।
Glen_b -Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.