दो समूहों के लिए छोटे और असंतुलित नमूना आकार - क्या करना है?


10

मेरे पास दो समूहों (यानी नमूने) के लिए डेटा है, मैं तुलना करना चाहता हूं लेकिन कुल नमूना आकार छोटा है (एन = 29) और दृढ़ता से असंतुलित (एन = 22 बनाम एन = 7)।

ये डेटा एकत्रित करने के लिए तार्किक रूप से कठिन और महंगे हैं, इसलिए एक स्पष्ट समाधान के रूप में 'अधिक डेटा एकत्र करना' इस मामले में मददगार नहीं है।

कई अलग-अलग चर मापे गए (प्रस्थान की तारीख, आगमन की तारीख, प्रवास की अवधि आदि) इसलिए कई परीक्षण हैं, जिनमें से कुछ भिन्न हैं (भिन्न नमूना जो उच्चतर संस्करण हैं)।

प्रारंभ में एक सहयोगी ने इन आंकड़ों पर टी-टेस्ट चलाए, और कुछ P <0.001 के साथ सांख्यिकीय रूप से महत्वपूर्ण थे, दूसरा P = 0.069 के साथ महत्वपूर्ण नहीं था। कुछ नमूने सामान्य रूप से वितरित किए गए थे, अन्य नहीं थे। कुछ परीक्षणों में 'समान' रूपांतरों से बड़े प्रस्थान शामिल थे।

मेरे पास कई प्रश्न हैं:

  1. क्या यहां टी-टेस्ट उचित हैं? यदि नहीं, तो क्यों? क्या यह केवल उन परीक्षणों पर लागू होता है जहां सामान्यताओं की समानताएं और भिन्नताओं की समानता संतुष्ट हैं?
  2. एक उपयुक्त विकल्प क्या है? शायद एक क्रमचय परीक्षण?
  3. असमान भिन्नता टाइप I त्रुटि को बढ़ाती है, लेकिन कैसे? और टाइप I त्रुटि पर छोटे, असंतुलित नमूना आकार का क्या प्रभाव पड़ता है?

जवाबों:


11

जब दो आबादी के अलग-अलग संस्करण होते हैं, तो टी-परीक्षण दो आबादी के बराबर भिन्न मानों को मान्य नहीं करते हैं, और यह असमान नमूना आकारों के लिए बदतर है। यदि सबसे छोटा नमूना आकार उच्चतम विचरण वाला है तो परीक्षण में टाइप I त्रुटि होगी। दूसरी ओर टी-टेस्ट का वेल्च-स्टरथवेट संस्करण, समान भिन्नताओं को नहीं मानता है। यदि आप फिशर-पिटमैन के क्रमपरिवर्तन परीक्षण के बारे में सोच रहे हैं, तो यह भी समान भिन्नताओं को मानता है (यदि आप कम पी-मान से असमान साधनों का अनुमान लगाना चाहते हैं)।

कई अन्य चीजें हैं जिनके बारे में आप सोचना चाहते हैं:

(१) यदि संस्करण स्पष्ट रूप से असमान हैं, क्या आप अभी भी साधनों के बीच अंतर करने में रुचि रखते हैं?

(2) पी-वैल्यू की तुलना में अनुमान का आपके लिए अधिक उपयोग हो सकता है?

(३) क्या आप अपने डेटा की बहुभिन्नरूपी प्रकृति पर विचार करना चाहते हैं, न कि केवल एकतरफा तुलना की श्रृंखला बनाने के लिए?


हाय Scortchi, आपके उत्तर के लिए धन्यवाद। मैंने उन प्रश्नों पर विचार किया है जो आपने प्रस्तुत किए हैं:
डीनप

2
(1) हमारे अध्ययन के लिए विचरण और माध्य दोनों सूचनात्मक हो सकते हैं (जैसे प्रवास प्रस्थान की तारीख बाद में एक आबादी के लिए काफी हो सकती है और प्रस्थान की तारीखों में सीमा अधिक परिवर्तनशील होती है)।
डीनप

3
(१) सिर्फ इसका उल्लेख किया है क्योंकि लोग अक्सर असमान भिन्नताओं को केवल एक तकनीकी समस्या के रूप में देखते हैं और यह भूल जाते हैं कि यह अपने आप में एक दिलचस्प तथ्य है।
स्कॉर्टी - मोनिका

2
(२) मेरा कहना यह था कि पी-मानों की एक सूची आम तौर पर प्रभाव के आकार के अनुमानों की सूची की तुलना में कम उपयोगी होती है (जो कि विश्वास अंतराल के साथ मतलब, मंझला, भिन्न, या जो भी हो सकता है)। विशेष रूप से छोटे नमूनों के साथ, आत्मविश्वास अंतराल दिखा सकता है कि क्या व्यावहारिक महत्व के प्रभाव आकार अभी भी डेटा के साथ समवर्ती हैं, भले ही पी-मूल्य अधिक हो।
Scortchi - को पुनः स्थापित मोनिका

2
(३) मैं एक स्वतंत्र चर (समूह) और कई आश्रित चर (प्रवास समय और ग) के बारे में सोच रहा था: समूहों के बीच एक दिलचस्प अंतर आश्रित चर के बीच के रिश्ते में बदलाव हो सकता है। एक पहला कदम बॉक्सप्लेट्स या डॉटप्लेट्स के साथ एक अच्छा मैट्रिक्स होगा जो प्रत्येक DV की तुलना विकर्ण के साथ समूहों के बीच करता है, और अन्य कोशिकाओं में DVs (फिर से अलग समूहों) के प्रत्येक जोड़े के लिए स्कैप्लेट्स। और ईमानदार होने के लिए, छोटे नमूना आकारों के साथ एक खोजपूर्ण विश्लेषण के लिए, यह अच्छी तरह से अंतिम चरण हो सकता है।
Scortchi - को पुनः स्थापित मोनिका

1

सबसे पहले, जैसा कि स्कोर्टची पहले से ही इंगित करता है, टी-टेस्ट आपके डेटा के अनुकूल नहीं है, क्योंकि डेटा के वितरण पर इसकी मान्यताओं के कारण।

आपके दूसरे बिंदु पर, मैं टी-टेस्ट के विकल्प का प्रस्ताव रखूंगा। यदि आपकी रुचि केवल इस तथ्य के बारे में है, यदि आपके दो नमूनों का वितरण बराबर है या नहीं, तो आप विलकॉक्स रैंक-सम टेस्ट के दो तरफा संस्करण का उपयोग करने का भी प्रयास कर सकते हैं। विलकॉक्सन रैंक-सम परीक्षण एक गैर-पैरामीट्रिक परीक्षण है। इस तरह का परीक्षण विशेष रूप से सहायक है, यदि आप अपने डेटा के अंतर्निहित वितरण के बारे में सुनिश्चित नहीं हैं।

यह छोटे नमूना आकारों के साथ-साथ बड़े कॉहर्ट्स के लिए परीक्षण का सटीक समाधान मौजूद है । इसके अलावा, एक आर पैकेज भी मौजूद है जो विलकॉक्सन रैंक-सम टेस्ट का एहसास करता है।

चूंकि यह एक पैरामीटर फ्री टेस्ट है और छोटे नमूने के आकार को भी संभालता है, इसलिए टेस्ट केस के लिए परीक्षण को अच्छी तरह से सूट करना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.