मेरे पास दो समूहों (यानी नमूने) के लिए डेटा है, मैं तुलना करना चाहता हूं लेकिन कुल नमूना आकार छोटा है (एन = 29) और दृढ़ता से असंतुलित (एन = 22 बनाम एन = 7)।
ये डेटा एकत्रित करने के लिए तार्किक रूप से कठिन और महंगे हैं, इसलिए एक स्पष्ट समाधान के रूप में 'अधिक डेटा एकत्र करना' इस मामले में मददगार नहीं है।
कई अलग-अलग चर मापे गए (प्रस्थान की तारीख, आगमन की तारीख, प्रवास की अवधि आदि) इसलिए कई परीक्षण हैं, जिनमें से कुछ भिन्न हैं (भिन्न नमूना जो उच्चतर संस्करण हैं)।
प्रारंभ में एक सहयोगी ने इन आंकड़ों पर टी-टेस्ट चलाए, और कुछ P <0.001 के साथ सांख्यिकीय रूप से महत्वपूर्ण थे, दूसरा P = 0.069 के साथ महत्वपूर्ण नहीं था। कुछ नमूने सामान्य रूप से वितरित किए गए थे, अन्य नहीं थे। कुछ परीक्षणों में 'समान' रूपांतरों से बड़े प्रस्थान शामिल थे।
मेरे पास कई प्रश्न हैं:
- क्या यहां टी-टेस्ट उचित हैं? यदि नहीं, तो क्यों? क्या यह केवल उन परीक्षणों पर लागू होता है जहां सामान्यताओं की समानताएं और भिन्नताओं की समानता संतुष्ट हैं?
- एक उपयुक्त विकल्प क्या है? शायद एक क्रमचय परीक्षण?
- असमान भिन्नता टाइप I त्रुटि को बढ़ाती है, लेकिन कैसे? और टाइप I त्रुटि पर छोटे, असंतुलित नमूना आकार का क्या प्रभाव पड़ता है?