असमान नमूना आकार: जब कॉल करने के लिए यह क्विट करता है


14

मैं एक अकादमिक पत्रिका के लेख की समीक्षा कर रहा हूं और लेखकों ने किसी हीन सांख्यिकी की सूचना न देने के औचित्य के रूप में निम्नलिखित लिखा है (मैंने दो समूहों की प्रकृति को स्पष्ट किया है):

कुल में, 2,349 में से 25 (1.1%) उत्तरदाताओं ने एक्स की सूचना दी । हम उचित रूप से विश्लेषण है कि सांख्यिकीय रूप से समूह की तुलना पेश करने से बचना एक्स समूह में वाई उन परिणामों भारी एक परिणाम यह दुर्लभ के साथ मौका द्वारा संचालित किया जा सकता है के बाद से (अन्य 2,324 प्रतिभागियों)।

मेरा सवाल यह है कि इस अध्ययन के लेखकों को समूहों की तुलना करने के संबंध में तौलिया फेंकने का औचित्य है? यदि नहीं, तो मैं उन्हें क्या सलाह दे सकता हूं?

जवाबों:


20

सांख्यिकीय परीक्षण नमूना आकार के बारे में धारणा नहीं बनाते हैं। बेशक, विभिन्न परीक्षणों (जैसे, सामान्यता) के साथ भिन्न धारणाएं हैं, लेकिन नमूना आकार की समानता उनमें से एक नहीं है। जब तक उपयोग किया जाने वाला परीक्षण किसी अन्य तरीके से अनुचित है (मैं अभी किसी मुद्दे के बारे में नहीं सोच सकता हूं), जिस प्रकार की त्रुटि दर है , वह काफी असमान समूह आकार से प्रभावित नहीं होगी। इसके अलावा, उनके वाक्यांशों का अर्थ है (मेरे दिमाग में) कि वे मानते हैं कि यह होगा। इस प्रकार, वे इन मुद्दों के बारे में भ्रमित हैं।

दूसरी ओर, टाइप II त्रुटि दर बहुत अधिक असमान s से प्रभावित होगी । यह सच होगा, चाहे कोई भी परीक्षा हो (जैसे, - test , Mann-Whitney -est, या समान अनुपात के लिए -est सभी इस तरह से प्रभावित होंगे)। इसके एक उदाहरण के लिए, मेरा उत्तर यहां देखें: किसी को विभिन्न नमूना आकारों से साधनों की तुलना कैसे करनी चाहिए? इस प्रकार, वे इस मुद्दे के संबंध में "तौलिया में फेंकने में उचित" हो सकते हैं । (विशेष रूप से, यदि आप एक गैर-महत्वपूर्ण परिणाम प्राप्त करने की उम्मीद करते हैं कि क्या प्रभाव वास्तविक है या नहीं, तो परीक्षण का क्या मतलब है?) ntUz

नमूने के आकार में परिवर्तन होने पर, सांख्यिकीय शक्ति परिवर्तित हो जाएगी । यह तथ्य वास्तव में एक अलग सुझाव की ओर ले जाता है, जिस पर मुझे संदेह है कि कुछ लोगों ने कभी सुना है और संभवत: पिछले समीक्षकों (बिना किसी उद्देश्य के) को पाने में परेशानी होगी: एक समझौता शक्ति विश्लेषण । यह विचार अपेक्षाकृत सीधा है: किसी भी शक्ति विश्लेषण में, , , , , और प्रभाव आकार , एक दूसरे के संबंध में मौजूद हैं। सभी लेकिन एक निर्दिष्ट करने के बाद, आप अंतिम के लिए हल कर सकते हैं। आमतौर पर, लोग वही करते हैं जिसे ए-प्रायरी पावर एनालिसिस कहा जाता है , जिसमें आप लिए हल करते हैंααβn1n2dN(आम तौर पर आप मान रहे हैं )। दूसरी ओर, आप ठीक कर सकते हैं , , और , और के लिए हल (या समतुल्य यदि आपके द्वारा निर्दिष्ट) अनुपात प्रकार की मैं द्वितीय त्रुटि दरों टाइप करने के लिए है कि आप के साथ रहने के लिए तैयार हैं। परंपरागत रूप से, और , इसलिए आप कह रहे हैं कि टाइप I त्रुटियां टाइप I त्रुटियों से चार गुना बदतर हैं। बेशक, एक दिया गया शोधकर्ता इससे असहमत हो सकता है, लेकिन किसी दिए गए अनुपात को निर्दिष्ट करने पर, आप what लिए हल कर सकते हैंn1=n2n1n2dαβα=.05β=.20αसंभवतः किसी पर्याप्त शक्ति को बनाए रखने के लिए आपको इसका उपयोग करना चाहिए। यह दृष्टिकोण इस स्थिति में शोधकर्ताओं के लिए एक तार्किक रूप से वैध विकल्प है, हालांकि मैं स्वीकार करता हूं कि इस दृष्टिकोण की विशिष्टता इसे बड़े शोध समुदाय में एक कठिन बिक्री बना सकती है जिसने शायद कभी ऐसा नहीं सुना है।


यह अविश्वसनीय रूप से सहायक है। मुझे आपकी प्रतिक्रिया भी मिली कि किसी को विभिन्न नमूना आकारों से साधनों की तुलना कैसे करनी चाहिए? इस मुद्दे की मेरी अपनी समझ में उपयोगी है। आपकी प्रतिक्रिया को पढ़ने के बाद, मैं लेखकों के लिए एक समझौता शक्ति विश्लेषण की संभावना को सामने लाऊंगा (यह एक सुरक्षित शर्त की तरह लगता है कि वे इससे परिचित नहीं हैं) और शायद सत्ता के बारे में चिंताओं के संबंध में अपनी टिप्पणियों में अधिक विशिष्ट होने का सुझाव देते हैं।
आरोन ड्यूक

2
आपका स्वागत है, @AaronD। मेरी राय में, आपको निश्चित रूप से उन्हें कम से कम अपने वाक्यांश को बदलने के लिए प्रोत्साहित करना चाहिए क्योंकि यह या तो भ्रामक है, या इसका अर्थ है कि वे विषय को गलत समझते हैं। मैं भविष्यवाणी करता हूं कि वे समझौता शक्ति विश्लेषण का प्रयास नहीं करेंगे, लेकिन वे केवल वर्णनात्मक आँकड़े (साधन और एसडी) और एक प्रभाव आकार w / उपयुक्त आत्मविश्वास अंतराल की रिपोर्ट कर सकते हैं।
गंग - मोनिका

6

जबकि @gung का उत्तर उत्कृष्ट है, मुझे लगता है कि एक महत्वपूर्ण मुद्दा है जिस पर विचार किया जाना चाहिए, जब अलग-अलग समूह आकार देखें। आम तौर पर, जब तक कि परीक्षण की सभी आवश्यकताएं पूरी नहीं हो जाती हैं, तब तक समूह के आकार में अंतर महत्वपूर्ण नहीं है।

हालांकि, कुछ मामलों में विभिन्न समूह आकार का इन धारणाओं के खिलाफ उल्लंघन के खिलाफ परीक्षण की मजबूती पर नाटकीय प्रभाव पड़ेगा। उदाहरण के लिए शास्त्रीय दो-नमूना अप्रकाशित टी-परीक्षण विचरण समरूपता को मानता है और उल्लंघन के खिलाफ तभी मजबूत होता है जब दोनों समूह समान आकार (परिमाण के क्रम में) हों। अन्यथा छोटे समूह में उच्च विचरण टाइप I त्रुटियों को जन्म देगा। अब टी-टेस्ट के साथ यह बहुत ज्यादा समस्या नहीं है क्योंकि आमतौर पर इसके बजाय वेल्च टी-टेस्ट का उपयोग किया जाता है और यह भिन्नता समरूपता को नहीं मानता है। हालांकि, रैखिक मॉडल में समान प्रभाव उत्पन्न हो सकते हैं।

संक्षेप में, मैं कहूंगा कि यह किसी भी तरह से एक सांख्यिकीय विश्लेषण में बाधा नहीं है, लेकिन इसे आगे बढ़ने का निर्णय लेते समय ध्यान में रखना होगा।


8
मेरा मानना ​​है कि इस मामले की क्रूरता परीक्षणों की प्रयोज्यता नहीं है, बल्कि उनकी सार्थकता और व्याख्या है। प्रश्न "उत्तरदाताओं" को संदर्भित करता है। यह दृढ़ता से एक गैर-गैर-प्रतिक्रिया दर की संभावना का सुझाव देता है। अध्ययन आकार के सापेक्ष एक छोटी गैर-प्रतिक्रिया दर (एक प्रतिशत का एक छोटा अंश) भी छोटे उपसमूह के सापेक्ष एक विशाल गैर-प्रतिक्रिया दर होगी। यह इस छोटे से किसी भी उपसमूह की प्रतिनिधित्वशीलता पर सवाल उठाता है। नतीजतन, यह किसी भी सांख्यिकीय विश्लेषण के लिए एक बड़ी बाधा है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.