टाइप II त्रुटियों को सांख्यिकीय साहित्य में अधिक महत्व क्यों नहीं दिया गया है?


10

मैंने कई मामलों को देखा है जहां विभिन्न शोध लेखों में मुझे टाइप किए गए त्रुटियों के कारण (एक अल्फा मान द्वारा चिह्नित) के लिए जिम्मेदार हैं। मैंने यह दुर्लभ पाया है कि एक शोधकर्ता शक्ति, या द्वितीय प्रकार की त्रुटि को ध्यान में रखेगा।

टाइप II त्रुटियाँ सही में बड़ी बात हो सकती हैं? हमने गलती से वैकल्पिक परिकल्पना को अस्वीकार कर दिया है जब यह वास्तव में गलत था। बीटा वैल्यू के बजाय अल्फा वैल्यू पर इतना जोर क्यों दिया जाता है?

जब मैंने प्रथम वर्ष के आँकड़े लिए, तो मुझे कभी भी बीटा नहीं पढ़ाया गया था - केवल अल्फ़ा। मुझे लगता है कि इन दोनों त्रुटियों को समान रूप से व्यवहार किया जाना चाहिए। फिर भी, केवल अल्फ़ा पर बल दिया जाता है।


1
+1 कारण यह है कि परंपरागत रूप से, टाइप I त्रुटि (उर्फ, या महत्व स्तर ) पहले तय की जाती है, और फिर परीक्षण का निर्माण किया जाता है जैसे टाइप II त्रुटि को कम करने के लिए (जैसे , शक्ति को अधिकतम करने के लिए ) । इस मुद्दे को समझने के लिए विकिपीडिया पर एक उपयोगी लेख यूनिफ़ॉर्मली मोस्ट पावरफुल (UMP) परीक्षणों पर आधारित है, en.wikipedia.org/wiki/Uniformly_most_powerful_testα
जेरेमियास K

3
आप "हम अशक्त परिकल्पना स्वीकार कर चुके हैं" के बारे में गलत हैं - हम इसे कभी स्वीकार नहीं करते हैं। हम या तो "अशक्त हाइप को अस्वीकार करते हैं", या "अशक्त हाइप को अस्वीकार करने में विफल", लेकिन कभी भी अशक्त हाइप को स्वीकार नहीं करते हैं!
गुफा

ब्लास्ट - कि मुझे पिछले स्किम्ड। यह बात बताने के लिए धन्यवाद।

1
सांख्यिकीय साहित्य के पूरे क्षेत्र के साथ अपने स्वयं के अनुभव को भ्रमित न करने के लिए सावधान रहें; आपके द्वारा पढ़ी गई सामग्री की सामग्री का अनुमान शायद ही लगा हो।
Glen_b -Reinstate मोनिका

@ सही पर। एक जंगली शीर्षक को अधिक प्रतिक्रियाएं मिलती हैं।

जवाबों:


5

यह अच्छा प्रश्न है। मुझे स्पष्टीकरण के एक जोड़े के साथ शुरू करते हैं:


मुझे लगता है कि आप (दुर्भाग्य से) सही हैं कि शक्ति और द्वितीय प्रकार की त्रुटियों पर कम ध्यान दिया जाता है। जबकि मुझे लगता है कि बायोमेडिकल रिसर्च में स्थिति में सुधार हो रहा है (उदाहरण के लिए, फंडिंग एजेंसियां ​​और आईआरबी अक्सर अब पावर विश्लेषण का पुनर्मूल्यांकन करते हैं), मुझे लगता है कि इसके कुछ कारण हैं:

  1. मुझे लगता है कि लोगों को साधारण महत्व से समझने के लिए शक्ति कठिन है। (यह भाग में है क्योंकि यह बहुत सारे अज्ञात पर निर्भर करता है - विशेष रूप से प्रभाव का आकार, लेकिन अन्य भी हैं)।
  2. 0
  3. वैज्ञानिकों ने परंपरागत रूप से माना है कि टाइप I त्रुटियां टाइप II त्रुटियों से भी बदतर हैं।

1
हमेशा की तरह, ज्ञानवर्धक - विशेष रूप से गैर-गणित वाले :-) के लिए ... मुझे यह शब्द पसंद है ... मुझे आश्चर्य है कि अगर आप तीसरे बिंदु पर थोड़ा विस्तार कर सकते हैं ... क्या इस पूर्वाग्रह का कोई आधार है। मुझे पता है कि यह सच है, लेकिन आपको क्यों लगता है कि यह मामला है ... क्या ऐसा इसलिए है क्योंकि यह पी-वैल्यू की ट्रॉफी के बारे में है, और कुछ भी मायने नहीं रखता है?
एंटोनी परेलाडा

धन्यवाद, @AntoniParellada मैं सोचूंगा कि मैं और क्या जोड़ सकता हूं।
गूँग - मोनिका

2
मैं बिंदु 3 को स्पष्ट करूँगा) क्यों वैज्ञानिकों को लगता है कि टाइप I त्रुटियां बदतर हैं। अशक्त परिकल्पना आमतौर पर किसी तरह की "यथास्थिति" होती है, उदाहरण के लिए इस ब्रांड की नई दवा का प्रभाव 0. है। हमें यथास्थिति पसंद है, और अन्यथा साबित करने के लिए शोधकर्ता पर सबूत का बोझ है। इस प्रकार, हम टाइप I त्रुटि को सीमित करना चाहते हैं, अर्थात हम यथास्थिति को गलत तरीके से अस्वीकार करते हैं। IMO, यथास्थिति के लिए यह लगाव सिर्फ दार्शनिक है। यदि आप मेरी राय बदलना चाहते हैं, तो आपको इसे साबित करना होगा।
हाइजेनबर्ग

1
व्यवहार में, कोई भी उन मामलों के बारे में आसानी से सोच सकता है जहां टाइप II त्रुटि बहुत अधिक मायने रखती है, अर्थात शून्य को अस्वीकार नहीं करने की लागत अधिक है। उदाहरण के लिए, यदि मानव जाति एक ज़ोंबी महामारी का सामना करती है, तो मुझे यकीन है कि रवैया "किसी भी दवा की कोशिश करेगा, भले ही वह काम न करे" इसके बजाय "आपको यह साबित करना होगा कि यह काम करता है इससे पहले कि हम इसका उपयोग करें"।
हाइजेनबर्ग

@ हाइज़ेनबर्ग में जोड़ना: जिन मामलों में टाइप II की त्रुटियां सबसे ज्यादा मायने रखती हैं, उन्हें बिंदु परिकल्पना परीक्षणों और तुल्यता परीक्षण के बीच स्विच करने पर विचार करना चाहिए। आपके उदाहरण में, किसी को यह साबित करना होगा कि एक प्रस्तावित वर्सेस्टर सॉस कम से कम ज़ोंबी महामारी को खराब नहीं करता है। फिर त्रुटि दर उनकी भूमिका को बदल देती है और सबसे महत्वपूर्ण त्रुटि दर फिर से डिजाइन द्वारा तय की जाती है। इसके अलावा, यदि आपके पास गलत निर्णयों के कुछ लागत अनुमान हैं, तो एक निर्णय नियम पर विचार करना चाहिए जो जोखिम को कम करता है और किसी विशेष प्रकार की त्रुटि दर को ठीक नहीं करता है (जरूरी)।
होर्स्ट ग्रुनबश

2

कारण यह है कि हम बस वास्तविक प्रकार द्वितीय त्रुटि दर नहीं जानते हैं और हम कभी नहीं करेंगे। यह एक पैरामीटर पर निर्भर करता है जिसे हम आमतौर पर नहीं जानते हैं। बदले में, यदि हम इस पैरामीटर को जानते हैं, तो हमें एक सांख्यिकीय परीक्षण करने की आवश्यकता नहीं होगी।

हालाँकि, हम इस तरह के प्रयोग की योजना बना सकते हैं कि एक विशिष्ट प्रकार II त्रुटि दर को पूरा किया जाए जो कि कुछ विकल्प सही है। इस तरह, हम एक नमूना आकार चुनेंगे जो संसाधनों को बर्बाद नहीं करता है: या तो क्योंकि परीक्षण अंत में अस्वीकार नहीं करता है या क्योंकि पहले से ही एक बहुत छोटा नमूना आकार परिकल्पना को अस्वीकार करने के लिए पर्याप्त होता।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.