क्यों हम शून्य परिकल्पना को 0.05 स्तर पर अस्वीकार करते हैं न कि 0.5 स्तर (जैसा कि हम वर्गीकरण में करते हैं)


11

परिकल्पना परीक्षण एक वर्गीकरण समस्या के समान है। तो कहते हैं, हमारे पास अवलोकन (विषय) के लिए 2 संभावित लेबल हैं - दोषी बनाम गैर-दोषी। बता दें कि नॉन-गिल्टी अशक्त परिकल्पना है। यदि हम एक वर्गीकरण दृष्टिकोण से समस्या को देखते हैं तो हम एक क्लासिफायर ट्रेन करेंगे जो डेटा को देखते हुए प्रत्येक 2 वर्गों में संबंधित विषय की संभावना की भविष्यवाणी करेगा। हम तब कक्षा को उच्चतम संभावना के साथ चुनेंगे। उस स्थिति में 0.5 संभावना प्राकृतिक सीमा होगी। यदि हमने झूठी सकारात्मक बनाम गलत नकारात्मक त्रुटियों के लिए अलग-अलग लागत सौंपी है, तो हम सीमा को अलग-अलग कर सकते हैं। लेकिन शायद ही हम 0.05 पर थ्रेशोल्ड सेट करने के लिए इतने चरम पर जाएं, अर्थात सब्जेक्ट को "दोषी" तभी असाइन करें, जब संभावना 0.95 या इससे अधिक हो। लेकिन अगर मैं अच्छी तरह से समझता हूं, जब हम एक ही समस्या को हाइपोथीसिस परीक्षण की समस्या के रूप में देखते हैं तो हम एक मानक अभ्यास के रूप में कर रहे हैं। इस बाद के मामले में, हम "गैर-दोषी" लेबल को असाइन नहीं करेंगे - लेबल "दोषी" को असाइन करने के लिए असमान - केवल अगर "गैर-दोषी" होने की संभावना 5% से कम है। और शायद यह समझ में आता है अगर हम सही मायने में निर्दोष लोगों को दोषी ठहराना चाहते हैं। लेकिन यह नियम सभी डोमेन और सभी मामलों में क्यों लागू होना चाहिए?

यह निर्णय लेना कि कौन सी परिकल्पना को अपनाना डेटा दिए गए सत्य के अनुमानक को परिभाषित करने के बराबर है। अधिकतम संभावना अनुमान में हम उस परिकल्पना को स्वीकार करते हैं जिसमें अधिक संभावना है कि डेटा दिया गया है - जरूरी नहीं कि अत्यधिक संभावना हो। नीचे दिया गया ग्राफ देखें:

यहाँ छवि विवरण दर्ज करें

एक अधिकतम संभावना दृष्टिकोण का उपयोग करते हुए हम इस उदाहरण में वैकल्पिक परिकल्पना का पक्ष लेंगे यदि प्रिडिक्टर का मान 3, 4, 4 से ऊपर था, हालांकि इस मूल्य की संभावना शून्य परिकल्पना से ली गई है, जो 0.05 से बड़ा होगा।

और जिस उदाहरण के साथ मैंने पोस्ट शुरू किया है वह शायद भावनात्मक रूप से आरोपित है, हम अन्य मामलों के बारे में सोच सकते हैं, उदाहरण के लिए तकनीकी सुधार। जब हम डेटा हमें यह बताते हैं कि नया समाधान एक संभावना है, तो संभावना यह है कि ऐसा नहीं है, इसलिए हमें इस स्थिति का लाभ क्यों देना चाहिए?


1
2

1
ओपी सही है कि आधार यहां त्रुटिपूर्ण है, शास्त्रीय एनएचएसटी प्रक्रिया में कुछ भी नहीं है जो हमें 5% पर अस्वीकार करने की आवश्यकता है। यह एक सांस्कृतिक घटना है जो मूल्यहीन है।
मैथ्यू ड्र्यू

1
@Matthew ड्रुरी: "बास्केटबॉल टीम के लिए लंबा लोगों को चुनने" एक रणनीति के रूप त्रुटिपूर्ण नहीं है बस , क्योंकि यह शामिल नहीं है कैसे लंबा एक सटीक नियम के रूप में। यद्यपि बहुत सारे अन्य मुद्दे हैं, जैसा कि आप जानते हैं, उपयोगकर्ता को यह बताने की सुविधा देता है कि लाइन कहाँ खींचना है, यकीनन एनएचएसटी की एक विशेषता है। मेरे जोखिम के कारण पेरिस या लंदन की हाल की यात्राओं को खारिज नहीं किया गया, लेकिन यह कई देशों की यात्राओं को नियंत्रित करेगा: अन्य लोग अलग तरह से रेखा खींचेंगे। मैं मानता हूं कि अब तक एक सांस्कृतिक घटना [sic] है, जहां विभिन्न समूहों में परिकल्पनाओं को खारिज करने पर अलग-अलग सम्मेलन होते हैं।
निक कॉक्स

मुझे यकीन नहीं है कि आप मेरी टिप्पणी निक में पढ़ रहे हैं। मुझे लगता है कि मुझे और अधिक स्पष्ट होना चाहिए था। मैं बस लोगों को समस्या विशिष्ट थ्रेसहोल्ड स्थापित करने में अधिक विचार करना चाहता हूं।
मैथ्यू पारा

आपको लगता है (एड) कह रही है कि NHST त्रुटिपूर्ण है क्योंकि यह एक विशिष्ट अस्वीकृति स्तर नहीं है। मैं समस्या-विशिष्ट थ्रेसहोल्ड के बारे में आपसे सहमत हूँ।
निक कॉक्स

जवाबों:


17

कहते हैं कि आप अदालत में समाप्त हो गए और आपने ऐसा नहीं किया। क्या आपको लगता है कि यह उचित है कि आपके पास दोषी पाए जाने का 50% मौका है? क्या निर्दोष होने का 50% मौका " उचित संदेह से परे दोषी " है? क्या आपको लगता है कि यह उचित है कि आपके पास दोषी पाए जाने के बावजूद 5% का मौका था? अगर मैं अदालत में होता तो मैं 5% पर्याप्त रूढ़िवादी नहीं मानता।

π


प्रश्न के आपके संपादन के जवाब में:

α


6
α=0.05α=0.05

8

आप जैसा कहते हैं - यह इस बात पर निर्भर करता है कि गलत और सकारात्मक नकारात्मक गलतियाँ कितनी महत्वपूर्ण हैं।

उदाहरण में आप उपयोग करते हैं, जैसा कि मैर्टन ब्यूस ने पहले ही उत्तर दिया था, दोषी ठहराया जा रहा है अगर 50% संभावना है कि आप निर्दोष थे तो शायद ही उचित हो।

शोध के लिए इसे लागू करते समय, इस तरह से देखें: कल्पना कीजिए कि आप जानना चाहते हैं कि क्या एक नई दवा एक निश्चित बीमारी के खिलाफ मदद करती है। यह कहें कि आप उपचार के पक्ष में अपने उपचार समूह और अपने नियंत्रण समूह के बीच अंतर पाते हैं। महान! दवा काम करना चाहिए, है ना? आप अशक्त परिकल्पना को अस्वीकार कर सकते हैं कि दवा काम नहीं करती है। आपका पी -value 0.49 है! इस बात की अधिक संभावना है कि आपने जो प्रभाव पाया, वह संयोग के बजाय सत्य पर आधारित था!
अब इस पर विचार करें: दवा के बुरे प्रतिकूल प्रभाव हैं। आप केवल इसे लेना चाहते हैं यदि आप आश्वस्त हैं कि यह काम करता है। और तुम हो? नहीं, क्योंकि अभी भी 51% संभावना है कि आप दोनों समूहों के बीच का अंतर विशुद्ध रूप से संयोग से था।

मैं सोच सकता हूं कि ऐसे डोमेन हैं जहां आप 10% से संतुष्ट हैं। मैंने उन लेखों को देखा है जहां 10% स्वीकार किए जाते हैं। मैंने उन लेखों को भी देखा है जहाँ उन्होंने 2% को चुना। यह इस बात पर निर्भर करता है कि आपको यह कितना महत्वपूर्ण लगता है कि आप आश्वस्त हैं कि अशक्त परिकल्पना को खारिज करना सत्य पर आधारित होगा और अवसर के लिए नहीं। मैं शायद ही ऐसी स्थिति की कल्पना कर सकता हूं जहां आप 50% संभावना से संतुष्ट हों कि जो अंतर आपको मिला वह शुद्ध भाग्य पर आधारित था।


5

.05.50


आप "[h] परिकल्पना परीक्षण [होना चाहिए] एक वर्गीकरण समस्या के समान हैं"। यहाँ स्पष्ट समानता केवल सतही है; यह वास्तव में एक सार्थक अर्थ में सच नहीं है।

एक द्विआधारी वर्गीकरण समस्या में, वास्तव में सिर्फ दो वर्ग हैं; यह पूरी तरह से और एक प्राथमिकता तय की जा सकती है। परिकल्पना परीक्षण ऐसा नहीं है। आपका आंकड़ा एक अशक्त और एक वैकल्पिक परिकल्पना को प्रदर्शित करता है क्योंकि वे अक्सर एक शक्ति विश्लेषण या आँकड़े 101 कक्षा में परिकल्पना परीक्षण के तर्क को चित्रित करने के लिए तैयार होते हैं। आकृति का तात्पर्य है कि एक शून्य परिकल्पना और एक वैकल्पिक परिकल्पना है। हालांकि, यह (आमतौर पर) सही है कि केवल एक अशक्त है, विकल्प का केवल एक बिंदु मान होना निश्चित नहीं है (कहते हैं) अंतर अंतर। अध्ययन की योजना बनाते समय, शोधकर्ता अक्सर एक न्यूनतम मूल्य का चयन करेंगे जो वे पता लगाने में सक्षम होना चाहते हैं। मान लीजिए कि कुछ विशेष अध्ययनों में यह की औसत पारी है.67.67

00100%0।0¯00पी<.5)। नतीजतन, आप हमेशा यह निष्कर्ष निकालेंगे कि शून्य परिकल्पना झूठी है। इसे स्पष्ट करने के लिए, आपके प्रश्न में गलत आधार यह है कि एक एकल, अर्थपूर्ण ब्लू लाइन (जैसा कि आपके चित्र में दर्शाया गया है) का उपयोग किया जा सकता है जैसा कि आप सुझाव देते हैं।

.50


3

बहुत अच्छे पिछले उत्तरों में जोड़ने के लिए: हाँ, 5% मनमाना है, लेकिन चाहे जो विशिष्ट सीमा आप चुनते हैं, वह यथोचित रूप से छोटी होनी चाहिए, अन्यथा परिकल्पना परीक्षण बहुत कम समझ में आता है।

आप एक प्रभाव की तलाश कर रहे हैं और यह सुनिश्चित करना चाहते हैं कि आपके परिणाम पूरी तरह से मौका के कारण नहीं हैं। उस सीमा तक, आप एक महत्व स्तर निर्धारित करते हैं जो मूल रूप से कहता है "यदि वास्तव में कोई प्रभाव नहीं था (शून्य परिकल्पना सच है), तो यह अभी भी इस तरह के परिणाम (या अधिक चरम) को शुद्ध मौका द्वारा प्राप्त करने की संभावना होगी" । इसे बहुत अधिक सेट करने से बहुत सी झूठी सकारात्मकताएँ आएंगी, और आपके शोध प्रश्न का सार्थक उत्तर पाने की आपकी क्षमता कम हो जाएगी।

हमेशा की तरह, इसमें एक व्यापार शामिल है, इसलिए अनुसंधान समुदाय इस 5% दिशानिर्देश के साथ आया। लेकिन यह अलग-अलग क्षेत्रों में अलग है। कण भौतिकी में, यह 0.00001% या कुछ और की तरह है।


0

वर्गीकरण और परिकल्पना परीक्षण अलग-अलग हैं और अलग-अलग रूप से उपयोग किए जाते हैं । ज्यादातर मामलों में, लोग उपयोग करते हैं

  • "वर्गीकरण" "साझा गुणों या विशेषताओं के अनुसार" कुछ वर्गीकृत करने का कार्य करने के लिए।
  • और कुछ "महत्वपूर्ण खोजों" को सत्यापित करने के लिए "परिकल्पना परीक्षण" का उपयोग करें।

ध्यान दें कि, परिकल्पना परीक्षण में, "शून्य परिकल्पना" "सामान्य ज्ञान" है, लेकिन अगर हम अशक्त परिकल्पनाओं को अस्वीकार कर सकते हैं, तो हमारे पास एक ब्रेक है।

यही कारण है कि परिकल्पना परीक्षण में हमारे पास अधिक कठोर मानदंड हैं। नए ड्रग्स को विकसित करने के बारे में सोचें, हम कहना चाहते हैं कि यह महत्वपूर्ण और प्रभावी है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.