यदि हम एक बड़े अध्ययन में अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं, तो क्या यह अशक्तता का प्रमाण नहीं है?


59

नल की परिकल्पना महत्व परीक्षण की एक बुनियादी सीमा यह है कि यह एक शोधकर्ता को अशक्त ( स्रोत ) के पक्ष में सबूत इकट्ठा करने की अनुमति नहीं देता है ( स्रोत )

मुझे यह दावा कई स्थानों पर बार-बार दिखाई देता है, लेकिन मुझे इसके लिए औचित्य नहीं मिल रहा है। हम एक बड़े अध्ययन करते हैं और हम तो शून्य परिकल्पना के खिलाफ सांख्यिकीय रूप से महत्वपूर्ण सबूत नहीं मिल रहा है , कि सबूत नहीं है के लिए रिक्त परिकल्पना?


3
लेकिन हम अशक्त परिकल्पना को सही मानते हुए अपना विश्लेषण शुरू करते हैं ... यह धारणा गलत हो सकती है। शायद हमारे पास पर्याप्त शक्ति नहीं है लेकिन इसका मतलब यह नहीं है कि धारणा सही है।
स्मॉलचेयर

13
यदि आपने इसे नहीं पढ़ा है, तो मैं अत्यधिक सलाह देता हूं कि जैकब कोहेन की पृथ्वी गोल है (p <.05) । वह जोर देकर कहता है कि एक बड़े पर्याप्त नमूने के आकार के साथ, आप किसी भी अशक्त परिकल्पना को अस्वीकार कर सकते हैं। वह प्रभाव आकार और आत्मविश्वास अंतराल का उपयोग करने के पक्ष में भी बोलता है, और वह बायेसियन विधियों की एक साफ प्रस्तुति देता है। इसके अलावा, यह पढ़ने के लिए एक शुद्ध खुशी है!
डोमिनिक कोमोटिस

7
अशक्त परिकल्पनाएं केवल गलत हो सकती हैं। ... अशक्त अस्वीकार करने के लिए पर्याप्त पर्याप्त विकल्प के खिलाफ सबूत नहीं है।
Glen_b

3
आँकड़े देखें ।stackexchange.com/questions/85903 । लेकिन यह भी देखना stats.stackexchange.com/questions/125541 । यदि "एक बड़े अध्ययन" को करने से आपका मतलब है "ब्याज के न्यूनतम प्रभाव का पता लगाने के लिए उच्च शक्ति होने के लिए पर्याप्त बड़ा", तो अस्वीकार करने में विफलता को अशक्त मानने के रूप में व्याख्या की जा सकती है।
अमीबा का कहना है कि मोनिका

7
हेमपेल की पुष्टि के विरोधाभास पर विचार करें। एक कौवे की जांच करना और यह देखना कि वह काला है "सभी कौवे काले हैं" के लिए समर्थन है। लेकिन तार्किक रूप से एक गैर-काली वस्तु की जांच करना, और यह देखना कि यह एक कौवा नहीं है, को भी प्रस्ताव का समर्थन करना चाहिए क्योंकि बयान "सभी कौवे काले हैं" और "सभी गैर-काली वस्तुएं कौवे नहीं हैं" तार्किक रूप से समतुल्य हैं ... संकल्प यह है कि गैर-काली वस्तुओं की संख्या कौवे की संख्या की तुलना में बहुत अधिक है, इसलिए एक काला कौवा प्रस्ताव को जो समर्थन देता है वह उस छोटे समर्थन की तुलना में अधिक बड़ा होता है जो एक गैर-काला गैर-क्रो देता है।
बेन

जवाबों:


63

अशक्त परिकल्पना को अस्वीकार करना इस बात का प्रमाण है कि अशक्त परिकल्पना सत्य है, लेकिन यह विशेष रूप से अच्छा प्रमाण नहीं हो सकता है, और यह निश्चित रूप से शून्य परिकल्पना को सिद्ध नहीं करता है।

आइए एक छोटा चक्कर लगाएं। एक पल के लिए पुराने क्लिच पर विचार करें:

अभावों का अभाव अनुपस्थिति का प्रमाण नहीं है।

इसकी लोकप्रियता के बावजूद, यह कथन बकवास है। यदि आप किसी चीज़ की तलाश करते हैं और उसे पाने में असफल रहते हैं, तो यह बिल्कुल सबूत है कि यह नहीं है। यह कितना अच्छा है यह इस बात पर निर्भर करता है कि आपकी खोज कितनी गहन थी। एक सरसरी खोज कमजोर साक्ष्य प्रदान करती है; एक संपूर्ण खोज मजबूत सबूत प्रदान करती है।

अब, परिकल्पना परीक्षण पर वापस। जब आप एक परिकल्पना परीक्षण चलाते हैं, तो आप सबूत की तलाश में रहते हैं कि अशक्त परिकल्पना सच नहीं है। आप इसे प्राप्त नहीं करते हैं, तो वह निश्चित रूप से सबूत है कि शून्य परिकल्पना है सच है, लेकिन यह है कि सबूत कैसे मजबूत है? यह जानने के लिए, आपको यह जानना होगा कि यह कितनी संभावना है कि जिन सबूतों ने आपको अशक्त परिकल्पना को खारिज कर दिया होगा वे आपकी खोज को समाप्त कर सकते हैं। यही है, आपके परीक्षण पर झूठी नकारात्मक की संभावना क्या है? यह परीक्षण की शक्ति, से संबंधित है (विशेष रूप से, यह पूरक है, 1- ।)βββ

अब, परीक्षण की शक्ति और इसलिए झूठी नकारात्मक दर, आमतौर पर उस प्रभाव के आकार पर निर्भर करती है जिसे आप खोज रहे हैं। छोटे लोगों की तुलना में बड़े प्रभावों का पता लगाना आसान होता है। इसलिए, प्रयोग के लिए कोई एकल नहीं है , और इसलिए इस सवाल का कोई निश्चित जवाब नहीं है कि अशक्त परिकल्पना के लिए सबूत कितना मजबूत है। एक और तरीका रखो, हमेशा कुछ प्रभाव आकार छोटा होता है जिसे प्रयोग द्वारा खारिज नहीं किया जाता है।β

यहां से, आगे बढ़ने के दो तरीके हैं। कभी-कभी आप जानते हैं कि आप कुछ सीमा से छोटे प्रभाव के बारे में परवाह नहीं करते हैं। उस स्थिति में, आपको संभवतः अपने प्रयोग को फिर से नाम देना चाहिए जैसे कि शून्य परिकल्पना यह है कि प्रभाव उस सीमा से ऊपर है, और फिर वैकल्पिक परिकल्पना का परीक्षण करें कि प्रभाव सीमा से नीचे है। वैकल्पिक रूप से, आप प्रभाव के विश्वसनीय आकार पर सीमा निर्धारित करने के लिए अपने परिणामों का उपयोग कर सकते हैं। आपका निष्कर्ष यह होगा कि प्रभाव का आकार कुछ अंतराल में होता है, कुछ संभावना के साथ। यह दृष्टिकोण एक बायेसियन उपचार से बस एक छोटा कदम दूर है, जिसके बारे में आप अधिक जानना चाहते हैं, यदि आप अक्सर खुद को इस तरह की स्थिति में पाते हैं।

अनुपस्थित परीक्षण के साक्ष्य को छूने वाले संबंधित प्रश्न का एक अच्छा उत्तर है , जो आपको उपयोगी लग सकता है।


9
आइए साथ एक परिकल्पना परीक्षण पर विचार करें , और एक गैर-महत्वपूर्ण p- मान के साथ। आपके तर्क के अनुसार, यह लिए कुछ सबूत है । , और एक गैर-महत्वपूर्ण p- मान के साथ एक और परिकल्पना परीक्षण , फिर लिए कुछ सबूत प्रदान करेगा । यह सबूत स्पष्ट रूप से विरोधाभासी हैं। ˉ एक्स = 3 μ 2 एच 1 : μ < 4 ˉ एक्स = 3 μ 4H1:μ>2x¯=3μ2H1:μ<4x¯=3μ4
मैकंड

4
मुझे यकीन नहीं है कि मैं आपके तर्क का पालन करूंगा। जो मैं बता सकता हूं कि आप दो प्रयोगों का वर्णन कर रहे हैं, जिनमें से प्रत्येक दो परस्पर असंगत परिकल्पनाओं में से एक के लिए आपूर्ति (संभवतः काफी कमजोर) सबूत है। यह आश्चर्य की बात क्यों है?
कोई

8
एक अन्य उदाहरण: आम । कि आप सबूत हैं आप अस्वीकार करने के लिए यह इसका मतलब यह है में विफल रहते हैं कि असली लाइन पर अन्य सभी मूल्यों के बीच, सच मतलब है वास्तव में 0 ..? यह उत्तर भ्रामक है! H0:μ=0
टिम

3
मुझे आपके साक्ष्य का खाता पसंद है - यह एक मॉडल बनाम दूसरे के डेटा के समर्थन को निर्धारित करने के रूप में बेयस कारक को जल्दी से ले जाता है। क्या प्रमाण देता है या खिलाफ ? वैसे यह आपके लिए आपके पूर्व घनत्व पर निर्भर करता है : यदि आपको लगता है कि सिर्फ 2 के तहत कहीं या 3 से कहीं अधिक है, तो डेटा इसके लिए सबूत प्रदान करता है; अगर आपको लगता है कि समान रूप से -10 और 10 के बीच कहीं भी होने की संभावना है, तो डेटा इसके खिलाफ सबूत प्रदान करता है। लेकिन एक निरंतर विश्लेषण में आपके विश्वास की डिग्री एक संख्या द्वारा प्रतिनिधित्व नहीं की जाती है, इसलिए सबूत की अवधारणा क्या लागू होती है? μ 2 μ μ μx¯=3μ2μμμ
स्कॉर्टची - मोनिका को बहाल करना

6
यह मुझे रीमैन परिकल्पना की याद दिलाता है। हमने देखा और वास्तविक भाग 1/2 के साथ लाइन के बाहर गैर तुच्छ शून्य की तलाश की, लेकिन कोई भी नहीं मिला। और जब तक हम रीमैन परिकल्पना को सच नहीं मानते हैं क्योंकि हम इसे साबित नहीं करते हैं, अधिकांश गणितज्ञों का मानना ​​है कि यह सच है और बहुत सारे परिणाम हैं जो कि रीमैन की परिकल्पना के सच होने पर बहुत हद तक सही हैं :) तो इस मामले में हमारी व्याख्या की गई है अनुपस्थिति के साक्ष्य के रूप में अनुपस्थिति
चींटी

29

एनएचएसटी पी-मूल्यों पर निर्भर करता है, जो हमें बताता है: शून्य परिकल्पना को देखते हुए यह सच है कि क्या संभावना है कि हम अपने डेटा (या अधिक चरम डेटा) का निरीक्षण करें?

हम मानते हैं कि अशक्त परिकल्पना सत्य है - यह एनएचएसटी में बेक किया गया है कि अशक्त परिकल्पना 100% सही है। छोटे पी-मान हमें बताते हैं कि, यदि शून्य परिकल्पना सच है, तो हमारे डेटा (या अधिक चरम डेटा) की संभावना नहीं है।

लेकिन एक बड़ा पी-मूल्य हमें क्या बताता है? यह हमें बताता है कि, शून्य परिकल्पना को देखते हुए, हमारे डेटा (या अधिक चरम डेटा) की संभावना है।

सामान्यतया, P (A | B), P (B | A)।

कल्पना कीजिए कि आप अशक्त परिकल्पना के साक्ष्य के रूप में एक बड़ा पी-मान लेना चाहते हैं। आप इस तर्क पर भरोसा करेंगे:

  • यदि अशक्त सत्य है, तो एक उच्च पी-मान होने की संभावना है। ( अपडेट: सच नहीं। नीचे टिप्पणी देखें। )
  • एक उच्च पी-मूल्य पाया जाता है।
  • इसलिए, नल सत्य है।

यह अधिक सामान्य रूप लेता है:

  • यदि B सत्य है, तो A की संभावना है।
  • A होता है।
  • इसलिए, B सत्य है।

हालांकि, यह एक उदाहरण द्वारा देखा जा सकता है:

  • अगर बाहर बारिश हुई, तो मैदान गीला होने की संभावना है।
  • जमीन गीली है।
  • इसलिए बाहर बारिश हुई।

जमीन बहुत अच्छी तरह से गीली हो सकती है क्योंकि बारिश हुई थी। या यह एक स्प्रिंकलर के कारण हो सकता है, कोई अपने गटर की सफाई करता है, एक पानी मुख्य टूट जाता है, आदि अधिक चरम उदाहरण ऊपर दिए गए लिंक में पाए जा सकते हैं।

यह समझ पाना एक बहुत ही कठिन अवधारणा है। यदि हम अशक्त के लिए सबूत चाहते हैं, तो बायेसियन निष्कर्ष की आवश्यकता है। मेरे लिए, इस तर्क की सबसे सुलभ व्याख्या राउडर एट अल द्वारा की गई है। (2016)। कागज में एक नि: शुल्क दोपहर का भोजन है? संज्ञानात्मक विज्ञान में विषयों में प्रकाशित , 8, पीपी 520-547।


3
मुझे यह पसंद नहीं है कि आपके सभी उदाहरण "एक्स सच है" समाप्त करते हैं। किसी चीज के लिए सबूत होना, 100% निश्चितता के साथ किसी चीज के समापन के समान नहीं है। अगर मैं बाहर जाता हूं और मैदान गीला होता है, तो यह "बारिश हुई" का सबूत है। यह सबूत इस बात की अधिक संभावना है कि बारिश हुई है।
एट जुवोनेन

सही है। वह रूडर एट अल। कागज जो मैंने अपने उत्तर के अंत में जोड़ा है, उसमें ऐसे उदाहरण नहीं हैं जिनमें निश्चितता के साथ निष्कर्ष हैं।
मार्क व्हाइट

6
@AtteJuvonen हां, हमारे पास बारिश के लिए कुछ सबूत हैं, लेकिन हम नहीं जानते कि यह कितनी संभावना है, इसलिए आप केवल यह निष्कर्ष निकाल सकते हैं कि "यह बारिश हो सकती थी, या यह कुछ और हो सकता है, जिससे मैदान गीला हो सकता है" । तो आपके पास अनिर्णायक सबूत हैं। केवल बायेसियन आंकड़ों के आधार पर आप विपरीत तर्क दे सकते हैं।
टिम

3
मैं आपके निष्कर्ष से असहमत हूं "यदि हम अशक्त के लिए सबूत चाहते हैं, तो बायेसियन निष्कर्ष की आवश्यकता है"; अध्ययन है कि आप उद्धृत कर रहे हैं Wagenmakers से है जो Bayesian आंकड़ों का एक बहुत मुखर हार्ड-कोर प्रस्तावक है तो जाहिर है कि वे तर्क देते हैं। लेकिन वास्तव में एक व्यक्ति को अक्सर समानतावादी प्रतिमान में "शून्य के लिए" सबूत मिल सकता है, उदाहरण के लिए तुल्यता के लिए TOST (दो एकतरफा परीक्षण) का आयोजन करके। (cc @AtteJuvonen)।
अमीबा का कहना है कि मोनिका

10
"यदि अशक्त सत्य है, तो उच्च पी-मान होने की संभावना है।" - यह सही नहीं है। यदि शून्य परिकल्पना सच है, तोpU[0,1] , इसलिए उच्च मान शून्य परिकल्पना के तहत कम लोगों की तुलना में अधिक संभावना नहीं है। आप केवल यह कह सकते हैं कि एक उच्च मान अन्य परिकल्पनाओं की तुलना में अशक्त होने की अधिक संभावना है - लेकिन परिकल्पनाएं या तो पकड़ती हैं या नहीं, इसलिए परिकल्पना संभावना स्थान नहीं है जिसमें हम काम कर रहे हैं। जब तक हम एक बायेसियन प्रतिमान में काम नहीं करते! और यहीं से आपका तर्क दुर्भाग्य से टूट जाता है। पीpp
एस। कोलासा - मोनिका

14

धारणा के साथ क्या गलत है, इसे समझने के लिए, निम्न उदाहरण देखें:

एक चिड़ियाघर में एक बाड़े की कल्पना करें जहां आप इसके निवासियों को नहीं देख सकते हैं। आप उस परिकल्पना का परीक्षण करना चाहते हैं कि यह पिंजरे में केला डालकर बंदरों द्वारा बसाया गया है और अगले दिन चला गया है या नहीं, इसकी जांच करें। यह बढ़ाया सांख्यिकीय महत्व के लिए एन बार दोहराया जाता है।

अब आप एक शून्य परिकल्पना तैयार कर सकते हैं: यह देखते हुए कि बाड़े में बंदर हैं, यह बहुत संभावना है कि वे केले पाएंगे और खाएंगे, इसलिए यदि केले प्रत्येक दिन अछूते हैं, तो यह बहुत ही अनुचित है कि अंदर कोई बंदर हैं।

लेकिन अब आप देखते हैं कि केले हर दिन (लगभग) चले गए हैं। क्या यह आपको बताता है कि बंदर अंदर हैं?

बेशक, क्योंकि अन्य जानवर भी हैं जो केले को पसंद करते हैं, या शायद कुछ चौकस ज़ुकेर हर शाम केले को हटा देते हैं।

तो इस तर्क में क्या गलती है? मुद्दा यह है कि केले के गलने की संभावना के बारे में आपको कुछ भी नहीं पता है अगर अंदर बंदर नहीं हैं। अशक्त परिकल्पना की पुष्टि करने के लिए, गायब हो जाने वाले केले की संभावना छोटी होनी चाहिए यदि अशक्त परिकल्पना गलत है, लेकिन यह मामला होने की आवश्यकता नहीं है। वास्तव में, घटना समान रूप से संभावित (या इससे भी अधिक संभावित) हो सकती है यदि अशक्त परिकल्पना गलत है।

इस संभावना के बारे में जानने के बिना, आप वास्तव में शून्य परिकल्पना की वैधता के बारे में कुछ नहीं कह सकते हैं। यदि ज़ुकेपर्स प्रत्येक शाम सभी केले निकालते हैं, तो प्रयोग पूरी तरह से बेकार है, भले ही यह पहली नज़र में लगता है कि आपने शून्य परिकल्पना की पुष्टि की है।


यह स्वीकृत उत्तर होना चाहिए।
एमिली एल।

2
@amoeba इस मामले में, शून्य हाइप यह होगा कि बंदर पिंजरे में हैं। ऑल्ट हाइप यह होगा कि कोई भी बंदर पिंजरे में नहीं है। मेरे द्वारा एकत्र किए गए नमूने प्रत्येक सुबह "केले चले गए" और "केले अभी भी" हैं। बंदरों और केले को खोजने की उनकी क्षमता के बारे में कई धारणाएं बनाते हुए, मैं इस संभावना की गणना कर सकता हूं कि मैंने पिंजरे में बंदरों के साथ वास्तविक परिणाम देखा होगा। यदि केले अभी भी अक्सर होते हैं, तो मैं अशक्त हाइप को अस्वीकार कर दूंगा। यदि केले हमेशा चले जाते हैं, तो यह अशक्त हाइप पर फिट बैठता है, लेकिन यह साबित नहीं होता है कि बंदर पिंजरे में हैं।
थर्न

1
@amoeba मुझे यकीन नहीं है कि यह संभव है कि आपके टी-टेस्ट परिदृश्य में सीधे बंदर उदाहरण का अनुवाद किया जाए। मेरे ज्ञान के लिए, शून्य परिकल्पना परीक्षण का आम तौर पर मतलब होता है कि मार्क व्हाइट ने भी अपने उत्तर में क्या लिखा है: "शून्य परिकल्पना को देखते हुए यह सच है कि क्या संभावना है कि हम अपने डेटा (या अधिक चरम डेटा) का निरीक्षण करें?"। आपका t-परिक्षण परिदृश्य इसका एक विशिष्ट मामला है, लेकिन मैं वर्तमान में यह नहीं देखता कि इस परिदृश्य का सामान्यीकरण कैसे किया जा सकता है। मेरी आंत की भावना से, मैं कहूंगा कि आपका परिदृश्य और बंदर उदाहरण दो अलग-अलग तरीके से परिकल्पना परीक्षण हैं जो सीधे एक दूसरे के लिए मैप नहीं किए जा सकते हैं।
थर्न

1
यदि ऐसा @Nebr, तो मैं फिर से आपके बंदर उदाहरण के अर्थ के बारे में बहुत उलझन में हूं। टी-टेस्ट शायद सबसे आम परिकल्पना परीक्षण है; मैंने अपनी टिप्पणी में इसका उल्लेख सिर्फ इसलिए किया क्योंकि यह एक परीक्षण का ऐसा विशिष्ट उदाहरण है। यदि आपका बंदर उदाहरण इस पर लागू नहीं है (जैसा कि आप कहते हैं) इसके लिए - ठेठ! - स्थिति, तो मैं इसके अर्थ के बारे में हैरान हूं। वास्तव में, यदि आप कहते हैं कि टी-टेस्ट और बंदर का उदाहरण "परिकल्पना परीक्षण के दो अलग-अलग तरीके" हैं, तो क्या आप सांख्यिकीय परीक्षण का एक उदाहरण दे सकते हैं जो आपके बंदर उदाहरण का "तरीका" है? आपका बंदर उदाहरण वास्तव में किसकी उपमा है?
अमीबा का कहना है कि मोनिका

1
@Nebr मैं मानता हूँ कि यह एक सामान्य प्रश्न है। लेकिन अगर आप मुझे असली सांख्यिकीय परीक्षण का एक भी उदाहरण नहीं दे सकते हैं जिसमें आपके बंदर के उदाहरण के समान संपत्ति होगी, तो मुझे खेद है लेकिन मुझे इस धागे के लिए आपके बंदर उदाहरण पर बहुत अप्रासंगिक विचार करना होगा। मैं यह नहीं कह रहा हूं कि बंदर के उदाहरण को विशेष रूप से टी-टेस्ट के अनुरूप होना चाहिए। लेकिन यह कुछ के अनुरूप है !!
अमीबा का कहना है कि मोनिका

14

अपने प्रसिद्ध शोधपत्र में, सर्वाधिक प्रकाशित शोध निष्कर्ष क्यों झूठे हैं , आइओनिडिस ने बायेसियन तर्क और आधार दर-पतन का तर्क दिया कि अधिकांश निष्कर्ष झूठे-सकारात्मक हैं। कुछ समय बाद, अध्ययन के बाद की संभावना कि एक विशेष शोध परिकल्पना सच है, अन्य बातों के साथ - उक्त परिकल्पना की पूर्व-अध्ययन संभावना (यानी आधार दर) पर निर्भर करती है।

एक प्रतिक्रिया के रूप में, Moonesinghe et al। (2007) ने उसी रूपरेखा का उपयोग यह दिखाने के लिए किया कि प्रतिकृति एक परिकल्पना के सत्य होने के बाद के अध्ययन की संभावना को बहुत बढ़ा देती है। यह समझ में आता है: यदि कई अध्ययन एक निश्चित खोज को दोहरा सकते हैं, तो हम अधिक निश्चित हैं कि अनुमानित परिकल्पना सच है।

मैंने Moonesinghe et al में सूत्रों का उपयोग किया। (2007) एक ग्राफ बनाने के लिए जो एक खोज को दोहराने में विफलता के मामले में अध्ययन के बाद की संभावना को दर्शाता है। मान लें कि एक निश्चित शोध परिकल्पना में 50% के सच होने की पूर्व-अध्ययन संभावना है। इसके अलावा, मैं मान रहा हूं कि सभी अध्ययनों में कोई पूर्वाग्रह नहीं है (अवास्तविक!) में 80% की शक्ति है और 0.05 के का उपयोग करें ।αअध्ययन के बाद की संभावना

ग्राफ से पता चलता है कि यदि 10 में से कम से कम 5 अध्ययन महत्व तक पहुंचने में विफल रहते हैं, तो हमारे अध्ययन के बाद की संभावना है कि परिकल्पना सच है लगभग 0. अधिक अध्ययनों के लिए समान संबंध मौजूद हैं। यह खोज सहज ज्ञान युक्त भी बनाती है: एक प्रभाव को खोजने में बार-बार असफलता हमारे विश्वास को मजबूत करती है कि प्रभाव सबसे अधिक गलत है। यह तर्क @RPL द्वारा स्वीकृत उत्तर के अनुरूप है।

दूसरे परिदृश्य के रूप में, मान लें कि अध्ययन में केवल 50% की शक्ति है (सभी के बराबर)।अध्ययन के बाद संभाव्यता_ pow50

अब हमारे अध्ययन के बाद की संभावना अधिक धीरे-धीरे कम हो जाती है, क्योंकि प्रत्येक अध्ययन में प्रभाव को खोजने के लिए केवल कम शक्ति थी, अगर यह वास्तव में मौजूद था।


ध्यान दें कि आपको उन मामलों से अशक्त परिकल्पना के बारे में सभी सबूत मिलते हैं जहां एक परीक्षण इस परिकल्पना को विफल करता है। लेकिन ओपी की धारणा यह थी कि परीक्षण अशक्त परिकल्पना की पुष्टि करते हैं ("यदि हम एक बड़ा अध्ययन करते हैं और हमें शून्य परिकल्पना के खिलाफ सांख्यिकीय रूप से महत्वपूर्ण प्रमाण नहीं मिलते हैं, तो क्या यह शून्य परिकल्पना का प्रमाण नहीं है?")। यह आपके आरेखों के बाएं-सबसे हिस्से से मेल खाता है, और इस तरह एक ऐसे मामले में जहां प्रभाव की संभावना अभी भी 50% है (या, सामान्य रूप से, पूर्व-अध्ययन संभावना), इसलिए आपने कुछ भी प्राप्त नहीं किया है।
थर्न

@ निब मुझे समझ में नहीं आता। यदि हम 1 बड़ा, अच्छी तरह से संचालित अध्ययन (95% शक्ति कहते हैं) करते हैं और हम अशक्त परिकल्पना (यानी एक सांख्यिकीय परिकल्पना परीक्षण 5% -वेल पर महत्वपूर्ण नहीं है) के खिलाफ सबूत पाने में विफल रहते हैं, तो हमारे बाद के अध्ययन की संभावना उल्लेखित ढांचे में 0.05 हो (50% की पूर्व-अध्ययन संभावना के साथ)।
COOLSerdash

1
@Nebr आपकी अंतिम टिप्पणी का कोई मतलब नहीं है: यदि परिणाम महत्वपूर्ण नहीं है, तो यह संभवतः "गलत सकारात्मक" नहीं हो सकता है।
अमीबा का कहना है कि मोनिका

1
@ नीब्र If you have a negative, you found evidence against the null- क्या? "नकारात्मक" शब्द का ठीक विपरीत अर्थ है। एक महत्वपूर्ण पी-मूल्य को "सकारात्मक" परिणाम कहा जाता है; एक गैर-महत्वपूर्ण एक "नकारात्मक" है।
अमीबा का कहना है कि मोनिका

1
@Nebr 100% शक्ति का मतलब यह नहीं है कि "यदि H0 सत्य है, तो हम यह सुनिश्चित कर सकते हैं कि हम हमेशा H1 देखेंगे"। इसका मतलब है कि अगर एच 1 सच है, तो हम हमेशा एच 1 देखेंगे। मैं आपकी टिप्पणी को आगे पढ़ने का प्रयास नहीं करूंगा, क्योंकि हर वाक्य भ्रामक है।
अमीबा का कहना है कि

12

इसके लिए मैंने जो सबसे अच्छी व्याख्या की है, वह किसी ऐसे व्यक्ति से है जिसका प्रशिक्षण गणित में है।

नल-परिकल्पना महत्व परीक्षण मूल रूप से विरोधाभास द्वारा एक सबूत है: मान , क्या लिए सबूत हैH0H1 ? अगर वहाँ के लिए सबूत है , अस्वीकार और स्वीकार करते हैं । लेकिन अगर लिए कोई सबूत नहीं है , तो यह कहना परिपत्र है कि सत्य है क्योंकि आपने माना कि साथ शुरू करने के लिए सही था।H1H0H1H1H0H0


4
हो सकता है कि आप इस सूत्र को देखें: आंकड़े.stackexchange.com/questions/163957/…

10

यदि आप परिकल्पना परीक्षण के इस परिणाम को पसंद नहीं करते हैं, लेकिन बायेसियन विधियों के लिए पूरी छलांग लगाने के लिए तैयार नहीं हैं, तो एक आत्मविश्वास अंतराल के बारे में कैसे?

मान लीजिए कि आप बार एक सिक्का फ्लिप करते हैं और सिर देखते हैं, जिससे आप यह कहते हैं कि सिर की संभावना के लिए 95% विश्वास अंतराल । 4207820913[0.492,0.502]

आप नहीं कहा है आप इसका प्रमाण देखा है कि यह वास्तव में , लेकिन सबूत कितने करीब इसे करने के लिए हो सकता है के बारे में कुछ विश्वास से पता चलता है ।1212


2
एक विश्वास अंतराल के बारे में बेयसियन क्या है?
kjetil b halvorsen

3
@kjetilbhalvorsen: एक आत्मविश्वास अंतराल बायेसियन नहीं है (एक विश्वसनीय अंतराल होगा), लेकिन एक आत्मविश्वास अंतराल साक्ष्य के बारे में अधिक जानकारी देता है, फिर एक साधारण परिकल्पना अस्वीकृति / गैर-अस्वीकृति होगी
हेनरी

9

यह कहना बेहतर होगा कि अशक्त परिकल्पना की गैर-अस्वीकृति शून्य परिकल्पना के लिए अपने आप में साक्ष्य नहीं है। एक बार जब हम डेटा की पूर्ण संभावना पर विचार करते हैं, जो अधिक स्पष्ट रूप से डेटा की मात्रा पर विचार करता है, तो एकत्रित डेटा अशक्त परिकल्पना के भीतर गिरने वाले मापदंडों के लिए समर्थन प्रदान कर सकता है।

हालाँकि, हमें अपनी परिकल्पनाओं के बारे में भी ध्यान से सोचना चाहिए। विशेष रूप से, एक बिंदु शून्य परिकल्पना को अस्वीकार करने में विफल होना बहुत अच्छा सबूत नहीं है कि बिंदु शून्य परिकल्पना सच है। वास्तविक रूप से, यह सबूत जमा करता है कि पैरामीटर का सही मूल्य प्रश्न में बिंदु से बहुत दूर नहीं है। बिंदु शून्य परिकल्पना कुछ हद तक बल्कि कृत्रिम निर्माण हैं और ज्यादातर आप वास्तव में विश्वास नहीं करते कि वे वास्तव में सच होंगे।

अशक्त परिकल्पना का समर्थन करने वाले गैर-अस्वीकृति के बारे में बात करना बहुत अधिक उचित हो जाता है, यदि आप सार्थक रूप से अशक्त और वैकल्पिक परिकल्पना को उल्टा कर सकते हैं और यदि ऐसा करते समय आप अपनी नई अशक्त परिकल्पना को अस्वीकार करेंगे। जब आप ऐसा करने की कोशिश करते हैं, तो एक मानक बिंदु शून्य परिकल्पना के साथ, आप तुरंत देखते हैं कि आप कभी भी इसके पूरक को अस्वीकार करने का प्रबंधन नहीं करेंगे, क्योंकि तब आपके उल्टे शून्य परिकल्पना में विचार के तहत बिंदु के करीब मनमाने ढंग से मान शामिल होते हैं।

दूसरी ओर, यदि आप कहते हैं, अशक्त परिकल्पना का परीक्षण करेंवैकल्पिक के खिलाफ एक सामान्य वितरण के मतलब के लिए , फिर किसी भी वास्तविक मूल्य के लिए एक नमूना आकार है - जब तक कि अनुचित रूप से का वास्तविक मूल्य नहीं है या - जिसके लिए हमारे पास लगभग 100% संभावना है यह स्तर विश्वास अंतराल पूरी तरह से या इस अंतराल के बाहर गिर जाएगा । किसी भी परिमित नमूने के आकार के लिए आप निश्चित रूप से विश्वास अंतराल प्राप्त कर सकते हैं जो सीमा के पार स्थित है, उस स्थिति में जो अशक्त परिकल्पना के लिए मजबूत सबूत नहीं है।H0:|μ|δHA:|μ|>δμμδ+δ1α[δ,+δ]


4
+1। यह IMHO का स्वीकृत उत्तर होना चाहिए। मुझे समझ में नहीं आता है कि यह इतने ऊपर क्यों है।
अमीबा का कहना है कि मोनिका

1
@amoeba क्योंकि यह देर से पोस्ट किया गया था, लेकिन मैं सहमत हूं और पहले से ही +1 किया था।
टिम

6

यह इस बात पर निर्भर करता है कि आप भाषा का उपयोग कैसे कर रहे हैं। पियर्सन और नेमन निर्णय सिद्धांत के तहत, यह अशक्त के लिए सबूत नहीं है, लेकिन आप ऐसा व्यवहार करते हैं जैसे कि नल सत्य है।

मोडस टोलेंस से कठिनाई आती है। बायेसियन विधियाँ आगमनात्मक तर्क का एक रूप हैं और, जैसे, अपूर्ण तर्क का एक रूप हैं। अशक्त परिकल्पना विधियाँ मोडस टोलेंस का एक संभाव्य रूप हैं और जैसे कि निवारक तर्क का हिस्सा हैं और इसलिए तर्क का पूर्ण रूप है।

मोडस टोलेंस का रूप है "यदि A सत्य है तो B सत्य है, और B सत्य नहीं है; इसलिए A सत्य नहीं है।" इस रूप में, यह होगा कि यदि नल सत्य है, तो डेटा एक विशेष तरीके से दिखाई देगा, वे उस तरीके से प्रकट नहीं होते हैं, इसलिए (कुछ हद तक आत्मविश्वास) शून्य सही नहीं है (या कम से कम "गलत" है । "

समस्या यह है कि आप चाहते हैं "यदि ए तो बी और बी।" इससे, आप A का अनुमान लगाना चाहते हैं, लेकिन यह मान्य नहीं है। "यदि I तब B," नहीं है तो "नहीं तो A नहीं तो B" को भी एक मान्य स्टेटमेंट नहीं माना जा सकता है। कथन पर विचार करें "यदि यह एक भालू है, तो यह तैर सकता है। यह एक मछली है (भालू नहीं)।" बयानों में गैर-भालू की तैरने की क्षमता के बारे में कुछ नहीं कहा गया है।

संभाव्यता और सांख्यिकी बयानबाजी की एक शाखा है न कि गणित की एक शाखा। यह गणित का भारी उपयोगकर्ता है लेकिन गणित का हिस्सा नहीं है। यह कई कारणों, अनुनय, निर्णय लेने या अनुमान के लिए मौजूद है। यह साक्ष्य की एक अनुशासित चर्चा में बयानबाजी का विस्तार करता है।


1
Neyman और पियर्सन का उल्लेख करने के लिए +1 (देखें । आँकड़े.स्टैकएक्सचेंज . com/questions/125541 )।
अमीबा का कहना है कि मोनिका

5

मैं इसे एक उदाहरण के साथ समझाने की कोशिश करूँगा।

हमें लगता है कि हम अपने मतलब के लिए परीक्षण का एक इरादे से, आबादी से नमूने रहे हैं । हमें माध्य साथ एक नमूना मिलता है । अगर हम एक गैर महत्वपूर्ण पी-मूल्य मिलता है, हम भी गैर महत्वपूर्ण पी मूल्यों अगर हम किसी अन्य रिक्त परिकल्पना के लिए परीक्षण किया था मिलेगा , ऐसा है कि के बीच है और । अब किस मूल्य के लिए हम सबूत है?μx¯H0:μ=μiμiμ0x¯μ

जब हम महत्वपूर्ण पी-मान प्राप्त करते हैं, तो हम किसी विशेष लिए प्रमाण प्राप्त नहीं करते हैं , इसके बजाय यह विरुद्ध एक साक्ष्य है (जिसे लिए सबूत के रूप में देखा जा सकता है) , या स्थिति के आधार पर)। परिकल्पना परीक्षण की प्रकृति किसी चीज के लिए सबूत नहीं देती है, यह केवल किसी चीज के खिलाफ करती है, यदि वह ऐसा करती है।H1:μ=MH0:μ=μ0μμ0μ<μ0μ>μ0


"अब हमारे पास किस मूल्य के प्रमाण हैं?" - हमारे पास नमूना माध्य के करीब मूल्यों के लिए मजबूत सबूत हैं और नमूना माध्य से आगे मूल्यों के लिए कमजोर साक्ष्य हैं। कितना मजबूत या कमजोर नमूना आकार और विचरण पर निर्भर करता है। क्या इस व्याख्या में कुछ गड़बड़ है?
एट जुवोनेन

हाँ यह एक गलत व्याख्या है। पी मूल्य शून्य परिकल्पना के सही होने की संभावना नहीं है, या अशक्त परिकल्पना के पक्ष में साक्ष्य की ताकत है। इसी तरह, आप अंतराल के मध्य में नमूना माध्य के साथ एक अंतराल अनुमान लगा सकते हैं, लेकिन इसका मतलब यह नहीं है कि जनसंख्या के अंतराल के मध्य के करीब होने की उच्च संभावना है। आपके प्रश्न के लिए डोमिनिक कोम्टिस की टिप्पणी में इस गलत व्याख्या के बारे में एक अच्छी व्याख्या का संदर्भ है।
मैकॉन्ड

"इसका मतलब यह नहीं है कि आबादी के बीच अंतराल के बीच होने की अधिक संभावना है।" - यह सही नहीं हो सकता। मैंने पेपर पढ़ा, लेकिन इसे ठीक करने के लिए कुछ भी नहीं मिला।
जुवोनेन

विश्वास अंतराल के मध्य , जो उच्च संभावना के साथ मनाया नमूना मतलब उपज होगा से मेल खाती है । लेकिन यह कथन के समतुल्य नहीं है: " मध्य के करीब " के पास सही अर्थ होने की अधिक संभावना है "। जैसा कि कई बार दूसरों ने कहा है: । μμP(A|B)P(B|A)
मैकॉन्ड

4

छोटे डेटासेट (नीचे सचित्र) पर विचार करें, जिसका अर्थ , का कहना है कि आपने , जहां साथ दो-पूंछ वाले -est का आयोजन किया है । परीक्षण साथ महत्वहीन प्रतीत होता है । क्या यह दर्शाता है कि आपका सच है? यदि आपने खिलाफ परीक्षण किया है तो क्या होगा ? के बाद से वितरण सममित है, परीक्षण के लिए एक समान हो जाएंगे -value। तो आपके पास लगभग उतने ही सबूत हैं कि और उस ।x¯0tH0:x¯=μμ=0.5p>0.05H0μ=0.5tpμ=0.5μ=0.5

दो वैकल्पिक परिकल्पनाएँ

ऊपर के उदाहरण है कि छोटे से पता चलता -values हमें में विश्वास से दूर ले और है कि उच्च -values सुझाव है कि हमारे डेटा किसी भी तरह से अधिक निरंतर है , की तुलना में । यदि आपने इस तरह के कई परीक्षण किए हैं, तो आप ऐसे पा सकते हैं, जो हमारे डेटा को सबसे अधिक संभावना देता है और वास्तव में आप अर्ध- अधिकतम संभावना अनुमान का उपयोग कर रहे होंगे । MLE के विचार है कि आप इस तरह के मूल्य के लिए की तलाश है कि दिए गए अपने डेटा को देख की संभावना अधिकतम , क्या संभावना समारोह की ओर जाता हैpH0pH0 H1μμμ

L(μ|X)=f(X|μ)

MLE लिए बिंदु अनुमान खोजने का एक मान्य तरीका है , लेकिन यह आपको आपके डेटा दिए गए के अवलोकन की संभावना के बारे में कुछ नहीं बताता है । आपने जो किया वह लिए एक एकल मान लिया और आपके द्वारा दिए गए डेटा के अवलोकन की संभावना के बारे में पूछा। जैसा कि पहले ही दूसरों ने देखा है, । जानने के लिए हम तथ्य यह है कि हम के लिए अलग उम्मीदवार मूल्यों के खिलाफ परीक्षण के लिए खाते में करने की आवश्यकता होगी । यह बेयस प्रमेय की ओर जाता हैμ^μ^μ^f(μ|X)f(X|μ)f(μ|X)μ^

f(μ|X)=f(X|μ)f(μ)f(X|μ)f(μ)dμ

पहला, विचार करता है कि कैसे अलग-अलग होने की संभावना की प्राथमिकता है (यह एक समान हो सकता है, जो MLE के अनुरूप परिणाम देता है) और दूसरा, इस तथ्य के लिए सामान्य करता है कि आपने लिए अलग-अलग उम्मीदवारों पर विचार किया था । इसके अलावा, यदि आप संभाव्य शब्दों में बारे में पूछते हैं, तो आपको इसे एक यादृच्छिक चर के रूप में विचार करने की आवश्यकता है, इसलिए यह बायेसियन दृष्टिकोण अपनाने का एक और कारण है।μμ^μ

समापन, परिकल्पना परीक्षण आपको बताता है कि अधिक होने की संभावना है तो , लेकिन चूंकि प्रक्रिया की जरूरत है कि आप मान लें कि सत्य है और इसके लिए एक विशिष्ट मूल्य चुनना है। एक सादृश्य देने के लिए, कल्पना करें कि आपका परीक्षण एक अणु है। यदि आप उससे पूछते हैं, "मैदान गीला है, तो क्या यह संभव है कि बारिश हो रही थी?" , वह जवाब देगी: "हाँ, यह संभव है, 83% मामलों में जब बारिश हो रही थी, तो मैदान गीला हो गया" । यदि आप उससे फिर से पूछते हैं, "क्या यह संभव है कि कोई व्यक्ति जमीन पर पानी गिराए?" , वह जवाब देती है "यकीन है, यह भी संभव है, 100% मामलों में जब कोई जमीन पर पानी गिराता है, तो यह गीला हो जाता है"H1H0H0, आदि यदि आप उससे कुछ संख्याएँ माँगते हैं, तो वह उन्हें आपको दे देगी, लेकिन संख्याएँ तुलनात्मक नहीं होंगी । समस्या यह है कि परिकल्पना परीक्षण / ओरेकल एक फ्रेमवर्क में संचालित होता है, जहां वह केवल सवालों के लिए निर्णायक जवाब दे सकता है, यदि डेटा कुछ परिकल्पना के अनुरूप है , अन्य तरीके से नहीं, क्योंकि आप अन्य परिकल्पनाओं पर विचार नहीं कर रहे हैं।


2

आइए एक सरल उदाहरण का अनुसरण करें।

मेरी अशक्त परिकल्पना यह है कि मेरा डेटा सामान्य वितरण का अनुसरण करता है। वैकल्पिक परिकल्पना यह है कि मेरे डेटा के लिए वितरण सामान्य नहीं है।

मैं [0,1] पर एक समान वितरण से दो यादृच्छिक नमूने खींचता हूं। मैं सिर्फ दो नमूनों के साथ बहुत कुछ नहीं कर सकता, इस प्रकार मैं अपनी अशक्त परिकल्पना को अस्वीकार नहीं कर पाऊंगा।

क्या इसका मतलब है कि मैं अपने डेटा को सामान्य वितरण के बाद समाप्त कर सकता हूं? नहीं, यह एक समान वितरण है !!

समस्या यह है कि मैंने अपनी अशक्त परिकल्पना में सामान्यता की धारणा बना ली है। इस प्रकार, मैं यह निष्कर्ष नहीं निकाल सकता कि मेरी धारणा सही है क्योंकि मैं इसे अस्वीकार नहीं कर सकता।


3
मुझे नहीं लगता कि 2 नमूनों वाला एक अध्ययन "अध्ययन" के रूप में योग्य है। जैसे ही हम उचित संख्या में डेटा बिंदु खींचते हैं, यह उदाहरण काम नहीं करता है। यदि हम 1000 डेटा पॉइंट बनाते हैं और वे एक समान वितरण की तरह दिखते हैं, तो हमारे पास हमारी अशक्त परिकल्पना के खिलाफ सबूत हैं। यदि हम 1000 डेटा पॉइंट बनाते हैं और वे एक सामान्य वितरण की तरह दिखते हैं, तो हमारे पास हमारी अशक्त परिकल्पना के सबूत हैं।
जुवोनेन

1
@AtteJuvonen मेरा उत्तर यह परिभाषित करने का प्रयास नहीं है कि अध्ययन क्या होना चाहिए। मैं बस प्रश्न के लिए सांख्यिकीय शक्ति की कमी को स्पष्ट करने के लिए एक सरल उदाहरण देने की कोशिश करता हूं। हम सभी जानते हैं कि 2 नमूने खराब हैं।
स्मालचैज

4
सही। मैं सिर्फ यह कह रहा हूं कि आपका उदाहरण 2 नमूनों से निष्कर्ष निकालने की समस्या को दर्शाता है। यह अशक्त परिकल्पना के लिए साक्ष्य खींचने की समस्या का वर्णन नहीं करता है।
एट जुवोनेन

2

को अस्वीकार करने के लिए आपके अध्ययन के लिए पर्याप्त सांख्यिकीय शक्ति होना आवश्यक है । यदि आप को अस्वीकार करने में सक्षम हैं , तो आप कह सकते हैं कि आपने निष्कर्ष निकालने के लिए पर्याप्त डेटा एकत्र किया है।H0H0

दूसरी ओर, को अस्वीकार नहीं करना किसी भी डेटा की आवश्यकता नहीं है, क्योंकि यह डिफ़ॉल्ट रूप से सही माना जाता है। इसलिए, यदि आपका अध्ययन को अस्वीकार नहीं करता है, तो यह बताना असंभव है कि कौन सा अधिक संभावित है: सच है, या आपका अध्ययन केवल काफी बड़ा नहीं था ।एच एच H0H0H0


किसी चीज़ के लिए सबूत होना, 100% निश्चितता के साथ कुछ जानने के समान नहीं है। हमें यह जानने की ज़रूरत नहीं है कि " सच है"। यहां तक ​​कि अगर हम को अस्वीकार करते हैं, तब भी हम सत्य है या नहीं "जानते हैं" । एच एच H0H0H0
एट जुवोनेन

0

नहीं, यह सबूत नहीं है जब तक कि आपके पास सबूत नहीं है कि यह सबूत है। मैं प्यारा होने की कोशिश नहीं कर रहा हूं, बल्कि शाब्दिक हूं। आपको केवल इस तरह के डेटा को देखने की संभावना है कि आपकी धारणा सही है। वह सब आपको पी-वैल्यू से मिलता है (यदि ऐसा है, तो पी-वैल्यू खुद मान्यताओं पर आधारित है)।

क्या आप एक अध्ययन प्रस्तुत कर सकते हैं जो यह बताता है कि अध्ययन के लिए कि अशक्त परिकल्पना का समर्थन करने में "विफल" है, अधिकांश परिकल्पना सही साबित होती है? यदि आप टीएचएटी अध्ययन पा सकते हैं, तो आपकी नाक की परिकल्पना को कम से कम करने में आपकी विफलता एक बहुत सामान्यीकृत संभावना को दर्शाती है कि अशक्त सत्य है। मैं शर्त लगा रहा हूँ कि आपके पास वह अध्ययन नहीं है। चूँकि आप पी-मानों के आधार पर अशक्त परिकल्पनाओं से संबंधित होने का प्रमाण नहीं देते हैं, इसलिए आपको केवल खाली हाथ चलना होगा।

आपने मान लिया कि आपका नल उस पी-वैल्यू को प्राप्त करने के लिए सही था, इसलिए पी-वैल्यू आपको केवल डेटा के बारे में, शून्य के बारे में कुछ भी नहीं बता सकता है। उसके बारे में सोचना। यह एक दिशात्मक दिशा - अवधि है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.