सांख्यिकीविदों का कहना है कि गैर-महत्वपूर्ण परिणाम का अर्थ है "आप अशक्त को अस्वीकार नहीं कर सकते" के रूप में शून्य परिकल्पना को स्वीकार करने का विरोध किया?


44

पारंपरिक सांख्यिकीय परीक्षण, दो नमूना टी-टेस्ट की तरह, इस परिकल्पना को खत्म करने की कोशिश पर ध्यान केंद्रित करते हैं कि दो स्वतंत्र नमूनों के कार्य में कोई अंतर नहीं है। फिर, हम एक आत्मविश्वास स्तर चुनते हैं और कहते हैं कि यदि साधनों का अंतर 95% के स्तर से परे है, तो हम अशक्त परिकल्पना को अस्वीकार कर सकते हैं। यदि नहीं, तो हम "अशक्त परिकल्पना को अस्वीकार नहीं कर सकते"। इसका अर्थ यह लगता है कि हम इसे स्वीकार नहीं कर सकते। क्या इसका मतलब है कि हम निश्चित नहीं हैं कि अशक्त परिकल्पना सच है?

अब, मैं एक परीक्षण डिजाइन करना चाहता हूं, जहां मेरी परिकल्पना यह है कि दो नमूनों का एक समारोह एक ही है (जो पारंपरिक आंकड़ों के परीक्षण के विपरीत है जहां परिकल्पना यह है कि दोनों नमूने अलग हैं)। तो, मेरी अशक्त परिकल्पना यह बन जाती है कि दोनों नमूने अलग-अलग हैं। मुझे ऐसे परीक्षण को कैसे डिज़ाइन करना चाहिए? क्या यह कहना सरल होगा कि यदि पी-मान 5% से कम है तो हम इस परिकल्पना को स्वीकार कर सकते हैं कि कोई महत्वपूर्ण अंतर नहीं है?



साधनों का अंतर 95% के स्तर से परे है, हम अशक्त परिकल्पना को अस्वीकार कर सकते हैं। 95% "स्तर" नहीं है यह 100 मामलों (तुलना) में से 95 मामलों में यहां है, नमूना-सांख्यिकीय में भिन्नता नमूना उतार-चढ़ाव के कारण उत्पन्न होती है। इसका मतलब है कि अशक्त अल्फा = .05 पर स्वीकार किया जाता है। 95% स्तर सही नहीं है।
सुभाष सी। डावर

जवाबों:


44

परंपरागत रूप से, शून्य परिकल्पना एक बिंदु मूल्य है। (यह आम तौर पर , लेकिन वास्तव में कोई भी बिंदु मान हो सकता है।) वैकल्पिक परिकल्पना यह है कि सच्चा मूल्य शून्य मान के अलावा कोई भी मूल्य है । क्योंकि एक सतत चर (जैसे कि माध्य अंतर) एक मान पर ले सकता है जो अनिश्चित रूप से शून्य मान के करीब है, लेकिन अभी भी काफी समान नहीं है और इस तरह शून्य परिकल्पना को गलत बनाता है, एक पारंपरिक बिंदु शून्य परिकल्पना साबित नहीं हो सकती है। 0

कल्पना कीजिए कि आपकी अशक्त परिकल्पना , और आपके द्वारा देखे जाने का औसत अंतर 0.01 है । क्या यह मानना ​​उचित है कि शून्य परिकल्पना सच है? तुम अभी तक नहीं जानते; यह जानना उपयोगी होगा कि हमारा आत्मविश्वास अंतराल कैसा दिखता है। मान लें कि आपका 95% आत्मविश्वास अंतराल है ( - 4.99 , 5.01 ) । अब, क्या हमें यह निष्कर्ष निकालना चाहिए कि वास्तविक मूल्य 0 है ? मुझे यह कहते हुए सहज महसूस नहीं होगा, क्योंकि सीआई बहुत व्यापक है, और कई, बड़े गैर-शून्य मूल्य हैं जो हमें उचित रूप से संदिग्ध हो सकते हैं जो हमारे डेटा के अनुरूप हैं। तो मान लें कि हम बहुत अधिक डेटा इकट्ठा करते हैं, और अब हमारा मनाया मतलब अंतर 0.01 है00.01(4.99, 5.01)00.01, लेकिन 95% सीआई । मनाया गया अंतर अंतर वही रहा है (जो वास्तव में हुआ तो यह आश्चर्यजनक होगा), लेकिन विश्वास अंतराल अब शून्य मान को बाहर कर देता है। बेशक, यह सिर्फ एक सोचा प्रयोग है, लेकिन यह बुनियादी विचारों को स्पष्ट करना चाहिए। हम कभी भी यह साबित नहीं कर सकते कि असली मूल्य किसी विशेष बिंदु मूल्य है; हम केवल (संभवतः) यह नापसंद कर सकते हैं कि यह कुछ बिंदु मूल्य है। सांख्यिकीय परिकल्पना परीक्षण में, यह तथ्य कि पी-वैल्यू> 0.05 है (और 95% सीआई में शून्य शामिल है) का मतलब है कि हम निश्चित नहीं हैं कि अशक्त परिकल्पना सच है(0.005, 0.015)

अपने ठोस मामले के लिए, आप एक परीक्षण का निर्माण नहीं कर सकते हैं जहाँ वैकल्पिक परिकल्पना यह है कि औसत अंतर और शून्य परिकल्पना शून्य के अलावा कुछ भी नहीं है। यह परिकल्पना परीक्षण के तर्क का उल्लंघन करता है। यह पूरी तरह से उचित है कि यह आपकी मूल, वैज्ञानिक परिकल्पना है, लेकिन यह एक परिकल्पना परीक्षण स्थिति में आपकी वैकल्पिक परिकल्पना नहीं हो सकती है। 0

तो आप क्या कर सकते हैं? इस स्थिति में, आप तुल्यता परीक्षण का उपयोग करते हैं। (आप इस विषय पर हमारे कुछ सूत्र के माध्यम से टैग पर क्लिक करके पढ़ना चाह सकते हैं ।) विशिष्ट रणनीति दो एक तरफा परीक्षण दृष्टिकोण का उपयोग करना है। बहुत संक्षेप में, आप एक अंतराल का चयन करते हैं जिसके भीतर आप विचार करेंगे कि वास्तविक अंतर अंतर 0 हो सकता है0सभी के लिए आप परवाह कर सकते हैं, तो आप यह निर्धारित करने के लिए एक-पक्षीय परीक्षण करते हैं कि क्या मनाया गया मान उस अंतराल के ऊपरी बाउंड से कम है, और यह देखने के लिए एकतरफा परीक्षण है कि क्या यह कम बाउंड से अधिक है। यदि ये दोनों परीक्षण महत्वपूर्ण हैं, तो आपने इस परिकल्पना को अस्वीकार कर दिया है कि सही मूल्य उस अंतराल के बाहर है जिसकी आप परवाह करते हैं। यदि कोई (या दोनों) गैर-महत्वपूर्ण है, तो आप इस परिकल्पना को अस्वीकार करने में विफल रहते हैं कि सही मूल्य अंतराल के बाहर है।

उदाहरण के लिए, मान लीजिए कि अंतराल के भीतर कुछ भी शून्य के इतना करीब है कि आपको लगता है कि यह अनिवार्य रूप से आपके उद्देश्यों के लिए शून्य के समान है, इसलिए आप इसे अपने मूल परिकल्पना के रूप में उपयोग करते हैं। अब कल्पना करें कि आपको ऊपर वर्णित पहला परिणाम मिलता है। हालांकि 0.01(0.02, 0.02)0.010(0.02, 0.02), जो पहली बार में खराब लग सकता है, लेकिन परिकल्पना परीक्षण के तर्क के साथ पूरी तरह से संगत है।)


1
H0H0

1
H0H0:δ0δ>0<0

1
H0

4
δ0δ0H0:δ0

1
H0:δ<0H0:δ=0δ>0δ<0वास्तव में उनमें से एक (या एक अनिर्णायक परिणाम) को स्वीकार करने के लिए नेतृत्व कर सकते हैं। साथ ही एकतरफा परीक्षण बायेसियन दृष्टिकोण से अधिक समझ में आता है। साथ ही वैज्ञानिक भविष्यवाणी की एक दिशा होनी चाहिए। मुझे लगता है कि मैं यह सोचना शुरू कर देता हूं कि एकतरफा परीक्षण पर्याप्त सराहना नहीं है।
अमीबा का कहना है कि मोनिका

28

उस मामले पर विचार करें जहां अशक्त परिकल्पना है कि एक सिक्का 2 प्रमुख है, अर्थात सिर की संभावना 1 है। अब डेटा एक बार एक सिक्का को फ्लिप करने और सिर को देखने का परिणाम है। यह 1.0 के पी-मूल्य में परिणाम देता है जो प्रत्येक उचित अल्फा से अधिक है। इसका मतलब यह है कि सिक्का 2 प्रमुख है? यह हो सकता है, लेकिन यह एक उचित सिक्का भी हो सकता है और हमने मौका के कारण सिर देखा है (एक उचित सिक्के के साथ समय का 50% होगा)। तो इस मामले में उच्च पी-मूल्य का कहना है कि मनाया गया डेटा पूरी तरह से अशक्त के अनुरूप है, लेकिन यह अन्य संभावनाओं के अनुरूप भी है।

अदालत में "नॉट दोषी" फैसले की तरह ही प्रतिवादी निर्दोष हो सकता है, यह इसलिए भी हो सकता है क्योंकि प्रतिवादी दोषी है लेकिन पर्याप्त सबूत नहीं है। अशक्त परिकल्पना के साथ हम अस्वीकार करने में विफल रहते हैं क्योंकि अशक्त सत्य हो सकता है, या यह हो सकता है कि हमारे पास झूठे होने के बावजूद अस्वीकार करने के लिए पर्याप्त सबूत न हों।


3
मुझे "दोषी नहीं" उदाहरण पसंद है। एक कदम आगे बढ़ते हुए, डीएनए सबूतों के आधार पर उन मामलों को फिर से खोलना, जिन्हें हम नहीं जानते थे कि अतीत में कैसे उपयोग किया जाए और कुछ निष्कर्षों को पलट दिया जाए, एक आदर्श उदाहरण है कि कैसे अधिक डेटा जोड़ना सभी के लिए पर्याप्त सबूत होना आवश्यक है।
थॉमस स्पाइडेल

7

साक्ष्य की अनुपस्थिति एक अनुपस्थिति का सबूत नहीं है (बीएमजे पर एक ऑल्टमैन, ब्लैंड पेपर का शीर्षक)। पी-वैल्यू हमें केवल एक अनुपस्थिति का सबूत देते हैं जब हम उन्हें महत्वपूर्ण मानते हैं। अन्यथा, वे हमें कुछ नहीं बताते हैं। इसलिए, सबूतों का अभाव। दूसरे शब्दों में: हम नहीं जानते और अधिक डेटा मदद कर सकता है।


5

H0

H1H0

H0

यदि हमारे पास दो नमूने हैं जो हम पहचान के रूप में वितरित होने की उम्मीद करते हैं तो हमारी अशक्त परिकल्पना है कि नमूने समान हैं। यदि हमारे पास दो नमूने हैं जो हम (बेतहाशा) अलग होने की उम्मीद करते हैं, तो हमारी अशक्त परिकल्पना है कि वे अलग हैं।


और अगर हमें कोई उम्मीद नहीं है .. तो हो सकता है कि हमें अभी पता नहीं है। इसके अलावा, अगर हम दोनों परिकल्पनाओं को अलग-अलग मानते हैं तो हम कैसे निर्णय नियम काम करेंगे?
ryu576

इस मामले में आपको कोई अपेक्षा नहीं है कि आप दोनों प्रकार की त्रुटियों को छोटा रखना चाहते हैं, लेकिन यह हमेशा संभव नहीं है। आपको इसे करने के लिए एक अतिरिक्त चर (जैसे नमूना आकार में वृद्धि) की आवश्यकता है।
21

2
चूँकि हम अशक्त को अस्वीकार कर सकते हैं, लेकिन यह सिद्ध नहीं करते हैं कि अशक्त होना आम तौर पर इसके विपरीत है जिसे हम सिद्ध करना चाहते हैं या सत्य मानते हैं। यदि हम मानते हैं कि अंतर है तो अशक्तता में कोई अंतर नहीं होना चाहिए ताकि आप उसे अस्वीकार कर सकें।
ग्रेग स्नो

@Greg यह एक अच्छा तरीका है यदि आप जानते हैं कि आप कौन सा सही होना चाहते हैं जो कि सामान्य मामला है।
22

1
"आप क्या उम्मीद करते हैं" और "कि वे अलग हैं" सभी मात्रात्मक नहीं होने के कारण सांख्यिकीय परिकल्पना नहीं हो सकती है इस मामले की जड़ तक पहुँच जाता है: अशक्त और वैकल्पिक परिकल्पना के बीच की भूमिकाओं में विषमता, प्रभाव के तहत वितरण के मापदण्ड की आवश्यकता की तुलना में नल के नीचे परीक्षण सांख्यिकीय के नमूने वितरण को निर्धारित करने की क्षमता से निकलती है। वैकल्पिक परिकल्पना। और न ही यह है कि हम "टाइप I त्रुटि को कम करते हैं": ऐसा कभी नहीं होता (न्यूनतम हमेशा 0 होता है)। टेस्ट टाइप I और II त्रुटि दर के बीच संतुलन चाहते हैं ।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.