आत्मविश्वास अंतराल और परिकल्पना परीक्षण के बीच अंतर क्या है?


28

मैंने कुछ टिप्पणीकारों के साथ परिकल्पना परीक्षण के संबंध में विवादों के बारे में पढ़ा है जो सुझाव देते हैं कि परिकल्पना परीक्षण का उपयोग नहीं किया जाना चाहिए। कुछ टिप्पणीकारों का सुझाव है कि इसके बजाय आत्मविश्वास अंतराल का उपयोग किया जाना चाहिए।

  • आत्मविश्वास अंतराल और परिकल्पना परीक्षण के बीच अंतर क्या है? संदर्भ और उदाहरणों के साथ स्पष्टीकरण की सराहना की जाएगी।

5
मुझे लगता है कि आप यह पूछना चाहते थे कि आत्मविश्वास के अंतराल को दिखाते हुए परिकल्पना परीक्षण के परिणामों की रिपोर्टिंग सिर्फ यह कहने से बेहतर है कि कुछ पी-वैल्यू स्तर पर पुष्टि या अस्वीकार कर दिया गया है।

3
आपको अपने कुछ अन्य सवालों के जवाब के रूप में जाँच करने पर विचार करना चाहिए।
एंडी डब्ल्यू

जवाबों:


19

आप परिकल्पना परीक्षण के लिए एक आत्मविश्वास अंतराल (CI) का उपयोग कर सकते हैं। विशिष्ट मामले में, यदि प्रभाव के लिए CI 0 नहीं फैला है तो आप अशक्त परिकल्पना को अस्वीकार कर सकते हैं। लेकिन एक CI का उपयोग अधिक के लिए किया जा सकता है, जबकि यह पारित किया गया है कि रिपोर्ट करना किसी परीक्षण की उपयोगिता की सीमा है।

उदाहरण के लिए, आपको केवल एक टी-टेस्ट के बजाय सीआई का उपयोग करने की सिफारिश की जाती है, क्योंकि तब आप सिर्फ टेस्ट हाइपोथेसिस से अधिक कर सकते हैं। आप उन प्रभावों की श्रेणी के बारे में एक बयान कर सकते हैं जिनके बारे में आपको विश्वास है कि वे (CI में वाले) हैं। आप सिर्फ एक टी-टेस्ट के साथ ऐसा नहीं कर सकते। आप इसे अशक्त के बारे में बयान करने के लिए भी उपयोग कर सकते हैं, जिसे आप एक टी-टेस्ट के साथ नहीं कर सकते। यदि टी-टेस्ट शून्य को अस्वीकार नहीं करता है, तो आप सिर्फ यह कहते हैं कि आप शून्य को अस्वीकार नहीं कर सकते, जो बहुत कुछ नहीं कह रहा है। लेकिन अगर आपके पास नल के चारों ओर एक संकीर्ण आत्मविश्वास अंतराल है, तो आप सुझाव दे सकते हैं कि अशक्त, या इसके करीब एक मूल्य, सही मूल्य की संभावना है और उपचार के प्रभाव का सुझाव देते हैं, या स्वतंत्र चर, सार्थक होने के लिए बहुत छोटा है ( या कि आपका प्रयोग '

बाद में जोड़ा गया: मुझे वास्तव में यह कहना चाहिए था, जबकि आप एक सीआई का उपयोग कर सकते हैं जैसे कि यह एक परीक्षा नहीं है। यह एक सीमा का अनुमान है जहां आपको लगता है कि पैरामीटर मान निहित है। आप इनफॉरमेशन की तरह टेस्ट कर सकते हैं लेकिन आप इस तरह से इस बारे में बात नहीं कर रहे हैं।

कौनसा अच्छा है?

ए) प्रभाव 0.6, टी (29) = 2.8, पी <0.05 है। यह सांख्यिकीय रूप से महत्वपूर्ण प्रभाव है ... (कुछ चर्चा इस सांख्यिकीय महत्व के बारे में किसी भी उल्लेख के बिना या यहां तक ​​कि खोजने की भयावहता के व्यावहारिक निहितार्थ पर चर्चा करने की मजबूत क्षमता के बारे में बताती है ... एक नेमैन-पियर्सन ढांचे के तहत टी और p मान बहुत अधिक अर्थहीन है और आप सभी इस पर चर्चा कर सकते हैं कि क्या प्रभाव मौजूद है या मौजूद नहीं है। आप वास्तव में कभी भी इस बारे में बात नहीं कर सकते हैं कि वास्तव में परीक्षण के आधार पर इसका कोई प्रभाव नहीं है।)

या

बी) एक ९ ५% आत्मविश्वास अंतराल का उपयोग करके मैं ०.२ और १.० के बीच होने वाले प्रभाव का अनुमान लगाता हूं। (कुछ चर्चा ब्याज के वास्तविक प्रभाव के बारे में बात करते हुए बताती है, कि क्या यह प्रशंसनीय मूल्य हैं जो किसी विशेष अर्थ और किसी भी शब्द के उपयोग के लिए महत्वपूर्ण हैं जो वास्तव में इसका मतलब है। इसके अलावा, सीआई की चौड़ाई सीधे जा सकती है। यह एक मजबूत खोज है या क्या आप केवल एक अधिक अस्थायी निष्कर्ष तक पहुँच सकते हैं की एक चर्चा)

यदि आप एक बुनियादी सांख्यिकी वर्ग लेते हैं, तो आप शुरू में ए की ओर बढ़ सकते हैं। और कुछ ऐसे मामले भी हो सकते हैं, जहां परिणाम की रिपोर्ट करना बेहतर तरीका है। लेकिन अधिकांश कार्यों के लिए B दूर और श्रेष्ठतर है। श्रेणी अनुमान कोई परीक्षण नहीं है।


@ जोहॉन की टिप्पणियों के अलावा एक: सबसे पहले, कभी-कभी महत्वपूर्ण सवाल यह है कि क्या सीआई 1 फैला है, 0 नहीं (उदाहरण के लिए लॉजिस्टिक रजिस्टर)।
पीटर Flom - को पुनः स्थापित मोनिका

दोस्तों, यह 1 है या यह 0 है? (यह मेरे लिए बहुत रोशन लग रहा है, इसलिए मुझे लगता है, मुझे बाहर देखने के लिए सही मूल्य सीखने की जरूरत है!) @ जॉन
अधिश जोश

अल्फ़ा = 0.05 के साथ 95% सीआई और दो-पूंछ परीक्षण परिकल्पना के बीच क्या संबंध है? क्या वे समान हैं? यदि नहीं तो कैसे?
लव-

प्यार-आँकड़े, जब एक ही इस्तेमाल किया वे एक ही हैं।
जॉन

Adhesh जोश, अशक्त परिकल्पना किसी भी निश्चित मूल्य पहले से निर्दिष्ट किया जा सकता है। सीधे NHST पर CI की एक और विशेषता है। यह एक काल्पनिक 0. के अलावा अन्य मूल्य के खिलाफ जब आप चाहते हैं उपयोग करने के लिए परीक्षण करने के लिए बहुत आसान है
जॉन

7

परिकल्पना परीक्षण और आत्मविश्वास अंतराल के बीच एक समानता है। (उदाहरण के लिए देखें http://en.wikipedia.org/wiki/Confidence_interval#Statutic_hypothesis_testing ) मैं एक बहुत विशिष्ट उदाहरण दूंगा। मान लें कि हमारे पास माध्य और प्रसरण 1 के साथ एक सामान्य वितरण से जिसे हम रूप में लिखेंगे । मान लीजिए कि हम सोचते हैं कि , और हम परिकल्पना स्तर पर परीक्षण करना चाहते हैंइसलिए हम एक परीक्षण आँकड़ा बनाते हैं, जो इस मामले में हम नमूना औसत होने के लिए ले जाएगा: । अब मान लीजिएx1,x2,,xnμN(μ,1)μ=mH0:μ=m0.05.v=(x1+x2++xn)/nA(m)इस परीक्षण के लिए लिए "स्वीकृति क्षेत्र" है । इसका मतलब है कि के संभावित मानों का समुच्चय है , जिसके लिए null-hypothesis को 0.05 के स्तर पर स्वीकार किया जाता है (मैं "अस्वीकृत" का उपयोग "अस्वीकृत नहीं" के रूप में करता हूं - मैं सुझाव नहीं दे रहा हूं कि आप समाप्त होगा परिकल्पना सच है।)। इस उदाहरण के लिए, हम सामान्य वितरण को देख सकते हैं और इस वितरण के तहत कम से कम 0.95 संभावना वाले किसी भी सेट को चुन सकते हैं। अब, के लिए एक 95% विश्वास क्षेत्र सभी का सेट है जिसके लिए में है । दूसरे शब्दों में, यह सभी का सेट हैvA(m)vμ=mN(m,1)μmvA(m)mजिसके लिए अशक्त परिकल्पना को मनाया गया लिए स्वीकार किया जाएगा । यही कारण है कि जॉन कहते हैं, "यदि एक प्रभाव के लिए सीआई नहीं फैलता है तो आप अशक्त परिकल्पना को अस्वीकार कर सकते हैं।" (जॉन परीक्षण के मामले का जिक्र कर रहा है )v0μ=0

एक संबंधित विषय पी-मूल्य है। पी-मान एक परीक्षण के लिए सबसे छोटा स्तर है जिस पर हम अशक्त-परिकल्पना को अस्वीकार करेंगे। विश्वास अंतराल की चर्चा के साथ इसे टाई करने के लिए, मान लें कि हमें एक विशेष नमूना औसत , जिससे हम विभिन्न आकारों के आत्मविश्वास अंतराल का निर्माण करते हैं। मान लीजिए कि लिए 95% विश्वास अंतराल में नहीं है । फिर हम null-hypothesis को स्तर पर अस्वीकार कर सकते हैं तब मान लीजिए कि हम आत्मविश्वास अंतराल को तब तक बढ़ाते हैं जब तक कि यह मूल्य स्पर्श नहीं करता (लेकिन इसमें शामिल नहीं है) , और मान लीजिए कि यह 98% विश्वास अंतराल है। तब परिकल्पना के लिए पी-मूल्य है (जो हम से प्राप्तvμmμ=m0.05.mμ=m0.0210.98 )।


कृपया इसे पढ़ें क्योंकि पी-मान को अशक्त अस्वीकार करने के लिए परीक्षण के सबसे छोटे स्तर के रूप में व्याख्या नहीं की जा सकती है। "यह पहले ही दिखाया जा चुका है कि एकल (या चल रहे) प्रयोगों में पी मानों की व्याख्या करना नेमन-पियरसन परिकल्पना परीक्षण संदर्भ में स्वीकार्य नहीं है। एपी वैल्यू की गणना केवल शून्य परिकल्पना की सच्चाई पर निर्भर करती है। पी मान नहीं मापता है। हा का समर्थन करने वाले साक्ष्य की मात्रा; यह H0 के खिलाफ आगमनात्मक साक्ष्य का एक उपाय है। " 'स्रोत: ftp.stat.duke.edu/WorkingPapers/03-26.pdf
sree22

@ sree22 क्या आप इस पर विस्तार कर सकते हैं, या रिवाइंडिंग का सुझाव दे सकते हैं? मैं इस संदर्भ में पी-वैल्यू की परिभाषा देने की कोशिश कर रहा था, व्याख्या नहीं।
डेविड

3

'छात्र' ने इस आधार पर विश्वास अंतराल के लिए तर्क दिया कि वे दिखा सकते हैं कि कौन से प्रभाव अधिक महत्वपूर्ण थे और जो अधिक महत्वपूर्ण थे।

उदाहरण के लिए, यदि आपको दो प्रभाव मिलते हैं, जहां पहले में £ 5 से £ 6 तक के वित्तीय प्रभाव के लिए एक आत्मविश्वास अंतराल था, जबकि दूसरे में £ 200 से £ 2800 तक एक आत्मविश्वास अंतराल था। पहला अधिक सांख्यिकीय रूप से महत्वपूर्ण है लेकिन दूसरा संभवतः अधिक महत्वपूर्ण है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.