एक पूंछ वाले परिकल्पना परीक्षण का औचित्य


35

मैं दो-पूंछ परिकल्पना परीक्षण को समझता हूं। आपके पास (बनाम ) है। पी -value संभावना है कि है \ थीटा क्या मनाया गया के रूप में चरम रूप में कम से कम डेटा उत्पन्न करता है।एच0:θ=θ0एच1=¬एच0:θθ0पीθ

मुझे एक-पूंछ वाली परिकल्पना के परीक्षण की समझ नहीं है। यहाँ, एच0:θθ0 (बनाम H_1 = \ negative H_0: \ theta> \ theta_0एच1=¬एच0:θ>θ0 )। पी-वैल्यू की परिभाषा ऊपर से नहीं बदलनी चाहिए: यह अभी भी संभावना होनी चाहिए कि θ कम से कम चरम पर डेटा उत्पन्न करता है जैसा कि देखा गया था। लेकिन हम \ theta को नहीं जानते हैं , केवल यह कि यह ऊपरी तौर पर \ theta_0 से घिरा है ।θθ0

बजाय, मैं ग्रंथों हमें ग्रहण करने के लिए कह रही है देखते हैं कि θ=θ0 (नहीं θθ0 अनुसार H0 ) और प्रायिकता की गणना है कि यह है कि क्या मनाया गया के रूप में चरम रूप में कम से कम डेटा उत्पन्न करता है, लेकिन केवल एक छोर पर । ऐसा लगता है कि तकनीकी रूप से परिकल्पना से कोई लेना-देना नहीं है।

अब, मैं समझता हूं कि यह बार-बार होने वाली परिकल्पना परीक्षण है, और यह है कि फ्रीक्वेंटर्स कोई पुजारी को उनके थेटा पर नहीं रखते हैं θ। लेकिन क्या इसका मतलब यह नहीं होना चाहिए कि उपकल्पनाओं को स्वीकार करना या अस्वीकार करना असंभव है, बजाय इसके कि ऊपर की गणना को चित्र में बदल दिया जाए?


इसी तरह का सवाल बाद में आँकड़े से
रॉबिन

1
की अपनी परिभाषा p -value अधूरा है। इसे पढ़ा जाना चाहिए (जोर दिया गया): p -value यह संभावना है कि θ कम से कम चरम पर डेटा उत्पन्न करता है जैसा कि देखा गया था, यह मानना ​​कि परिकल्पना सत्य है
एलेक्सिस

जवाबों:


34

यह एक विचारणीय प्रश्न है। इस मुद्दे पर कई ग्रंथ (शायद शैक्षणिक कारणों से) कागज। वास्तव में क्या चल रहा है कि आपकी एकतरफा स्थिति में एक समग्र "परिकल्पना" है: यह वास्तव में परिकल्पनाओं का एक समूह है, न कि एक एकल। यह आवश्यक है कि में हर संभव परिकल्पना के लिएH0 H0परीक्षण क्षेत्र में गिरने वाले सांख्यिकीय का मौका परीक्षण के आकार से कम या उसके बराबर होना चाहिए। इसके अलावा, यदि परीक्षण वास्तव में अपने नाममात्र आकार को प्राप्त करने के लिए है (जो उच्च शक्ति प्राप्त करने के लिए एक अच्छी बात है), तो इन अवसरों (सभी अशक्त परिकल्पनाओं पर लिया गया) का वर्चस्व नाममात्र के आकार के बराबर होना चाहिए। व्यवहार में, वितरण के कुछ "अच्छे" परिवारों को शामिल करने वाले स्थान के सरल एक-पैरामीटर परीक्षणों के लिए, इस को पैरामीटर साथ परिकल्पना के लिए प्राप्त किया जाता है । इस प्रकार, एक व्यावहारिक बात के रूप में, सभी गणना इस एक वितरण पर केंद्रित है। लेकिन हमें बाकी सेट बारे में नहीं भूलना चाहिए : यह दो-तरफा और एक तरफा परीक्षणों के बीच (और "सरल" और "समग्र" के बीच एक महत्वपूर्ण अंतर है)θ0H0

यह एकतरफा परीक्षणों के परिणामों की व्याख्या को सूक्ष्मता से प्रभावित करता है। जब शून्य को अस्वीकार कर दिया जाता है, तो हम प्रकृति की वास्तविक स्थिति के खिलाफ सबूत बिंदुओं को में किसी भी वितरण के होने के बारे में कह सकते हैं । जब नल अस्वीकार नहीं किया जाता है, तो हम केवल यह कह सकते हैं कि में एक वितरण मौजूद है जो कि देखे गए डेटा के साथ "सुसंगत" है। हम यह नहीं कह रहे हैं कि में सभी वितरण डेटा के अनुरूप हैं: इससे बहुत दूर! उनमें से कई बेहद कम संभावनाएं पैदा कर सकते हैं।H0H0H0


आपके द्वारा कही गई हर बात वैध और महत्वपूर्ण है। एक और महत्वपूर्ण पहलू मुझे लगता है कि आमतौर पर अशक्त परिकल्पना को निर्बाध परिकल्पना के रूप में देखा जाता है। विकल्प को वैज्ञानिक परिकल्पना के रूप में देखा जाता है। यह वह है जिसे प्रयोग करने वाला साबित करना चाहेगा। मैं आमतौर पर कहता हूं क्योंकि यह तुल्यता और गैर-हीनता परीक्षण में भिन्न है। अब एक-पक्षीय परीक्षण के मुद्दे के बारे में यह केवल उस पक्ष का कहना है जिसमें पैरामीटर अधिक है कि अशक्त मान दिलचस्प है। तो कम से कम पक्ष के सभी मूल्यों को शून्य में शामिल किया गया है।
माइकल आर। चेर्निक

आँकड़ों.stackexchange.com/questions/333301/… यदि आपको इस प्रश्न का उत्तर देने का मन करता है, या मुझे कुछ ग्रंथ सूची की ओर इशारा करते हैं ...;)
समुद्र में एक बूढ़ा व्यक्ति।

6

मैं -value को एक प्रकार की त्रुटि की अधिकतम संभावना के रूप में देखता हूं। तो θ « θ 0 , प्रकार I त्रुटि दर की संभावना प्रभावी रूप से शून्य हो सकता है लेकिन तो ठीक है। जब एक न्यूनतम दृष्टिकोण से परीक्षण को देखते हैं, तो एक विरोधी को वैसे भी शून्य परिकल्पना के 'आंतरिक' में गहरे से कभी नहीं खींचना होगा, और शक्ति को प्रभावित नहीं करना चाहिए। सरल स्थितियों के लिए ( उदाहरण के लिए टी -टेस्ट), एक गारंटीकृत अधिकतम प्रकार I दर के साथ एक परीक्षण का निर्माण करना संभव है, इस तरह के एक तरफा अशक्त परिकल्पनाओं की अनुमति देता है।पीθ«θ0टी


2

आप एक तरफा परिकल्पना परीक्षण का उपयोग करेंगे यदि केवल एक ही दिशा में परिणाम उस निष्कर्ष का समर्थन करते हैं जो आप पहुंचने की कोशिश कर रहे हैं।

आप जो सवाल पूछ रहे हैं, उसके संदर्भ में इस पर विचार करें। उदाहरण के लिए मान लीजिए, आप देखना चाहते हैं कि मोटापा दिल के दौरे के खतरे को बढ़ाता है या नहीं। आप अपना डेटा इकट्ठा करते हैं, जिसमें 10 मोटे लोग और 10 गैर-मोटे लोग शामिल हो सकते हैं। अब हम कहते हैं कि, असम्बद्ध भ्रमित कारकों, खराब प्रायोगिक डिजाइन, या सिर्फ सादे बुरे भाग्य के कारण, आप मानते हैं कि 10 में से 2 मोटे लोगों को दिल का दौरा पड़ता है, जबकि गैर-मोटे लोगों की तुलना में 8।

अब यदि आप इस डेटा पर 2-पक्षीय परिकल्पना परीक्षण करने वाले थे, तो आप निष्कर्ष निकालेंगे कि मोटापा और दिल के दौरे के जोखिम के बीच सांख्यिकीय रूप से महत्वपूर्ण जुड़ाव (p ~ 0.02) था। हालांकि, एसोसिएशन इसके विपरीत होगा, जिसे आप वास्तव में देखने की उम्मीद कर रहे थे, इसलिए परीक्षा परिणाम भ्रामक होगा।

(वास्तविक जीवन में, ऐसा प्रयोग जो इस तरह के प्रतिस्पर्शी परिणाम उत्पन्न करता है, आगे के प्रश्न पैदा कर सकता है जो अपने आप में दिलचस्प हैं: उदाहरण के लिए, डेटा संग्रह प्रक्रिया में सुधार करने की आवश्यकता हो सकती है, या काम पर पहले-अज्ञात जोखिम कारक हो सकते हैं, या शायद पारंपरिक ज्ञान की गलती है। लेकिन ये मुद्दे वास्तव में संकीर्ण प्रश्न से संबंधित नहीं हैं कि किस तरह की परिकल्पना परीक्षण का उपयोग करना है।)


2

पीएच0एच00.5एच10.5

एच0एच00.75एच10.25

एच1एच0एच0

आप अपने आप में आर में इस खिलौना उदाहरण के साथ प्रयोग कर सकते हैं, आपको अलग-अलग पूर्ण संख्याओं और सिर और पूंछ के संयोजन का भी प्रयास करना चाहिए:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.