क्या विश्वास अंतराल से संबंधित नहीं है परिकल्पना के बराबर पी-मूल्य का उपयोग करते हुए परिकल्पना को खारिज कर रहा है?


29

औपचारिक रूप से एक अनुमान के विश्वास अंतराल को व्युत्पन्न करते हुए, मैं एक सूत्र के साथ समाप्त हुआ जो बहुत ही बारीकी से मिलता-जुलता है, जिस तरह से -value की गणना की जाती है।p

इस प्रकार प्रश्न: क्या वे औपचारिक रूप से समतुल्य हैं? यानी एक परिकल्पना को खारिज किया जाता है एक महत्वपूर्ण मान के साथ के बराबर महत्वपूर्ण मान के साथ विश्वास अंतराल से संबंधित नहीं ?α 0 αH0=0α0α


2
@ एफ कॉप्पेन्स: हाँ, यदि दो परीक्षणों का उपयोग किया जाता है, तो विभिन्न आँकड़ों के साथ, आप दो अलग-अलग आत्मविश्वास अंतरालों के साथ समाप्त होते हैं। लेकिन मुझे लगता है कि ओपी ने एक बुनियादी तथ्य की खोज की: आत्मविश्वास अंतराल और पी-मूल्य दोनों एक ही सांख्यिकीय के वितरण से प्राप्त किए जाते हैं, इसलिए उन दोनों का उपयोग शून्य परिकल्पना को अस्वीकार करने का निर्णय लेने के लिए किया जा सकता है या नहीं।
StijnDeVuyst

1
@StijnDeVuyst: एक अनुपात के लिए क्लॉपर / पियरॉन अंतराल और एक अनुपात के लिए स्टर्न अंतराल दोनों एक ही आकार के साथ द्विपद वितरण से व्युत्पन्न हैं (पी अज्ञात है क्योंकि वे पी के लिए एक आत्मविश्वास अंतराल पाते हैं)। क्लोपर / पियर्सन और स्टर्न के बीच का अंतर द्विपद घनत्व के विषमता के कारण है। स्टर्न अंतराल अंतराल की चौड़ाई को कम करने की कोशिश करता है और क्लोपर_पर्सन समरूपता रखने की कोशिश करता है (लेकिन द्विपद के तिरछेपन के कारण यह केवल लगभग पाया जा सकता है)।

6
सामान्य तौर पर नहीं, नहीं। उन मामलों पर विचार करें जहां अंतराल की चौड़ाई अनुमानित पैरामीटर मान का एक फ़ंक्शन है, जबकि परीक्षण के लिए अंतराल की चौड़ाई एक परिकल्पित एक का कार्य है। एक स्पष्ट उदाहरण एक द्विपद पी का परीक्षण होगा। आइए सामान्य लगभग का उपयोग करें। सादगी के लिए (हालाँकि तर्क का रूप इस पर निर्भर नहीं करता है)। N = 10 पर विचार करें, और p = 0.5 का एक शून्य। 2 प्रमुखों की कल्पना करना; नल अस्वीकार नहीं किया गया है (क्योंकि "2" 0.5 के बारे में 95% अंतराल के अंदर है) लेकिन पी के लिए सीआई में 0.5 शामिल नहीं है (क्योंकि सीआई नल के नीचे अंतराल चौड़ाई की तुलना में संकीर्ण है।
Glen_b -Reinstone मोनिका

4
या अगर आपको इसकी बड़ी आवश्यकता है कि सामान्य लगभग अच्छा है, तो 1000 टन में 469 सिर आज़माएं, H0 = 0.5 के लिए; पी के लिए फिर से 95% सीआई में 0.5 शामिल नहीं है, लेकिन 5% परीक्षण अस्वीकार नहीं करता है, क्योंकि H0 के तहत संबंधित अंतराल की चौड़ाई विकल्प के तहत व्यापक है (जो कि आप से सीआई करते हैं)।
Glen_b -Reinstate मोनिका

4
@Glen_b: ऐसा लगता है कि यह नया प्रश्न आंकड़े .stackexchange.com/ questions/ 173005 उस स्थिति का एक उदाहरण प्रदान करता है जिसे आप यहां बता रहे थे।
अमीबा का कहना है कि मोनिका

जवाबों:


32

हां और ना।

पहले "हाँ"

आपने जो देखा है, वह यह है कि जब एक परीक्षण और एक आत्मविश्वास अंतराल एक ही आँकड़ा पर आधारित होता है, तो उनके बीच एक समानता होती है: हम -value को Alpha के सबसे छोटे मान के रूप में व्याख्या कर सकते हैं जिसके लिए पैरामीटर का शून्य मान है आत्मविश्वास अंतराल में शामिल किया जाएगा ।α 1 - αpα1α

Let पैरामीटर स्पेस में एक अज्ञात पैरामीटर है , और नमूना यादृच्छिक चर । सादगी के लिए, एक आत्मविश्वास अंतराल को एक यादृच्छिक अंतराल के रूप में परिभाषित करें ताकि इसकी कवरेज प्रायिकता (आप इसी तरह और अधिक सामान्य अंतरालों पर विचार कर सकते हैं, जहां कवरेज संभावना या तो 1-1 बराबर है या लगभग बराबर है । तर्क संगत है।)Θ आर एक्स = ( एक्स 1 , ... , एक्स एन ) एक्स एनआर एन एक्स = ( एक्स 1 , ... , एक्स एन ) मैं α ( एक्स ) पी θ ( θ मैं α ( एक्स ) ) = 1 - αθΘRx=(x1,,xn)XnRnX=(X1,,Xn)Iα(X) 1 - α

Pθ(θIα(X))=1αfor all α(0,1).
1α

बिंदु-शून्य परिकल्पना दो-तरफा परीक्षण पर विचार करें वैकल्पिक । Let परीक्षण के पी-मूल्य को दर्शाते हैं। किसी के लिए , स्तर पर अस्वीकार कर दिया है अगर । स्तर अस्वीकृति क्षेत्र का सेट है, जो की अस्वीकृति की ओर जाता है : एच 1 ( θ 0 ) : θ θ 0 λ ( θ 0 , एक्स ) अल्फा ( 0 , 1 ) एच 0 ( θ 0 ) अल्फा λ ( θ 0 , एक्स ) अल्फा अल्फा एक्स एच 0 ( θ 0 ) आरH0(θ0):θ=θ0H1(θ0):θθ0λ(θ0,x)α(0,1)H0(θ0)αλ(θ0,x)αα xH0(θ0)

Rα(θ0)={xRn:λ(θ0,x)α}.

अब, p-मानों के साथ दो-पक्षीय परीक्षणों के एक परिवार पर विचार करें , । ऐसे परिवार के लिए हम एक उलटा अस्वीकृति क्षेत्र को परिभाषित कर सकते हैंθ Θ क्यू अल्फा ( एक्स ) = { θ Θ : λ ( θ , एक्स ) अल्फा } λ(θ,x)θΘ

Qα(x)={θΘ:λ(θ,x)α}.

किसी भी निश्चित , को खारिज कर दिया जाता है यदि , जो तब होता है यदि और केवल यदि , तो वह है, यदि परीक्षण पूरी तरह से निर्दिष्ट निरंतर अशक्त वितरण के साथ एक परीक्षण सांख्यिकीय पर आधारित है, तो तहत । फिर चूँकि यह समीकरण किसी भीएच 0 ( θ 0 ) एक्सआर α ( θ 0 ) θ 0क्यू α ( एक्स ) एक्सआर α ( θ 0 ) θ 0क्यू α ( एक्स ) λ ( θ 0 , एक्स ) ~ यू ( 0 , 1 ) एच 0 ( θ 0θ0H0(θ0)xRα(θ0)θ0Qα(x)

xRα(θ0)θ0Qα(x).
λ(θ0,X)U(0,1)पी θ 0 ( एक्सआर अल्फा ( θ 0 ) ) = पी θ 0 ( λ ( θ 0 , एक्स ) अल्फा ) = अल्फा θ 0Θ पी θ 0 ( एक्सआर α ( θ 0 ) ) = पी θ 0 ( θ 0क्यू α ( एक्सH0(θ0)
Pθ0(XRα(θ0))=Pθ0(λ(θ0,X)α)=α.
θ0Θऔर चूंकि इसके ऊपर का समीकरण यह है कि यह इस प्रकार है कि यादृच्छिक सेट हमेशा सही पैरामीटर को प्रायिकता साथ कवर करता है । नतीजतन, दे के पूरक निरूपित , के लिए सभी हम जिसका अर्थ है कि उल्टे अस्वीकृति क्षेत्र के पूरक एक लिए विश्वास अंतराल है ।क्यू अल्फा ( एक्स ) θ 0 अल्फा क्यू सी अल्फा ( एक्स ) क्यू अल्फा ( एक्स ) θ 0Θ पी θ 0 ( θ 0क्यू सी अल्फा ( एक्स ) ) = 1 - अल्फा , 1 - अल्फा θ
Pθ0(XRα(θ0))=Pθ0(θ0Qα(X)),
Qα(x)θ0αQαC(x)Qα(x)θ0Θ
Pθ0(θ0QαC(X))=1α,
1αθ

एक चित्रण नीचे दिया गया है, जो सामान्य क्षेत्रों के लिए -est के अनुरूप अस्वीकृति क्षेत्रों और विश्वास अंतरालों को दिखा रहा है, विभिन्न अशक्त साधनों के लिए the और अलग-अलग नमूने का अर्थ , । को अस्वीकार कर दिया जाता है यदि छायांकित हल्के भूरे क्षेत्र में होता है। गहरे भूरे रंग में दिखाया गया अस्वीकृति क्षेत्र और विश्वास अंतराल । ˉ θ xzθx¯σ=1H0(θ)(x¯,θ)R0.05(0.9)=(,1.52)(0.281,)I0.05(1/2)=Q0.05C(1/2)=(0.120,1.120)यहां छवि विवरण दर्ज करें

(इसमें से बहुत कुछ मेरी पीएचडी थीसिस से लिया गया है ।)

अब "नहीं" के लिए

ऊपर मैंने विश्वास अंतराल के निर्माण के मानक तरीके का वर्णन किया। इस दृष्टिकोण में, हम अंतराल के निर्माण के लिए अज्ञात पैरामीटर से संबंधित कुछ आंकड़ों का उपयोग करते हैं। कम से कम एल्गोरिदम पर आधारित अंतराल भी हैं, जो के मूल्य पर अंतराल की स्थिति को कम करने की कोशिश करते हैं । आमतौर पर, ऐसे अंतराल एक परीक्षण के अनुरूप नहीं होते हैं।θX

इस घटना को ऐसे अंतरालों से संबंधित समस्याओं के साथ नहीं करना है, जिसका अर्थ है कि 94% अंतराल 95% अंतराल से कम हो सकता है। इस पर अधिक जानकारी के लिए, मेरे हाल के इस पत्र की धारा 2.5 (बर्नोली में छपने के लिए) देखें।

और एक दूसरा "नहीं"

कुछ समस्याओं में, मानक आत्मविश्वास अंतराल मानक परीक्षण के रूप में एक ही सांख्यिकीय पर आधारित नहीं है (जैसा कि इस पत्र में माइकल फे द्वारा चर्चा की गई है )। उन मामलों में, आत्मविश्वास अंतराल और परीक्षण समान परिणाम नहीं दे सकते हैं। उदाहरण के लिए, को परीक्षण द्वारा अस्वीकार कर दिया जा सकता है, भले ही विश्वास अंतराल में 0 शामिल हो। यह ऊपर "हां" के विपरीत नहीं है, क्योंकि विभिन्न आँकड़ों का उपयोग किया जाता है।θ0=0

और कभी-कभी "हाँ" अच्छी बात नहीं है

जैसा कि एक टिप्पणी में एफ कॉप्पेन्स द्वारा बताया गया है , कभी-कभी अंतराल और परीक्षणों में कुछ परस्पर विरोधी लक्ष्य होते हैं। हम उच्च शक्ति के साथ छोटे अंतराल और परीक्षण चाहते हैं, लेकिन सबसे छोटा अंतराल हमेशा उच्चतम शक्ति के साथ परीक्षण के अनुरूप नहीं होता है। इसके कुछ उदाहरणों के लिए, इस शोधपत्र (बहुभिन्नरूपी सामान्य वितरण), या यह (घातांक वितरण), या मेरी थीसिस की धारा ४ देखें ।

बायसी भी हाँ और ना दोनों कह सकते हैं

कुछ साल पहले, मैंने इस बारे में एक सवाल पोस्ट किया था कि क्या एक परीक्षण-अंतराल-समानता बायेसियन आंकड़ों में भी मौजूद है। संक्षिप्त उत्तर यह है कि मानक बायेसियन परिकल्पना परीक्षण का उपयोग करते हुए, उत्तर "नहीं" है। परीक्षण की समस्या को थोड़ा सुधारकर, इसका जवाब "हां" हो सकता है। (मेरे अपने प्रश्न का उत्तर देने के मेरे प्रयास अंततः एक कागज में बदल गए !)


2
अच्छा उत्तर (+1) और (आप आंशिक रूप से ऐसा करते हैं) इस तथ्य की ओर इशारा करना अच्छा हो सकता है कि कभी-कभी आत्मविश्वास अंतराल और परिकल्पना परीक्षणों में (संभावित) परस्पर विरोधी लक्ष्य होते हैं: एक आत्मविश्वास अंतराल को 'जितना संभव हो उतना छोटा' खोजने की कोशिश करता है परिकल्पना परीक्षण के लिए एक महत्वपूर्ण क्षेत्र को 'यथासंभव शक्तिशाली' खोजने की कोशिश करता है।

@fcoppens: सुझाव के लिए धन्यवाद! मैंने इस बारे में कुछ पंक्तियों के साथ अपना उत्तर अपडेट किया है।
मैन्सटीटी

NIce थीसिस! क्या आपने स्टर्न के अंतराल पर भी काम किया था?

@fcoppens: हाँ, मैंने कुछ काम Sterne अंतराल में किए हैं, मुख्यतः इस पेपर में
MånsT

7
@amoeba: वास्तव में, मुझे लगता है कि उसका "नहीं" मेरा दूसरा "नहीं" है। जहाँ तक मैं बता सकता हूँ, वह सांख्यिकीय अंतराल और परीक्षण पर विश्वास अंतराल को आधार बनाता है आँकड़ा । हर में अंतर पर ध्यान दें। आप या तो आंकड़े का उपयोग करके परीक्षण और अंतराल का निर्माण कर सकते हैं, और जब तक आप दोनों के लिए एक ही सांख्यिकीय का उपयोग करते हैं, तब तक कोई विसंगति नहीं होगी। टी2=(पी-पी)/T1=(p^p)/p^(1p^)/nT2=(p^p)/p(1p)/n
MånsT

2

जब एक ही पैरामीटर को देखते हैं, तो यह संभव है कि पैरामीटर के मूल्य के बारे में एक परीक्षण और विश्वास अंतराल "बेमेल" के आधार पर कि वे कैसे निर्मित होते हैं। विशेष रूप से, एक परिकल्पना परीक्षण एक स्तर है अगर यह शून्य परिकल्पना एक अनुपात को खारिज कर दिया, -Test समय था जब शून्य परिकल्पना सच है की। इस कारण से कोई भी उदाहरण के लिए मॉडल के मापदंडों (जैसे कि विचरण) का उपयोग कर सकता है जो केवल शून्य परिकल्पना के तहत मान्य हैं। अगर किसी ने इस परीक्षण को शुरू करके एक सीआई के निर्माण की कोशिश की, तो वैकल्पिक परिकल्पना के तहत कवरेज काफी सही नहीं हो सकता है। इस कारण से आमतौर पर एक आत्मविश्वास अंतराल का निर्माण अलग से होगा ताकि कवरेज भी विकल्प के तहत सही हो, जो तब (आमतौर पर बहुत छोटा) बेमेल हो सकता है।अल्फाαα

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.