क्या 95% विश्वास अंतराल के भीतर सभी मूल्य समान रूप से होने की संभावना है?


56

मुझे इस प्रश्न पर अप्रिय जानकारी मिली है: " यदि कोई साधन या अनुपात में अंतर का 95% विश्वास अंतराल (CI) का निर्माण करता है, तो क्या CI के भीतर सभी मूल्य समान रूप से होने की संभावना है? या, क्या बिंदु का अनुमान सबसे अधिक है? , सीआई के "पूंछ" के पास के मूल्यों के साथ सीआई के बीच के लोगों की तुलना में कम संभावना है?

उदाहरण के लिए, यदि एक यादृच्छिक नैदानिक ​​परीक्षण रिपोर्ट में कहा गया है कि किसी विशेष उपचार के साथ मृत्यु दर का सापेक्ष जोखिम 1.06 (95% CI 0.96 से 1.18) है, तो 0.96 की संभावना सही मान 1.06 के समान है?

मुझे इस अवधारणा के कई संदर्भ ऑनलाइन मिले, लेकिन इसके बाद के दो उदाहरण अनिश्चितता को दर्शाते हैं:

  1. कॉन्फिडेंस इंटरवल के बारे में लिसा सुलिवन का मॉड्यूल बताता है:

    अंतर के लिए आत्मविश्वास का अंतराल ( ) के लिए संभावित मूल्यों की एक सीमा प्रदान करता है । यह ध्यान रखना महत्वपूर्ण है कि विश्वास अंतराल में सभी मान समान रूप से ( μ_1-μ_2 ) के सही मूल्य के संभावित अनुमान हैं ।μ1-μ2μ1-μ2

  2. यह ब्लॉगपोस्ट, शीर्षक के भीतर त्रुटि , बताता है:

    मेरे मन में "त्रुटि के मार्जिन" के बारे में गलतफहमी है जो विश्वास अंतराल के भीतर सभी बिंदुओं को समान रूप से संभावना के रूप में मानता है, जैसे कि केंद्रीय सीमा प्रमेय ने एक टी वितरण के बजाय एक बंधे हुए समान वितरण का अर्थ लगाया । [...]
    बात जो "त्रुटि के मार्जिन" के बारे में बात करती है वह यह है कि संभावनाएं जो बिंदु अनुमान के करीब हैं वे संभावनाएं हैं जो मार्जिन के किनारे पर हैं की तुलना में बहुत अधिक हैं।

ये विरोधाभासी लगते हैं, इसलिए जो सही है?


7
मुझे आश्चर्य है कि अगर संबंधित अवधारणा के साथ कहीं भ्रम है कि पी-मान समान रूप से शून्य परिकल्पना के तहत वितरित किए जाते हैं ..
माइकल मैकगोवन

4
पहला उद्धरण विश्वास अंतराल के अन्यथा सटीक खाते में एक अपमानजनक पर्ची है। दूसरा उद्धरण उस खाते से है, जो इसे अच्छी तरह से रखना है, एक मैला है: यह ऐसे बयानों से भरा है जो अस्पष्ट, गलत हैं, या केवल एक बायेसियन अर्थ में व्याख्या की जा सकती है। लेकिन दोनों कोटेशन गलत हैं !
whuber

@ जब तक मैं दूसरे को गड़बड़ नहीं कहूंगा ... मैं इसे आवृत्तिवादी व्याख्या की एक बायसियन व्याख्या कहूंगा :)
माइकल मैकगोवन

1
@ मिचेल गला घोंटने का एक उदाहरण सीएलटी को मुखर करने जैसा एक मात्रवाद है जिसका तात्पर्य है "[जनसंख्या के बार-बार अनुमानों की अनंत संख्या] का अर्थ अभी भी एक सामान्य वितरण का पालन करेगा।" विचारों को केवल एक गैर-तकनीकी दर्शकों तक पहुंचाने के लिए गलत होने की जरूरत नहीं है ।
whuber

2
@ जब भी, मुझे लगता है कि आप केवल एक मामूली पाप का हवाला देते हैं। मुख्य त्रुटि यह है कि सीएलटी में टी वितरण शामिल नहीं है।
ग्लासी

जवाबों:


23

एक प्रश्न जिसका उत्तर दिया जाना चाहिए, वह इस संदर्भ में "संभावना" क्या है?

यदि इसका अर्थ है प्रायिकता (जैसा कि इसे कभी-कभी पर्यायवाची के रूप में प्रयोग किया जाता है) और हम सख्त लगातार परिभाषाओं का उपयोग कर रहे हैं, तो सही पैरामीटर मान एक एकल मान है जो बदलता नहीं है, इसलिए उस बिंदु की संभावना (संभावना) 100% है और सभी अन्य मान 0% हैं। तो लगभग सभी समान रूप से 0% पर होने की संभावना है, लेकिन अगर अंतराल में सही मूल्य शामिल है, तो यह दूसरों से अलग है।

यदि हम बायेसियन दृष्टिकोण का उपयोग करते हैं तो CI (विश्वसनीय अंतराल) पश्च वितरण से आता है और आप अंतराल के भीतर विभिन्न बिंदुओं पर संभावना की तुलना कर सकते हैं। जब तक कि पश्चात अंतराल के भीतर पूरी तरह से समान नहीं है (सैद्धांतिक रूप से संभव है कि मुझे लगता है, लेकिन यह एक अजीब परिस्थिति होगी) तब मूल्यों की अलग-अलग संभावनाएं हैं।

यदि हम विश्वास के समान होने की संभावना का उपयोग करते हैं, तो इसके बारे में इस तरह सोचें: एक 95% आत्मविश्वास अंतराल, एक 90% आत्मविश्वास अंतराल और एक 85% विश्वास अंतराल की गणना करें। हम 5% आश्वस्त होंगे कि सच्चा मूल्य 95% अंतराल के अंदर क्षेत्र में है, लेकिन 90% अंतराल के बाहर, हम कह सकते हैं कि वास्तविक मूल्य 5% उस क्षेत्र में गिरने की संभावना है। यह उस क्षेत्र के लिए सही है जो 90% अंतराल के अंदर है लेकिन 85% अंतराल के बाहर है। इसलिए यदि हर मूल्य समान रूप से संभव है, तो उपरोक्त 2 क्षेत्रों का आकार बिल्कुल समान होना चाहिए और 10% विश्वास अंतराल के अंदर क्षेत्र के लिए सही होगा लेकिन 5% विश्वास अंतराल के बाहर। मानक वितरणों में से किसी भी अंतराल का निर्माण इस संपत्ति का उपयोग करके किया जाता है (एक वर्दी से 1 ड्रा के साथ विशेष मामलों को छोड़कर)।

आप ज्ञात आबादी से बड़ी संख्या में डेटासेटों का अनुकरण करके, स्वयं के विश्वास अंतराल की गणना करके, इसे साबित कर सकते हैं, फिर तुलना करते हैं कि कितनी बार सही पैरामीटर बिंदु के अंत बिंदु के प्रत्येक बिंदु की तुलना में करीब अनुमान के करीब है।


3
संभावना यह है कि इस सवाल के उत्तर में क्या जरूरत है, संभावना नहीं, या तो लगातार या बायेसियन। संभावना बिल्कुल जवाब प्रदान करती है, अन्य केवल कुछ घुमा और खींच के साथ ऐसा कर सकते हैं।
माइकल लेव

1
@ मुझे आपका स्पष्टीकरण पसंद है। बस स्पष्ट होने के लिए, आपका तर्क इस धारणा का समर्थन करता है कि 95% सीआई के "पूंछ" पर मान बिंदु अनुमान के करीब उन लोगों की तुलना में कम संभावना (कम संभावित) हैं, सही? आपके प्रतिक्रिया के लिए धन्येवाद।
pmgjones

1
@pmgjones कम संभावित, NO, 2 पैरा देखें। 4 वें पैराग्राफ के संदर्भ में कम संभावना है, हां।
ग्रेग स्नो

2
@GregSnow आपका दूसरा पैराग्राफ लगभग बिल्कुल यही कहता है कि सच्चे पैरामीटर के सच्चे पैरामीटर की संभावना 100% है। क्या आप वास्तव में मानते हैं कि यह तानशास्त्र क्या है "सख्त लगातार परिभाषाओं" की पेशकश करने के लिए?
rolando2

2
@ rolando2, मुझे लगता है कि लगातार आंकड़ों की पेशकश करने के लिए बहुत कुछ है, मैं सिर्फ आम गलतफहमी को दूर कर रहा था जो कि वास्तविक मूल्य में परिवर्तन करता है और कभी-कभी अंतराल से बाहर होता है और कभी-कभी अंतराल के भीतर (और कभी-कभी सीमाओं के करीब और कभी-कभी करीब होता है) बीच में)। बाद के पैराग्राफ फिर विचारों के लिए और अधिक सच्चे एहसास में मिलते हैं।
ग्रेग स्नो

19

यह एक बड़ा सवाल है! एक गणितीय अवधारणा है जिसे संभावना कहा जाता है जो आपको मुद्दों को समझने में मदद करेगा। फिशर ने संभावना का आविष्कार किया, लेकिन इसे संभावना की तुलना में कुछ हद तक वांछनीय माना, लेकिन संभावना संभावना से अधिक 'आदिम' निकला और इयान हैकिंग (1965) ने इसे स्वयंसिद्ध माना कि यह साबित नहीं है। इसके बजाय संभावना फिर से कम हो जाती है।

हैकिंग, 1965. सांख्यिकीय आविष्कार का तर्क

संभावना का ध्यान इस बात पर नहीं दिया जाता है कि यह आँकड़ों की मानक पाठ्यपुस्तकों में होना चाहिए, बिना किसी अच्छे कारण के। यह लगभग पूरी तरह से गुणों की संभावना में भिन्नता है जो एक की उम्मीद करेगा, और संभावना कार्यों और अंतरालों के अनुमान के लिए बहुत उपयोगी हैं। शायद कुछ सांख्यिकीविदों को पसंद नहीं है क्योंकि प्रासंगिक संभावना कार्यों को प्राप्त करने के लिए कभी-कभी कोई 'उचित' तरीका नहीं होता है। हालांकि, कई मामलों में संभावना कार्य स्पष्ट और अच्छी तरह से परिभाषित हैं। अनुमान के लिए संभावना का एक अध्ययन संभवतः सांख्यिकीय प्रमाण के रूप में रिचर्ड रॉयल की छोटी और आसान पुस्तक के साथ शुरू होना चाहिए : एक संभावना प्रतिमान

आपके प्रश्न का उत्तर यह है कि नहीं, किसी भी अंतराल के भीतर अंक सभी की समान संभावना नहीं है। एक विश्वास अंतराल के किनारों पर आमतौर पर अंतराल के केंद्र की ओर दूसरों की तुलना में कम संभावनाएं होती हैं। बेशक, पारंपरिक आत्मविश्वास अंतराल आपको विशेष प्रयोग के लिए प्रासंगिक पैरामीटर के बारे में कुछ भी नहीं बताता है। नेमन के आत्मविश्वास के अंतराल 'वैश्विक' हैं कि वे हाथ में प्रयोग करने के लिए प्रासंगिक 'स्थानीय' गुणों के बजाय लंबे समय तक चलने वाले गुणों के लिए डिज़ाइन किए गए हैं। (खुशी से लंबे समय तक चलने वाले प्रदर्शन को स्थानीय में व्याख्यायित किया जा सकता है, लेकिन यह गणितीय ज्ञान के बजाय एक बौद्धिक शॉर्टकट है।) संभावना के अंतराल - जहां वे निर्माण किए जा सकते हैं - सीधे हाथ में प्रयोग से संबंधित संभावना को दर्शाते हैं।


1
@suncoolsu यह आवश्यक नहीं है कि प्रश्न में अंतराल कथन के सत्य होने की संभावना हो। अंतराल में केवल सबसे अधिक संभावना का अनुमान लगाना होता है ताकि अंतराल सीमा प्रत्येक अंतराल के भीतर एक बिंदु से कम हो। कोई भी सामान्य आत्मविश्वास अंतराल उस आवश्यकता को पूरा करेगा।
माइकल लेउ

2
@pmjones A 95% CI DOEST आपको यह नहीं बताता है कि CI के हाशिये के मान मध्य के मूल्यों की तुलना में सत्य के अधिक निकट हैं या नहीं। सीआई आबादी से बार-बार नमूने लेने के बारे में बयान देते हैं। लंबे समय में (अर्थात, बार-बार नमूना लेने के बाद), 95% ऐसे CI, जो प्रत्येक नमूने के लिए बनाए जाते हैं, वास्तविक मूल्य को कवर करेंगे। इसलिए, दो मुख्य अवलोकन हैं 1) किसी को दिए गए CI 2 के सही मूल्य के बारे में कुछ भी नहीं कहा जा सकता है) CI आपको अवलोकन किए गए डेटा के बारे में कुछ भी नहीं बताते हैं, जो कि एक सामान्य बायेसियन आलोचना है।
सनकूल्सू

1
@MichaelLew लिकलीहुड सिद्धांत उपयोगी है, लेकिन मैं कह रहा था कि (LW के हवाले से) "वास्तव में, प्रायः सभी आक्षेप एलपी का उल्लंघन करते हैं, इसलिए यदि हम एलपी का पालन करते हैं तो हमें बार-बार आक्षेप छोड़ना होगा।" क्योंकि CI एक निरंतर विचार है, यह एलपी का उल्लंघन करता है (जिसे आप मौलिक कहते हैं)।
सनकूलू

1
@suncollsu सवाल यह नहीं है कि क्या केवल एक आत्मविश्वास अंतराल और किसी भी अन्य सांख्यिकीय विचारों के बिना खुद के भीतर पैरामीटर मूल्यों की संभावना के बारे में कुछ भी बताता है। यह अंतराल के भीतर पैरामीटर मूल्यों की संभावना के बारे में है। संभावना फ़ंक्शन प्रश्न का उत्तर देता है, और यह उत्तर सही है भले ही आत्मविश्वास अंतराल संभावना सिद्धांत का उल्लंघन करता हो। (मेरी पिछली टिप्पणी फिर से पढ़ें। आपको लगता है कि आपने इसकी सामग्री को पूरी तरह से नजरअंदाज कर दिया है।)
माइकल लेउ

2
@ rolando2 नेमन के 95% विश्वास अंतराल को डिज़ाइन किया गया है ताकि विधि 95% अवसरों पर सही पैरामीटर शामिल हो जो विधि का उपयोग किया जाता है। कड़ाई से विश्वास करने का तरीका विधि से जुड़ता है न कि किसी व्यक्तिगत अंतराल से और इसलिए व्यक्तिगत अंतराल आपको उस विशेष प्रयोग में दुनिया की स्थिति के बारे में कुछ भी नहीं बताता है। इस सवाल का मेरा जवाब और अधिक विस्तार से देखें: आंकड़े.stackexchange.com/questions/8844/…
माइकल ल्यू

18

मान लीजिए कि किसी ने मुझसे कहा कि मुझे एक मान 95 के भीतर सभी मानों पर बराबर भरोसा रखना चाहिए क्योंकि जनसंख्या मूल्य के संभावित संकेतक हैं। (मैं जानबूझकर "संभावना" और "संभावित" शब्दों से बच रहा हूं)) 95 में क्या खास है? कुछ नहीं: सुसंगत होने के लिए मुझे एक CI96, एक CI97, ... और एक CI99.993999 के भीतर सभी मूल्यों पर समान विश्वास रखना होगा। जैसा कि सीआई के कवरेज ने अपनी सीमा के करीब पहुंच गया, वस्तुतः सभी वास्तविक संख्याओं को शामिल करना होगा। इस निष्कर्ष की पूर्वता मुझे प्रारंभिक दावे को अस्वीकार करने के लिए प्रेरित करेगी।


4
यह एक महान जवाब है! मुझे संभावित सीआई के चरम सीमा तक पहुंचने के प्रभाव के बारे में सोचना चाहिए था। इसे लिखने के लिए धन्यवाद!
pmjjones

2

आइए एक विश्वास अंतराल की परिभाषा के साथ शुरू करें। अगर मैं कहता हूं कि 95% विश्वास अंतराल इस से होता है कि मेरा मतलब है कि उस प्रकृति के बयान 95% समय के बारे में सही होंगे और 5% समय के बारे में गलत होंगे। मुझे जरूरी नहीं कि मैं इस विशेष वक्तव्य के बारे में ९ ५% आश्वस्त हूं । एक 90% आत्मविश्वास अंतराल संकरा और 80% संकरा होगा। इसलिए, जब सोचता है कि वास्तविक मूल्य क्या है, तो मेरे पास मूल्यों में कम विश्वसनीयता है क्योंकि वे किसी विशेष आत्मविश्वास अंतराल के किनारे के करीब और करीब हो जाते हैं।

ध्यान दें कि उपरोक्त सभी गुणात्मक हैं, विशेष रूप से "विश्वसनीयता"। (मैंने उस कथन में "आत्मविश्वास" या "संभावना" शब्द से परहेज किया क्योंकि वे गणितीय सामान ले जाते हैं जो अलग-अलग सहज ज्ञान युक्त सामान से भिन्न हो सकते हैं।) बायेसियन दृष्टिकोण आपके प्रश्न को किसी ऐसी चीज़ के लिए पुनःप्रकाशित करेगा जिसका एक मात्रात्मक उत्तर है लेकिन मैं खोलना नहीं चाहता। कि कीड़े के यहाँ कर सकते हैं।

बॉक्स, हंटर एंड हंटर का क्लासिक पाठ ("सांख्यिकी के लिए प्रयोगकर्ता", विले, 1978) भी मदद कर सकता है। "113 पर विश्वास के अंतराल के समूह" देखें, एफएफ।


चूंकि हम आंशिक रूप से अवधारणाओं में और आंशिक रूप से शब्दार्थ में काम कर रहे हैं, इसलिए मैं आपको बताऊंगा कि आपके दूसरे वाक्य में "... उस प्रकृति के कथन सत्य होंगे ..." निर्दिष्ट किए बिना कि कौन से कथन सत्य होंगे।
rolando2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.