क्या, ठीक है, एक आत्मविश्वास अंतराल है?


86

मैं मोटे तौर पर और अनौपचारिक रूप से जानता हूं कि आत्मविश्वास अंतराल क्या है। हालाँकि, मैं अपने सिर को एक महत्वपूर्ण विस्तार से नहीं लपेट सकता।

एक विश्वास अंतराल यह अनुमान नहीं लगाता है कि पैरामीटर का सही मूल्य विश्वास अंतराल में होने की एक विशेष संभावना है जो वास्तव में प्राप्त आंकड़ों को दिया गया है।

मैंने इस साइट पर कई स्थानों पर बनाए गए समान बिंदुओं को भी देखा है। विकिपीडिया से भी अधिक सही परिभाषा है:

यदि आत्मविश्वास अंतरालों का निर्माण दोहराया (और संभवतः अलग) प्रयोगों के कई अलग-अलग डेटा विश्लेषणों में किया जाता है, तो ऐसे अंतरालों का अनुपात जिसमें पैरामीटर का सही मूल्य होता है, लगभग आत्मविश्वास स्तर से मेल खाते हैं

फिर से, मैंने इस साइट पर कई स्थानों पर इसी तरह के बिंदु देखे हैं। मुझे नहीं मिला। यदि, दोहराया प्रयोगों के तहत, गणना किए गए आत्मविश्वास अंतरालों का अंश जिसमें वास्तविक पैरामीटर है , तो वास्तविक प्रयोग के लिए गणना किए गए आत्मविश्वास अंतराल में कैसे हो सकता है अलावा ? मैं उत्तर की तलाश में हूँ:( 1 - α ) θ ( 1 - α )θ(1α)θ(1α)

  1. ऊपर गलत और सही परिभाषाओं के बीच भेद का स्पष्टीकरण।

  2. आत्मविश्वास अंतराल की एक औपचारिक, सटीक परिभाषा जो स्पष्ट रूप से दिखाती है कि पहली परिभाषा गलत क्यों है।

  3. एक मामले का एक ठोस उदाहरण जहां पहली परिभाषा शानदार रूप से गलत है, भले ही अंतर्निहित मॉडल सही हो।


4
इस पोस्ट में विश्वास अंतराल के मुद्दों की कुछ अच्छी चर्चा की गई है आँकड़े ।stackexchange.com/questions/2356/… । लेख में कहा गया है, मुझे लगता है, कुछ प्रकाश को ठीक से बहाने में मदद करता है कि क्यों उपरोक्त परिभाषाएं विश्वास अंतराल के लिए सही हैं। यह अक्सर होता है जब यह देखा जाता है कि सीआई कैसे टूटते हैं कि कोई उन्हें बेहतर ढंग से समझने में सक्षम है।
प्रायिकिसोलॉजिक

2
मेरे हिस्से ने प्रश्न (+1) की सराहना की। एक प्रतिस्पर्धा वाला भाग इंगित करना चाहता है कि 1. विशाल संख्या में सांख्यिकी उपभोक्ता, जो लोग व्यावहारिक रूप से सांख्यिकी का उपयोग करते हैं, लेकिन रसायन विज्ञान या बाजार अनुसंधान में अपनी बात रखने के लिए दार्शनिक रूप से नहीं, मुद्दों की बारीकियों को कभी समझ नहीं पाएंगे, और हम अक्सर परिणामों की व्याख्या करने के लिए एक नुकसान में हो। 2. यहां तक ​​कि कुछ शुद्धतावादी सांख्यिकीविद भी अनुमान के अंतराल को शामिल करते हुए संभावित रूप से संभावित बयान देने के जाल में पड़ सकते हैं, जब वे यादृच्छिक नमूनों के साथ काम नहीं कर रहे हों। बहुत बड़ा मुद्दा।
rolando2

3
@Mario आपकी धारणा सत्य नहीं है! प्रयोग के 100 पुनरावृत्ति में से, हम उम्मीद करते हैं कि 95 CI (साधन नहीं) का सही (लेकिन अज्ञात) मतलब समाहित किया जाएगा। CI यादृच्छिक है लेकिन सही जनसंख्या का मतलब यह नहीं है।
whuber

6
कमिंग एंड माइलार्डेट (2006) द्वारा एक अच्छा पेपर दिखाया गया है कि 95% प्रतिकृति साधन मूल सीआई में नहीं गिरेंगे, लेकिन केवल 83.4% (वे इस मूल्य को 'कैप्चर प्रतिशत' कहते हैं)। कारण यह है कि परिवर्तनशीलता के दो स्रोत हैं: ए) मूल माध्य की परिवर्तनशीलता चारों ओर mu, और, बी) प्रतिकृति की परिवर्तनशीलता का अर्थ है चारों ओर mu। अधिकांश लोग A को भूल जाते हैं: मूल CI के आसपास निर्मित नहीं है mu!
फेलिक्स एस

2
रुचि रखने वाले पाठक भी इस सूत्र को देखना चाहते हैं: 95% CI का मतलब होने के 95% संभावना क्यों नहीं है?
गंग

जवाबों:


26

आत्मविश्वास के अंतराल के बारे में सोचते समय मुझे यह विचार उपयोगी लगा। यह आपके प्रश्न का उत्तर 3 भी देता है।

चलो और । के दो टिप्पणियों पर विचार करें मूल्यों लेने और टिप्पणियों के लिए इसी और की , और और । फिर के लिए एक 50% विश्वास अंतराल है (के बाद से अंतराल में शामिल अगर या , जिनमें से प्रत्येक है संभावना )।वाई = एक्स + - 1XU(0,1) Yy1Y=X+a12Yy1y2x1x2Xyl=min(y1,y2)yu=max(y1,y2)[yl,yu]aax1<12<x2x1>12>x214

हालांकि, अगर तो हम जानते हैं कि संभावना है कि अंतराल होता है है , नहीं । सूक्ष्मता एक यह है कि एक पैरामीटर के लिए विश्वास अंतराल का मतलब है कि अंतराल के अंतिम बिंदुओं (जो यादृच्छिक परिवर्तनीय हैं) संभावना के साथ पैरामीटर के दोनों ओर झूठ इससे पहले कि आप अंतराल की गणना , पैरामीटर की संभावना नहीं है कि आपके द्वारा अंतराल की गणना करने के बाद अंतराल के भीतर झूठ ।yuyl>12a112z%z% z%


3
ध्यान दें कि लगभग निश्चित रूप से है, इसलिए अंतराल पैरामीटर शामिल है संभावना शून्य के साथ। वास्तव में आपका तर्क काम करता है यदि आप जो अनुमान लगा रहे हैं वह । Y>a[yl,yu]aθ=a+12
क्या

4
मुझे नहीं लगता कि यह काउंटर उदाहरण मान्य है, क्योंकि आप केवल इस संभावना को जानते हैं कि अंतराल में है जो कि देखने के बाद है । यह पूरी तरह से उचित है कि अतिरिक्त जानकारी हासिल करने के बाद संभावना बदल जानी चाहिए। यदि आप सभी जानते हैं कि अंतराल एक 50% विश्वास अंतराल था, तो संभावना अभी भी 1/2 होगी (हालांकि यह एक बायसियन संभावना नहीं होगी, क्योंकि यह किसी विशेष घटना पर लागू होता है जो लंबे समय तक चलने की आवृत्ति नहीं है)θyuyl>1/2
डिक्रान मार्सुपियल

1
यह वास्तव में एक अच्छा उदाहरण है, लेकिन मैं आत्मविश्वास अंतराल की गणना से पहले और बाद में किसी भी तरह से बदल रही संभावनाओं के बारे में आपके बयानों से दृढ़ता से असहमत हूं । इससे कोई मतलब नहीं है, और यह धारणा देता है कि गणित किसी भी तरह परवाह करता है कि आप क्या जानते हैं और आप क्या नहीं करते हैं। यह नहीं है !! आप हमेशा कि है । तुम भी हमेशा है है । यह एक विरोधाभास नहीं है, एक बस बिना शर्त संभावना है और दूसरा एक सशर्त संभावना है। P(a[yl,yu])12P(a[yl,yu]|yuyl>12)1
एफजीपी

2
@ एफजीपी, हाँ, शायद यह टेलर की ओर से खराब हो रहा है जो संभावनाओं को बदलने की बात कर रहा है। कोई संभावनाएं नहीं बदल रही हैं। तर्क क्या दिखा रहा है कि सीआई की गलत समझ को प्रदर्शित करने वाली स्थितियों के लिए यह कैसे आसान है कि तार्किक समस्याओं को जन्म दिया जाए। यदि आपको लगता है कि आपके द्वारा देखा गया सीआई सही होने की 50% संभावना है, लेकिन यह संभवतः सही नहीं हो सकता है, तो आप सीआई की समझ गलत है।
जॉन

36

विश्वास अंतराल से संबंधित कई मुद्दे हैं, लेकिन आइए उद्धरणों पर ध्यान दें। समस्या सही होने की बजाय संभावित गलत व्याख्याओं में निहित है। जब लोग कहते हैं कि "पैरामीटर में कुछ होने की विशेष संभावना है", तो वे पैरामीटर को एक यादृच्छिक चर के रूप में सोच रहे हैं । यह (शास्त्रीय) विश्वास अंतराल प्रक्रिया के दृष्टिकोण का बिंदु नहीं है, जिसके लिए यादृच्छिक चर स्वयं अंतराल है और पैरामीटर निर्धारित किया जाता है, यादृच्छिक नहीं, फिर भी अज्ञात है। यही कारण है कि इस तरह के बयानों पर अक्सर हमला किया जाता है।

गणित के अनुसार, अगर हम करते हैं किसी भी प्रक्रिया है कि डेटा नक्शे हो पैरामीटर अंतरिक्ष के सबसेट के लिए और अगर (कोई बात नहीं क्या पैरामीटर का मान हो सकता है) अभिकथन एक घटना को परिभाषित करता है , फिर - परिभाषा के अनुसार - इसमें एक संभाव्यता के किसी भी संभावित मूल्य के लिए । जब विश्वास के साथ एक विश्वास अंतराल प्रक्रिया है की तो यह संभावना एक infimum (सभी पैरामीटर मान से अधिक) के लिए माना जाता हैtx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α। (इस मानदंड के अधीन, हम आमतौर पर ऐसी प्रक्रियाओं का चयन करते हैं जो कुछ अतिरिक्त संपत्ति का अनुकूलन करती हैं, जैसे कि संक्षिप्त आत्मविश्वास अंतराल या सममित का उत्पादन करना, लेकिन यह एक अलग मामला है।) बड़ी संख्या का कमजोर कानून फिर दूसरे उद्धरण को सही ठहराता है। हालांकि, यह विश्वास अंतराल की परिभाषा नहीं है: यह केवल एक संपत्ति है जो उनके पास है।

मुझे लगता है कि इस विश्लेषण ने प्रश्न 1 का उत्तर दिया है, यह दर्शाता है कि प्रश्न 2 का आधार गलत है, और प्रश्न 3 को गलत बनाता है।


3
एक उत्कृष्ट प्रश्न का उत्तर प्रदान करने के लिए धन्यवाद। क्या मैं आगे की चर्चा के लिए निम्नलिखित सादृश्य ला सकता हूं? मान लीजिए कि मैं एक निष्पक्ष सिक्के को पलटा देता हूं। फिर, । अब, मैं एक बार सिक्का फड़फड़ाता हूं, लेकिन आपको नहीं दिखाता कि मैं क्या फड़फड़ाता हूं, और मैं पूछता हूं: "क्या संभावना है कि सिर ऊपर हैं?"। आप उस प्रश्न का उत्तर कैसे देंगे? P(Head)=.50
वोल्फगैंग

3
इसे वाक्यांश करने का एक और तरीका है: गैर-बेयसियन के लिए, एकमात्र "चीजें" जो एक संभावना हो सकती हैं, संभावित घटनाएं हैं - एक यादृच्छिक प्रयोग के भविष्य के परिणामों के अर्थ में। यह देखते हुए कि पैरामीटर का एक निश्चित वास्तविक मान है, एक बार जब आपके पास विशिष्ट मानों के साथ अंतराल होता है, तो यह अब एक संभावित घटना नहीं है कि क्या पैरामीटर अंतराल में शामिल है या नहीं। नतीजतन, आप उस प्रक्रिया में विश्वास कर सकते हैं जो अंतराल उत्पन्न करता है, लेकिन दो विशिष्ट संख्याओं में नहीं।
काराकल

1
@caracal - विचार के लिए सिर्फ कुछ भोजन, एक "सिक्का फ्लिप" हर सही मायने में "यादृच्छिक" है? यदि आप "हाँ" कहते हैं, तो आप इस विचार को अस्वीकार कर देंगे कि क्या कोई सिक्का सिर पर आता है, कई चीजों का एक निर्धारक (लेकिन जटिल) कार्य है (जैसे- हवा, ऊंचाई, बल और कोण का कोण, सिक्के का वजन, इत्यादि। ।)। मुझे लगता है कि यह "यादृच्छिकता" के दोहरे मानक को दर्शाता है जो सीआई-आधारित सोच पर लागू होता है। डेटा तय हो गए हैं लेकिन हम इसके मूल्य के बारे में अनिश्चित हैं (इरगो डेटा यादृच्छिक हैं ), जबकि पैरामीटर तय किए गए हैं लेकिन हम इसके मूल्य के बारे में अनिश्चित हैं ( एर्गो पैरामीटर यादृच्छिक नहीं हैं )।
probabilityislogic

4
@ वोल्फगैंग मैं यह नहीं देखता कि आपका उदाहरण आत्मविश्वास के अंतराल से कैसे जुड़ा है। आप डिस्ट्रीब्यूशन पैरामीटर से संबंधित कुछ नहीं मांगते हैं। आपकी स्थिति भविष्यवाणी के अंतराल से सबसे अधिक निकट है मुझे लगता है कि इस पूरी चर्चा में उस संदर्भ में कुछ रुचि हो सकती है, लेकिन यह विश्वास अंतराल के बारे में एक सूत्र में नहीं है।
whuber

2
@ वाउचर यह प्रश्न कि क्या कोई विशेष 95% CI के बारे में संभाव्यता कथन दे सकता है सही अज्ञात पैरामीटर को कैप्चर करना इस प्रश्न के समान है कि क्या कोई विशिष्ट फ्लिप के बारे में प्रायिकता कथन कर सकता है जहां परिणाम अभी भी अज्ञात है। लंबे समय में, 95% सीआई पैरामीटर पर कब्जा कर लेंगे। लंबे समय में, 50% फ़्लिप प्रमुख हैं। क्या हम कह सकते हैं कि 95% संभावना है कि कोई विशेष CI पैरामीटर कैप्चर करता है? क्या हम कह सकते हैं कि 50% संभावना है कि सिर देखने से पहले उठ रहे हैं? मैं दोनों को हाँ कहूँगा। लेकिन कुछ लोग असहमत हो सकते हैं।
वोल्फगैंग

19

मैं CI की परिभाषा को गलत नहीं कहूंगा, लेकिन संभावना की एक से अधिक परिभाषा होने के कारण वे गलत व्याख्या करना आसान हैं। CI प्रायिकता (आवृत्तिवादी या ऑन्थोलॉजिकल) की निम्नलिखित परिभाषा पर आधारित हैं

(1) एक प्रस्ताव की संभावना = प्रस्ताव के सही होने के लिए लंबे समय के अनुपात में डेटा उत्पादन प्रक्रिया पर सही, सशर्त होना देखा जाता है

इस प्रकार, सीआई का उपयोग करने के लिए वैचारिक रूप से मान्य होने के लिए, आपको संभाव्यता की इस परिभाषा को स्वीकार करना चाहिए । यदि आप नहीं करते हैं, तो आपका अंतराल एक सीआई नहीं है, सैद्धांतिक दृष्टिकोण से।

यही कारण है कि परिभाषा ने शब्द अनुपात का उपयोग किया और संभावना शब्द का उपयोग नहीं किया , यह स्पष्ट करने के लिए कि संभाव्यता की "लंबी अवधि की आवृत्ति" परिभाषा का उपयोग किया जा रहा है।

प्रोबेबिलिटी (महामारी तर्क या बायेसियन के विस्तार के रूप में एपिस्टेमोलॉजिकल या संभावना) की मुख्य वैकल्पिक परिभाषा है

(2) प्रस्ताव की संभावना = विश्वास की तर्कसंगत डिग्री कि प्रस्ताव सत्य है, ज्ञान की स्थिति पर सशर्त है

लोग अक्सर सहज ज्ञान युक्त इन दोनों परिभाषाओं को मिलाते हैं, और जो भी व्याख्या का उपयोग करते हैं वह उनके अंतर्ज्ञान के लिए अपील करता है। यह आपको सभी प्रकार की भ्रामक स्थितियों में पहुंचा सकता है (विशेषकर तब जब आप एक प्रतिमान से दूसरे पर जाते हैं)।

दो दृष्टिकोण अक्सर एक ही परिणाम की ओर ले जाते हैं, जिसका अर्थ है कि हमारे पास कुछ मामलों में:

इस धारणा की तर्कसंगत डिग्री कि प्रस्ताव सत्य है, ज्ञान की स्थिति पर सशर्त = लंबे समय तक चलने का अनुपात है कि प्रस्ताव को सत्य माना जाता है, डेटा जनरेट करने की प्रक्रिया पर सशर्त

मुद्दा यह है कि यह सार्वभौमिक रूप से धारण नहीं करता है , इसलिए हम दो अलग-अलग परिभाषाओं को हमेशा एक ही परिणाम के लिए नेतृत्व करने की उम्मीद नहीं कर सकते हैं। इसलिए, जब तक आप वास्तव में बायेसियन समाधान नहीं करते हैं, और फिर इसे समान अंतराल पाते हैं, तो आप CI द्वारा दिए गए अंतराल को सही मान रखने की संभावना के रूप में व्याख्या नहीं दे सकते। और अगर आप करते हैं, तो अंतराल एक कॉन्फिडेंस इंटरवल नहीं है, बल्कि एक विश्वसनीय इंटरवल है।


2
मैं यह नहीं देखता कि परिभाषा 1 के अनुसार प्रस्ताव की संभावना तर्कसंगत संख्या क्यों होनी चाहिए। लंबी अवधि के अनुपात में समय के अनुपात की सीमा को संदर्भित करने के लिए ऐसा लगता है कि प्रस्ताव सत्य माना जाता है। प्रत्येक अनुपात एक परिमेय संख्या है, लेकिन उनकी सीमा नहीं हो सकती है। (सौभाग्य से, आपके इस कोष्ठक स्पर्शरेखा पर सबसे अच्छा अपने जवाब के बाकी लगता है।)
क्या

3
@probability यह उत्तर हमें बहुत ही रचनात्मक तरीके से एक स्पर्शरेखा पर उतारने के लिए लगता है। समानता और अनुपात का समीकरण ऑन्कोलॉजिकल भ्रम का एक रूप है, थर्मामीटर में पारे के स्तर के साथ एक तापमान को बराबर करने के लिए समान: एक सैद्धांतिक निर्माण है और दूसरा इसे मापने के लिए उपयोग किया जाने वाला एक भौतिक घटना है। इस पर कुछ चर्चा आकड़ों की है ।stackexchange.com / questions / 1525 /
व्हिबर

@Didier - तुम सही हो, वास्तव में के अनुक्रम , जो तर्कहीन सीमा के साथ तर्कसंगत है। मैंने यह टिप्पणी हटा दी है। इसे यहां लाने के लिए धन्यवाद। xn=r2xn1+xn12r
probabilityislogic

6
@whuber - इस बिंदु को लाने के लिए प्रासंगिक है क्योंकि यह वास्तव में यह गलतफहमी है जो लोगों को गलत तरीके से CI की व्याख्या करने की ओर ले जाता है। "विश्वास की तर्कसंगत डिग्री" के साथ भ्रमित होने की संभावना लगातार प्रतिमान के अनुरूप नहीं है। ऐसा तब होता है जब आप CI को "अंतराल में होने वाले सच्चे मूल्य की संभावना" का मतलब लेने के लिए लेते हैं, जो कि प्रश्न में @dsimcha क्या कर रहा है।
संभाव्यताविषयक

1
@probability स्पष्टीकरण के लिए धन्यवाद। मैंने आपके उत्तर को "संभावना = अनुपात" की परिभाषा के अनुरूप समझा था। वास्तव में, एक करीबी तर्क अभी भी यह सुझाव देता है कि आप तीसरे पैराग्राफ में क्या कह रहे हैं, हालांकि आपकी टिप्पणी अब इसे गलतफहमी के रूप में दर्शाती है। आप इस बिंदु को स्पष्ट करना चाह सकते हैं।
व्हिबर

6

आरए फिशर के पास आत्मविश्वास अंतराल की उपयोगिता के लिए एक मानदंड था: एक सीआई को "पहचानने योग्य सबसेट" को स्वीकार नहीं करना चाहिए जो एक अलग आत्मविश्वास स्तर का संकेत देता है। अधिकांश (यदि सभी नहीं) काउंटरटेम्पल हैं, तो हमारे पास ऐसे मामले हैं जहां पहचाने जाने योग्य उपसमुच्चय हैं जिनमें अलग-अलग कवरेज संभावनाएं हैं।

शोध के मामलों में, आप या तो बायेसियन क्रेडेंशियल इंटरवल का उपयोग कर सकते हैं, जहां पैरामीटर है, एक व्यक्तिपरक अर्थ निर्दिष्ट करने के लिए, या आप डेटा को देखते हुए पैरामीटर में रिश्तेदार अनिश्चितता को प्रतिबिंबित करने के लिए एक संभावना अंतराल बना सकते हैं।

उदाहरण के लिए, एक मामला जो अपेक्षाकृत विरोधाभास-मुक्त लगता है, वह आबादी के मतलब के लिए 2-पक्षीय सामान्य विश्वास अंतराल है। दिए गए std के साथ एक सामान्य आबादी से नमूना मानते हुए, 95% CI बिना किसी पहचान के सबसेट को स्वीकार करता है जो पैरामीटर के बारे में अधिक जानकारी प्रदान करेगा। यह इस तथ्य से देखा जा सकता है कि नमूना माध्य संभावना फ़ंक्शन में पर्याप्त आँकड़ा है - अर्थात, नमूना माध्य ज्ञात होने के बाद संभावना फ़ंक्शन व्यक्तिगत नमूना मानों से स्वतंत्र होता है।

हमारे पास सामान्य अर्थ के लिए 95% सममित सीआई में किसी भी व्यक्तिपरक आत्मविश्वास है, जो कथित कवरेज संभावना से कम है और इस तथ्य से अधिक है कि सामान्य मतलब के लिए सममित 95% सीआई "उच्चतम संभावना" अंतराल है, अर्थात, सभी अंतराल के भीतर पैरामीटर मान अंतराल के बाहर किसी भी पैरामीटर मान से अधिक होने की संभावना है। हालांकि, चूंकि संभावना एक संभावना नहीं है (लंबे समय तक सटीकता की भावना में), यह एक व्यक्तिपरक मानदंड से अधिक है (जैसा कि पूर्व और संभावना के बायेसियन उपयोग है)। संक्षेप में, सामान्य अर्थ के लिए असीम रूप से कई अंतराल हैं जिनमें 95% कवरेज की संभावना है, लेकिन केवल सममित सीआई में सहज प्लॉस्बिलिटी है जो हम अंतराल अनुमान से उम्मीद करते हैं।

इसलिए, आरए फिशर की कसौटी का अर्थ है कि कवरेज की संभावना केवल व्यक्तिपरक आत्मविश्वास के साथ समानता होनी चाहिए, अगर यह इनमें से किसी भी पहचान योग्य हेलमेट की प्रशंसा करता है। यदि उपसमुच्चय मौजूद हैं, तो सबसेट का वर्णन करने वाले पैरामीटर (एस) के वास्तविक मूल्यों पर कवरेज संभाव्यता सशर्त होगी। आत्मविश्वास के सहज स्तर के साथ एक अंतराल प्राप्त करने के लिए, आपको उपयुक्त सहायक आँकड़ों पर अंतराल एस्टीमेट को शर्त करने की आवश्यकता होगी जो उपसमूह की पहचान करने में मदद करें। या, आप फैलाव / मिश्रण मॉडल का सहारा ले सकते हैं, जो स्वाभाविक रूप से मापदंडों को यादृच्छिक चर (उर्फ बायेसियन आंकड़े) के रूप में व्याख्या करने की ओर ले जाता है या आप संभावना रूपरेखा के तहत प्रोफ़ाइल / सशर्त / सीमांत संभावना की गणना कर सकते हैं। किसी भी तरह से, आपने सही होने की एक निष्पक्ष रूप से सत्यता के साथ आने की किसी भी उम्मीद को छोड़ दिया है,

उम्मीद है की यह मदद करेगा।


1
(+1) सममित सामान्य CI को सही ठहराने का एक तरीका यह है कि यह अपेक्षित लंबाई को कम करता है। अंतत: यह सिर्फ निर्णय प्रक्रिया में एक हानि समारोह के रूप में लंबाई की पसंद के लिए व्यक्तिपरकता को पीछे धकेलता है: लेकिन यह निश्चित रूप से एक "अच्छा" प्रकार की विषयवस्तु है (क्योंकि यह सांख्यिकीय प्रक्रिया की हमारी पसंद में हमारे विश्लेषणात्मक उद्देश्यों की भूमिका को उजागर करता है) "खराब" व्यक्तिपरकता, जो कुछ पीजोरेटिव एपिटेट जैसा लगता है।
whuber

5

एक से सैद्धांतिक दृष्टिकोण प्रश्न 2 और 3 गलत धारणा है कि परिभाषाओं गलत हैं पर आधारित हैं। इसलिए मैं उस संबंध में @ व्हिबर के उत्तर के साथ समझौता कर रहा हूं, और प्रश्न 1 के लिए व्हिबर के उत्तर से मुझे किसी भी अतिरिक्त इनपुट की आवश्यकता नहीं है।

हालांकि, अधिक व्यावहारिक दृष्टिकोण से एक आत्मविश्वास अंतराल को इसकी सहज परिभाषा (वास्तविक मूल्य युक्त होने की संभावना) दी जा सकती है जब यह समान जानकारी (यानी गैर-सूचनात्मक पूर्व) के आधार पर एक बायेसियन विश्वसनीय अंतराल के साथ संख्यात्मक रूप से समान हो।

लेकिन यह कुछ हद तक कठिन एंटी-बायेसियन के लिए निराशाजनक है, क्योंकि अपने सीआई को वह व्याख्या देने के लिए शर्तों को सत्यापित करने के लिए वह उसे देना चाहता है, उन्हें बायेसियन समाधान को काम करना होगा, जिसके लिए सहज व्याख्या स्वचालित रूप से रखती है!

सबसे आसान उदाहरण एक सामान्य विचरण के लिए सामान्य अर्थ के लिए आत्मविश्वास अंतराल है , और पीछे विश्वसनीय विश्वसनीय अंतराल ।1αx¯±σZα/21αx¯±σZα/2

मैं शर्तों के बारे में बिल्कुल निश्चित नहीं हूं, लेकिन मुझे पता है कि CI की सहज व्याख्या के लिए निम्नलिखित महत्वपूर्ण हैं:

1) एक धुरी सांख्यिकीय मौजूद है, जिसका वितरण मापदंडों से स्वतंत्र है (क्या सटीक पिवोट सामान्य और ची-स्क्वायर वितरण के बाहर मौजूद हैं?)

2) कोई उपद्रव पैरामीटर नहीं हैं, (एक निर्णायक सांख्यिकीय के मामले को छोड़कर, जो कुछ सटीक तरीकों में से एक है जो सीआई बनाते समय उपद्रव मापदंडों को संभालना है)

3) ब्याज के पैरामीटर के लिए एक पर्याप्त आंकड़ा मौजूद है, और आत्मविश्वास अंतराल पर्याप्त सांख्यिकीय का उपयोग करता है

4) पर्याप्त आंकड़े और पीछे के वितरण के नमूने वितरण में पर्याप्त आंकड़े और पैरामीटर के बीच समरूपता होती है। सामान्य मामले में नमूना वितरण समरूपता जबकि ।(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

ये स्थितियां आमतौर पर ढूंढना मुश्किल होता है, और आमतौर पर बायेसियन अंतराल के बाहर काम करना और इसकी तुलना करना जल्दी होता है। एक दिलचस्प अभ्यास इस प्रश्न का उत्तर देने के लिए भी हो सकता है "मेरे सीआई भी एक विश्वसनीय अंतराल से पहले क्या है?" आप इस पूर्व को देखकर अपनी सीआई प्रक्रिया के बारे में कुछ छिपी हुई धारणाओं की खोज कर सकते हैं।


1
(+1) क्या वास्तव में ऐसा कोई व्यक्ति "एंटी-बायेसियन" है? :-)
whuber

6
@whuber यहाँ एक है । और यहाँ एक अर्थशास्त्री है जो सांख्यिकी के दर्शन में छात्रवृत्ति पर उसके साथ सहयोग करता है।
सियान

1
धन्यवाद! यह संभाव्यता और आँकड़ों के दर्शन में एक अत्यंत रोचक सूत्र है जिससे मैं अनजान था।
whuber

1
क्या आप miswrite लापता के रूप में ? x¯±zα/2σnn
२३:१५ को

3

यह वह चीज़ है जिसे समझना मुश्किल हो सकता है:

  • यदि सभी आत्मविश्वास अंतराल के औसतन 95% में पैरामीटर होगा
  • और मेरे पास एक विशिष्ट आत्मविश्वास अंतराल है
  • यह संभावना क्यों नहीं है कि इस अंतराल में पैरामीटर भी 95% है?

एक आत्मविश्वास अंतराल नमूनाकरण प्रक्रिया से संबंधित है। यदि आप कई नमूने लेते हैं और प्रत्येक नमूने के लिए 95% विश्वास अंतराल की गणना करते हैं, तो आप पाएंगे कि उन अंतरालों में से 95% में जनसंख्या का मतलब होता है।

यह उदाहरण के लिए औद्योगिक गुणवत्ता विभागों के लिए उपयोगी है। वे लोग कई नमूने लेते हैं, और अब उन्हें विश्वास है कि उनके अधिकांश अनुमान वास्तविकता के बहुत करीब होंगे। वे जानते हैं कि उनके अनुमानों का 95% बहुत अच्छा है, लेकिन वे यह नहीं कह सकते कि प्रत्येक और प्रत्येक विशिष्ट अनुमान के बारे में।

इसकी तुलना डाइसिंग रोल से करें: यदि आप 600 (फेयर) पासे को रोल करेंगे, तो आप कितने 6 फेंकेंगे? आपका सबसे अच्छा अनुमान * 600 = 100 है।16

हालांकि, यदि आपने वन डाई को फेंक दिया है, तो यह कहना बेकार है: "1/6 या 16.6% संभावना है कि मैंने अब 6 फेंक दिया है"। क्यों? क्योंकि मरना या तो एक 6, या कुछ अन्य आंकड़ा दिखाता है। आपने 6 या नहीं फेंका है। तो संभावना 1 है, या 0. संभाव्यता नहीं हो सकती है ।16

थ्रो से पहले यह पूछे जाने पर कि वन डाई के साथ 6 को फेंकने की संभावना क्या होगी, एक बायेसियन जवाब देगा " " (पूर्व जानकारी के आधार पर: हर कोई जानता है कि एक मरने के 6 पक्ष और एक समान मौका होता है दोनों में से किसी पर भी गिरना), लेकिन एक फ़्रीक्वेंटिस्ट "नो आइडिया" कहेगा, क्योंकि अक्सरवाद डेटा पर आधारित होता है, न कि पुजारियों या किसी बाहरी सूचना पर।16

इसी तरह, यदि आपके पास केवल 1 नमूना है (इस प्रकार 1 आत्मविश्वास अंतराल), तो आपके पास यह कहने का कोई तरीका नहीं है कि यह कितनी संभावना है कि जनसंख्या का मतलब उस अंतराल में है। माध्य (या कोई भी पैरामीटर) या तो इसमें है, या नहीं। संभावना या तो 1, या 0 है।

इसके अलावा, यह सही नहीं है कि कॉन्फिडेंस इंटरवल के भीतर के मूल्य उस से अधिक होने की संभावना है। मैंने एक छोटा चित्रण किया; सब कुछ ° C में मापा जाता है। याद रखें, पानी 0 ° C पर जम जाता है और 100 ° C पर उबलता है।

मामला: एक ठंडी झील में, हम बर्फ के नीचे बहने वाले पानी के तापमान का अनुमान लगाना चाहते हैं। हम 100 स्थानों में तापमान को मापते हैं। यहाँ मेरा डेटा हैं:

  • 0.1 डिग्री सेल्सियस (49 स्थानों में मापा जाता है);
  • 0.2 डिग्री सेल्सियस (49 स्थानों में भी);
  • 0 डिग्री सेल्सियस (1 स्थान पर। यह पानी बस जमने वाला था);
  • 95 डिग्री सेल्सियस (एक स्थान पर, एक कारखाना है जो झील में अवैध रूप से बहुत गर्म पानी डंप करता है)।
  • औसत तापमान: 1.1 डिग्री सेल्सियस;
  • मानक विचलन: 1.5 डिग्री सेल्सियस;
  • 95% -CI: (-0.8 ° C ...... + 3.0 ° C)।

इस विश्वास अंतराल के भीतर तापमान निश्चित रूप से इसके बाहर के लोगों की तुलना में अधिक संभावना नहीं है। इस झील में बहने वाले पानी का औसत तापमान 0 ° C से अधिक ठंडा नहीं हो सकता, अन्यथा यह पानी नहीं बल्कि बर्फ होगा। इस विश्वास अंतराल का एक हिस्सा (अर्थात्, -0.8 से 0 तक का खंड) वास्तव में 0% की संभावना है जिसमें सच्चे पैरामीटर शामिल हैं।

निष्कर्ष में: आत्मविश्वास अंतराल एक निरंतरवादी अवधारणा है, और इसलिए दोहराया नमूनों के विचार पर आधारित हैं। यदि कई शोधकर्ता इस झील से नमूने लेते हैं, और यदि वे सभी शोधकर्ता विश्वास अंतराल की गणना करेंगे, तो उन अंतरालों में से 95% में सही पैरामीटर होगा। लेकिन एक एकल आत्मविश्वास अंतराल के लिए यह कहना असंभव है कि यह कितना संभव है कि इसमें सही पैरामीटर है।


1
इस तथ्य को भ्रमित न करें कि बार-बार होने वाला आँकड़ा एक विश्वासवादी व्यक्ति के साथ पहले से विश्वास रखने और उन्हें अद्यतन करने के लिए विश्वास को मापता नहीं है। अंतर यह नहीं है कि क्या व्यक्ति के डेटा के बाहर कोई ज्ञान नहीं है, लेकिन क्या निरंतरवादी आंकड़े विश्वास राज्यों के प्रत्यक्ष उपाय प्रदान करते हैं। परीक्षणकर्ता, सीआई, आदि के आधार पर लगातार अपने विश्वास को अद्यतन करना चाहिए अन्यथा उनकी पूरी प्रणाली काम नहीं करती है क्योंकि सब कुछ किए गए निर्णयों पर निर्भर करता है।
जॉन

2

ठीक है, मुझे एहसास है कि जब आप शास्त्रीय अचरवादी तरीकों का उपयोग कर एक पैरामीटर के लिए 95% विश्वास अंतराल की गणना करते हैं, तो इसका मतलब यह नहीं है कि 95% संभावना है कि पैरामीटर उस अंतराल के भीतर निहित है। और फिर भी ... जब आप बायेसियन दृष्टिकोण से समस्या का सामना करते हैं, और पैरामीटर के लिए 95% विश्वसनीय अंतराल की गणना करते हैं, तो आप प्राप्त करते हैं (गैर-सूचनात्मक पूर्व ग्रहण करते हुए) बिल्कुल वही अंतराल जो आपको शास्त्रीय दृष्टिकोण का उपयोग करके मिलता है। तो, अगर मैं शास्त्रीय आंकड़ों का उपयोग के लिए (जैसे) 95% विश्वास अंतराल किसी डेटा सेट की गणना करने के लिए मतलब है, तो यह है सच 95% आशंका यह है कि उस पैरामीटर कि अंतराल में निहित है।


5
चाहे आप लगातार परिणाम आत्मविश्वास अंतराल और बायेसियन विश्वसनीय अंतराल का उपयोग करके एक ही परिणाम प्राप्त करते हैं, समस्या पर निर्भर करता है, और विशेष रूप से बायेसियन दृष्टिकोण में उपयोग किए जाने वाले पूर्व वितरण पर। गणित और विज्ञान में यह भी महत्वपूर्ण है कि जब आप सही होते हैं तो आप सही कारण के लिए सही होते हैं!
डिक्रान मार्सुपियल

4
यदि आप "[एक पैरामीटर] के लिए 95% विश्वास अंतराल की गणना करने के लिए शास्त्रीय आंकड़ों का उपयोग करते हैं," तो, यदि आप लगातार तर्क कर रहे हैं, तो "संभावना है कि पैरामीटर उस अंतराल में निहित है" का उल्लेख करना व्यर्थ है। जिस क्षण आप उस संभावना का उल्लेख करते हैं, आपने स्थिति के अपने सांख्यिकीय मॉडल को बदल दिया है। नए मॉडल में, जहां पैरामीटर यादृच्छिक है, बार-बार तरीकों का उपयोग करके CI की गणना करना गलत है। कुछ स्थितियों में इस तरह से सही उत्तर प्राप्त करना दिलचस्प है, लेकिन इसे समझने वाली वैचारिक उलझन को उचित नहीं ठहराता है।
whuber

4
@whuber - आपका आधार "... यदि आप लगातार तर्क कर रहे हैं ..." अच्छे पुराने कॉक्स प्रमेय का परिणाम है। यह कहता है कि यदि आप लगातार तर्क कर रहे हैं, तो आपका समाधान गणितीय रूप से एक बायेसियन के बराबर होना चाहिए। इसलिए, इस आधार को देखते हुए, एक सीआई अनिवार्य रूप से एक विश्वसनीय अंतराल के बराबर होगा, और एक संभावना के रूप में इसकी व्याख्या एक वैध है। और बेयस में, यह पैरामीटर नहीं है जिसका वितरण है, यह उस पैरामीटर के बारे में अनिश्चितता है जिसका वितरण है।
probabilityislogic

2
... cont'd ... तो मैं एक बायसीयन का मूर्खतापूर्ण खेल खेल सकता हूं "शायद वह पैरामीटर अंतराल में है", मैं लगातार "संभावना है कि अंतराल पैरामीटर को कवर करता है", मैं एक बायेसियन हूं ..., मैं एक व्यक्तिवादी हूं, ..., मैं एक बायेसियन हूं ..., मैं एक व्यक्तिवादी हूं, ..... जबकि वास्तविक गणना के सभी नंबर कभी नहीं बदलते हैं
संभाव्यताजन्य

2

आप फ़्रीक्वेंटिस्ट विश्वास अंतराल के बारे में पूछ रहे हैं । परिभाषा (ध्यान दें कि आपके 2 उद्धरणों में से कोई भी एक परिभाषा नहीं है! बस कथन, जो दोनों सही हैं):

अगर मैंने इस प्रयोग को कई बार दोहराया है, तो इस पैरामीटर मानों के साथ यह फिट मॉडल दिया गया , 95% प्रयोगों में एक पैरामीटर का अनुमानित मूल्य इस अंतराल के भीतर गिर जाएगा।

इसलिए आपके पास एक मॉडल है (आपके द्वारा देखे गए डेटा का उपयोग करके बनाया गया है) और इसके अनुमानित पैरामीटर। फिर यदि आप इस मॉडल और मापदंडों के अनुसार कुछ काल्पनिक डेटा सेट उत्पन्न करते हैं , तो अनुमानित पैरामीटर विश्वास अंतराल के अंदर गिर जाएंगे।

इसलिए वास्तव में, यह लगातार दृष्टिकोण मॉडल और अनुमानित मापदंडों को निर्धारित के रूप में लेता है, जैसा कि दिया गया है, और आपके डेटा को अनिश्चित - कई अन्य संभावित डेटा के यादृच्छिक नमूने के रूप में मानता है।

यह व्याख्या करना वास्तव में कठिन है और इसे अक्सर बायेसियन आँकड़ों के लिए एक तर्क के रूप में उपयोग किया जाता है ( जो मुझे लगता है कि कभी-कभी थोड़ा विवादित हो सकता है । दूसरी तरफ बायेसियन आँकड़े आपके डेटा को निश्चित रूप से लेते हैं और मापदंडों को अनिश्चित मानते हैं। द्विअर्थी विश्वसनीय अंतराल हैं) तब वास्तव में सहज, जैसा कि आप उम्मीद करेंगे: बायेसियन विश्वसनीय अंतराल ऐसे अंतराल हैं जहां 95% वास्तविक पैरामीटर मान निहित है।

लेकिन व्यवहार में बहुत से लोग उसी तरह से लगातार विश्वास अंतराल की व्याख्या करते हैं जैसे कि बायेसियन विश्वसनीय अंतराल और कई सांख्यिकीविद् इसे एक बड़ा मुद्दा नहीं मानते हैं - हालांकि वे सभी जानते हैं, यह 100% सही नहीं है। व्यवहार में भी, बायिसियन अनइनफॉर्मेटिव पादरियों का उपयोग करते समय लगातार और बायेसियन आत्मविश्वास / विश्वसनीय अंतराल बहुत भिन्न नहीं होंगे


-1 आपकी "परिभाषा" गलत प्रतीत होती है, कम से कम इसे पढ़ने में। सीआई कवर करने के लिए निर्माण किया है सच संभावना के साथ पैरामीटर । यह किसी विशेष मॉडल या मापदंडों को फिट करने की विधि पर सशर्त नहीं है। शायद मैं परिभाषा को गलत बता रहा हूं, हालांकि: मैं "इस पैरामीटर मान के साथ इस फिट मॉडल को लेता हूं" पैरामीटर के अपने वर्तमान अनुमान का उल्लेख करने के लिए। यदि ऐसा नहीं है कि आप इसे कैसे चाहते हैं, तो शायद आप इस बिंदु को स्पष्ट कर सकते हैं? 1 - α1α1α
whuber

@ शुभंकर, ठीक है, मैं इसे लेता हूं, लेकिन अगर आप कहते हैं कि मेरी निश्चितता गलत है, तो कृपया सीआई क्या है इसकी पूरी परिभाषा पोस्ट करें।
जिज्ञासु

मैंने अपनी टिप्पणी, टॉमस को स्पष्ट कर दिया है, क्योंकि यह मेरे लिए होता है मैं आपकी परिभाषा को एक तरह से पढ़ सकता हूं जो आपने इरादा नहीं किया था। Kiefer, सांख्यिकीय Inference का परिचय , लिखते हैं "[T] प्रयोग का परिणाम ... [S] प्रक्रिया का उपयोग का अनुमान लगाने के लिए किया जाता है और इसका सही मान है ... [टी] वह मात्रा .. । संख्या को प्रक्रिया का आत्मविश्वास गुणांक कहा जाता है ... को a कहा जाता है।Xt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttविश्वास अंतराल। "
whuber

@whuber, आपकी परिभाषा मेरे लिए वास्तव में असुविधाजनक है और मैं ज्यादातर लोगों के लिए भी डरता हूं :) और हां, मेरा वर्तमान अनुमान है, जैसा कि अक्सर कहा जाता है कि पैरामीटर का अनुमान दिया गया है और डेटा को यादृच्छिक के रूप में, बायेसियन के विपरीत है।
जिज्ञासु

3
मुझे लगता है कि आपकी परिभाषा में मुख्य मुद्दा उत्सुक है, "... एक पैरामीटर का अनुमानित मूल्य अंतराल के भीतर गिर जाएगा।" यह एक अनुमानित पैरामीटर नहीं है, लेकिन एक अज्ञात निश्चित पैरामीटर है; और यह अंतराल के भीतर नहीं गिरता है, बल्कि अंतराल चारों ओर घूमता है और 95% समय पैरामीटर को पकड़ता है।
जॉन

2

मान लीजिए हम एक साधारण स्थिति में हैं। आप एक अज्ञात पैरामीटर और की एक आकलनकर्ता 1 (अनौपचारिक) के चारों ओर एक अस्पष्टता है। आपको लगता है कि (अनौपचारिक रूप से) में होना चाहिए ।θTθθ[T1;T+1]

एक वास्तविक प्रयोग में आप निरीक्षण करते हैं ।T=12

यह सवाल उठना स्वाभाविक है कि "मैं क्या देख रहा हूं ( ), संभावना "क्या है?" गणितीय रूप से: । प्रत्येक व्यक्ति स्वाभाविक रूप से यह प्रश्न पूछता है। विश्वास अंतराल सिद्धांत को तार्किक रूप से इस प्रश्न का उत्तर देना चाहिए। लेकिन यह नहीं है।T=12θ[11;13]P(θ[11;13]|T=12)

बायेसियन आँकड़े उस प्रश्न का उत्तर देते हैं। बायेसियन स्टेटिस्टिक में, आप वास्तव में गणना । लेकिन आपको प्रयोग करने और देखने से पहले एक the लिए एक वितरण की आवश्यकता है । उदाहरण के लिए :P(θ[11;13]|T=12)θT

  • मान लें कि का पर एक पूर्व वितरण समान हैθ[0;30]
  • इस प्रयोग को करें,T=12
  • बायस फॉर्मूला लागू करें:P(θ[11;13]|T=12)=0.94

लेकिन अक्सर आंकड़ों में, कोई पूर्व और इस तरह कुछ भी नहीं है जैसे मौजूद नहीं है। इसके बजाय सांख्यिकीविद कुछ इस तरह कहते हैं: "जो कुछ भी है, संभावना है कि वह "। गणितीय रूप से: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

इसलिए :

  • बायेसियन: के लिएटी = 12P(θ[T1;T+1]|T)=0.94T=12
  • :θ,P(θ[T1;T+1]|θ)=0.95

बायेसियन कथन अधिक स्वाभाविक है। अक्सर, अक्सर बयान को गलत तरीके से बायसेन स्टेटमेंट (किसी भी सामान्य मानव मस्तिष्क द्वारा, जो वर्षों से आंकड़ों का अभ्यास नहीं किया है) के रूप में गलत तरीके से व्याख्या की जाती है। और ईमानदारी से, कई आंकड़े पुस्तक उस बिंदु को बहुत स्पष्ट नहीं करते हैं।

और व्यावहारिक रूप से?

कई सामान्य स्थितियों में तथ्य यह है कि अक्सरवादी और बायेसियन दृष्टिकोणों द्वारा प्राप्त संभावनाएं बहुत करीब हैं। ताकि बायेसियन के लिए लगातार बयान को भ्रमित करने वाले परिणाम कम हों। लेकिन "दार्शनिक" यह बहुत अलग है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.