95% कॉन्फिडेंस इंटरवल (CI) का अर्थ होने के 95% संभावना क्यों नहीं है?


228

ऐसा लगता है कि विभिन्न संबंधित प्रश्नों के माध्यम से, यहाँ आम सहमति है कि "95%" जिस हिस्से को हम "95% विश्वास अंतराल" कहते हैं, वह इस तथ्य को संदर्भित करता है कि यदि हम कई बार अपनी नमूनाकरण और सीआई-संगणना प्रक्रियाओं को दोहराते थे। , इस तरह से गणना की गई CI की 95% जनसंख्या का मतलब होता है। यह सर्वसम्मति भी लगती है कि यह परिभाषा नहीं हैएक 95% सीआई से निष्कर्ष निकालने की अनुमति दें कि 95% संभावना है कि मीन सीआई के भीतर कहीं गिरता है। हालाँकि, मुझे समझ में नहीं आता है कि पूर्व किस तरह से बाद के इंसोफ़र का मतलब नहीं है, जिसकी कल्पना कई सीआई 95% करते हैं, जिसमें जनसंख्या का मतलब होता है, क्या हमारी अनिश्चितता नहीं होनी चाहिए (इस संबंध में कि क्या वास्तव में हमारे द्वारा गणना की गई जनसंख्या में जनसंख्या शामिल है मतलब या नहीं) हमें कल्पना की गई मामलों की आधार-दर (95%) का उपयोग करने के लिए मजबूर करें क्योंकि हमारे वास्तविक मामले में इस संभावना के अनुमान के रूप में सीआई शामिल हैं?

मैंने देखा है कि पोस्ट "वास्तव में गणना की गई सीआई की आबादी के साथ या तो आबादी का मतलब है या ऐसा नहीं है, की तर्ज पर बहस करते हैं, इसलिए इसकी संभावना या तो 1 या 0 है", लेकिन यह संभावना की एक अजीब परिभाषा को दर्शाता है जो निर्भर है अनजाने राज्यों पर (यानी एक दोस्त निष्पक्ष सिक्का फहराता है, परिणाम छिपाता है, और मुझे यह कहने से मना किया जाता है कि 50% संभावना है कि यह प्रमुख है)।

निश्चित रूप से मैं गलत हूं, लेकिन मैं नहीं देखता कि मेरा तर्क कहां अस्त-व्यस्त हो गया है ...


4
"संयोग" से, क्या आपका तात्पर्य "प्रायिकता" तकनीकी निरंतरता के अर्थों में, या व्यक्तिपरक प्रशंसनीयता के बायेसियन अर्थ में है? लगातार अर्थ में, यादृच्छिक प्रयोगों की केवल घटनाओं की संभावना है। उनके आदेश को निर्धारित करने के लिए दिए गए तीन (निश्चित) संख्याओं (सही अर्थ, गणना किए गए CI सीमा) को देखते हुए (सही अर्थ CI में निहित?) एक यादृच्छिक प्रयोग नहीं है। ऐसा इसलिए भी है क्योंकि "वास्तव में गणना की गई CI की संभावना-आबादी में या तो जनसंख्या का मतलब है या यह नहीं है, इसलिए इसकी संभावना या तो 1 या 0 है" गलत भी है। एक प्रायिकता संभावना मॉडल बस उस मामले में लागू नहीं होता है।
कारकल

11
यह इस बात पर निर्भर करता है कि आप सैद्धांतिक अर्थ के साथ कैसा व्यवहार करते हैं। यदि यह यादृच्छिक चर है, तो आप संभावना के बारे में कह सकते हैं कि यह कुछ अंतराल में आता है। यदि यह स्थिर है, तो आप नहीं कर सकते। यह सबसे सरल स्पष्टीकरण है, जिसने इस मुद्दे को मेरे लिए व्यक्तिगत रूप से बंद कर दिया है।
एमपिकटस

2
संयोग से, मैं इस बात को लेकर आया था, थडियस टार्पी से: सभी मॉडल सही हैं ... सबसे बेकार हैं । उन्होंने इस संभावना के सवाल पर चर्चा की कि 95% विश्वास अंतराल में (पी। 81 एफएफ?) होता है। μ
CHL

3
@ उत्तर: मुझे नहीं लगता है कि इस कथन के साथ (पोस्टीरियर) संभावना है कि एक CI (निश्चित) पैरामीटर के संदर्भ में "यह प्रायिकता शून्य या एक है" कथन के साथ कोई समस्या है। (यह वास्तव में प्रायिकता की किसी भी लगातार व्याख्या पर निर्भर नहीं करता है!)। यह "अज्ञात राज्यों" पर भी निर्भर नहीं करता है। इस तरह का एक बयान उस स्थिति को ठीक से संदर्भित करता है जिसमें किसी विशेष नमूने के आधार पर एक सीआई को सौंप दिया जाता है। यह दिखाने के लिए एक सरल गणितीय अभ्यास है कि ऐसी कोई संभावना तुच्छ है, अर्थात, में मान लेता है । {0,1}
कार्डिनल

3
@MikeLawrence पर तीन साल, क्या आप इस प्रकार 95% विश्वास अंतराल की परिभाषा से खुश हैं: "यदि हम बार-बार जनसंख्या से नमूना लेते हैं और प्रत्येक नमूने के बाद 95% विश्वास अंतराल की गणना करते हैं, तो हमारे आत्मविश्वास अंतराल का 95% मतलब होता है। "। 2012 में आप की तरह, मैं यह देखने के लिए संघर्ष कर रहा हूं कि इसका मतलब यह नहीं है कि 95% विश्वास अंतराल में 95% औसत होने की संभावना है। मुझे यह देखने में दिलचस्पी होगी कि आपके आत्मविश्वास के अंतराल की आपकी समझ कैसे आगे बढ़ी है क्योंकि आपने यह सवाल पूछा है।
लूसियानो

जवाबों:


107

इस मुद्दे का एक हिस्सा यह है कि प्रायिकता की लगातार परिभाषा एक विशिष्ट संभावना को एक विशेष प्रयोग के परिणाम पर लागू करने की अनुमति नहीं देती है, लेकिन केवल कुछ काल्पनिक आबादी के प्रयोगों से जिनमें से इस विशेष प्रयोग को एक नमूना माना जा सकता है। एक CI की परिभाषा भ्रामक है क्योंकि यह हाथ में उदाहरण में एकत्र किए गए विशेष आंकड़ों के बजाय प्रयोगों के इस (आमतौर पर) काल्पनिक आबादी के बारे में एक बयान है। तो इस मुद्दे का एक हिस्सा संभावना की परिभाषा में से एक है: 95% संभावना के साथ एक विशेष अंतराल के भीतर झूठे मूल्य का विचार एक निरंतरवादी ढांचे के साथ असंगत है।

इस मुद्दे का एक अन्य पहलू यह है कि लगातार आत्मविश्वास की गणना विशेष नमूने में निहित जानकारी के सभी का उपयोग नहीं करती है जो सांख्यिकीय के वास्तविक मूल्य को सीमित करने के लिए प्रासंगिक है। मेरा प्रश्न "क्या ऐसे कोई उदाहरण हैं जहां बायेसियन विश्वसनीय अंतराल स्पष्ट रूप से लगातार विश्वास अंतराल से हीन हैं"एडविन जेनेस द्वारा एक पेपर पर चर्चा की गई, जिसमें कुछ बहुत अच्छे उदाहरण हैं जो वास्तव में आत्मविश्वास अंतराल और विश्वसनीय अंतराल के बीच अंतर को उजागर करते हैं। एक जो इस चर्चा के लिए विशेष रूप से प्रासंगिक है, उदाहरण 5 है, जिसमें एक अनुमानित और वितरण अंतराल के पैरामीटर के आकलन के लिए एक विश्वसनीय और विश्वास अंतराल के बीच अंतर पर चर्चा की गई है (औद्योगिक गुणवत्ता नियंत्रण में एक समस्या के लिए)। उदाहरण वह देता है, वहाँ पर्याप्त जानकारी में नमूना हो रहा है निश्चित है कि पैरामीटर के सही मूल्य एक ठीक से निर्माण किया 90% विश्वास अंतराल में कहीं नहीं है!

यह कुछ के लिए चौंकाने वाला लग सकता है, लेकिन इस परिणाम का कारण यह है कि विश्वास अंतराल और विश्वसनीय अंतराल दो अलग-अलग प्रश्नों के उत्तर हैं, संभाव्यता की दो अलग-अलग व्याख्याओं से।

विश्वास अंतराल अनुरोध का उत्तर है: "मुझे एक अंतराल दें जो एक प्रयोग के उदाहरणों के % में पैरामीटर का वास्तविक मूल्य ब्रैकेट करेगा जो कि बड़ी संख्या में दोहराया जाता है।" विश्वसनीय अंतराल अनुरोध का एक उत्तर है: "मुझे एक अंतराल दें जो कि मेरे द्वारा देखे गए विशेष नमूने को दिए गए संभाव्यता साथ वास्तविक मूल्य को ब्रैकेट करता है। " बाद के अनुरोध का उत्तर देने में सक्षम होने के लिए, हमें पहले या तो अपनाना होगा ( ) डेटा जनरेट करने की प्रक्रिया की एक नई अवधारणा या (बी) प्रायिकता की परिभाषा की एक अलग अवधारणा। पी100pp

मुख्य कारण यह है कि किसी विशेष 95% विश्वास अंतराल का मतलब होने का 95% मौका नहीं है क्योंकि विश्वास अंतराल एक अलग प्रश्न का उत्तर है, इसलिए यह केवल सही उत्तर है जब दो प्रश्नों का उत्तर होता है एक ही संख्यात्मक समाधान है।

संक्षेप में, विश्वसनीय और आत्मविश्वास अंतराल अलग-अलग दृष्टिकोणों से अलग-अलग प्रश्नों का उत्तर देते हैं; दोनों उपयोगी हैं, लेकिन आपको उस प्रश्न के लिए सही अंतराल चुनने की ज़रूरत है जो आप वास्तव में पूछना चाहते हैं। यदि आप एक ऐसा अंतराल चाहते हैं जो 95% (पीछे) की व्याख्या को सही मान रखने की संभावना को स्वीकार करता है, तो एक विश्वसनीय अंतराल चुनें (और, इसके साथ, संभाव्यता का परिचर अवधारणा), आत्मविश्वास अंतराल नहीं। आपके द्वारा नहीं की जाने वाली बात विश्लेषण में प्रयुक्त की तुलना में व्याख्या में संभाव्यता की एक अलग परिभाषा को अपनाना है।

@ शोधन के लिए धन्यवाद!

डेविड मैके की उत्कृष्ट पुस्तक "इंफॉर्मेशन थ्योरी, इनविज़न एंड लर्निंग एल्गोरिथम" से एक ठोस उदाहरण यहां दिया गया है (पृष्ठ 1464):

ब्याज की पैरामीटर होने दो और डेटा , अंक की एक जोड़ी और निम्नलिखित वितरण से स्वतंत्र रूप से तैयार की गई:डी एक्स 1 एक्स 2θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

यदि है है, तो हम डेटासेट देखने की अपेक्षा करेंगे , , और सभी को समान संभावना के साथ । विश्वास अंतराल पर विचार करें39 ( 39 , 39 ) ( 39 , 40 ) ( 40 , 39 ) ( 40 , 40 ) 1 / 4θ39(39,39)(39,40)(40,39)(40,40)1/4

[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)]

स्पष्ट रूप से यह एक वैध 75% विश्वास अंतराल है क्योंकि यदि आप डेटा को फिर से नमूना लेते हैं, तो , कई बार तो इस तरह से बनाए गए विश्वास अंतराल में 75% समय का सही मूल्य होगा।D=(x1,x2)

अब डेटा पर विचार करें । इस मामले में लगातार 75% विश्वास अंतराल । हालाँकि, जनरेटिंग प्रक्रिया के मॉडल को सही मानते हुए, इस मामले में 28 या 29 हो सकता है, और हमारे पास यह मानने का कोई कारण नहीं है कि 29 28 से अधिक होने की संभावना है, इसलिए पीछे की संभावना । तो इस मामले में लगातार विश्वास अंतराल स्पष्ट रूप से एक 75% विश्वसनीय अंतराल नहीं है क्योंकि केवल 50% संभावना है कि इसमें का सही मूल्य है , जिसे हम इस विशेष नमूने से बारे में अनुमान लगा सकते हैं[ 29 , 29 ] θ पी ( θ = 28 | डी ) = पी ( θ = 29 | डी ) = 1 / 2 θ θD=(29,29)[29,29]θp(θ=28|D)=p(θ=29|D)=1/2θθ

हां, यह एक विरोधाभासी उदाहरण है, लेकिन अगर विश्वास अंतराल और विश्वसनीय अंतराल अलग-अलग नहीं थे, तो वे अभी भी आकस्मिक उदाहरणों में समान होंगे।

मुख्य अंतर यह है कि आत्मविश्वास अंतराल एक बयान है कि क्या होगा यदि आप कई बार प्रयोग दोहराते हैं, तो विश्वसनीय अंतराल इस बारे में एक बयान है कि इस विशेष नमूने से क्या अनुमान लगाया जा सकता है।


8
आत्मविश्वास अंतराल प्रश्न का उत्तर है "मुझे एक अंतराल दें जो कि संभाव्यता पी के साथ सांख्यिकीय के वास्तविक मूल्य को ब्रैकेट करेगा यदि प्रयोग बड़ी संख्या में दोहराया जाता है"। विश्वसनीय अंतराल प्रश्न का उत्तर है "मुझे एक अंतराल दें जो कि संभाव्यता p के साथ सही मान कोष्ठक करता है"। सबसे पहले, प्रायिकता की एक निरंतर व्याख्या के बारे में कथन वांछित होने के लिए कुछ छोड़ देता है। शायद, समस्या उस वाक्य में संभाव्यता शब्द के उपयोग में निहित है । दूसरा, मुझे लगता है कि विश्वसनीय अंतराल "परिभाषा" थोड़ा बहुत सरल है ...
कार्डिनल

7
... और आप सीआई को जो लक्षण वर्णन देते हैं, उसे देखते हुए थोड़ा भ्रामक। एक संबंधित नस में, समापन वाक्य में एक ही मुद्दा है: यदि आप एक अंतराल चाहते हैं जिसमें सही मूल्य 95% है, तो एक विश्वसनीय अंतराल चुनें, न कि एक आत्मविश्वास अंतराल। "बोलचाल के सही मूल्य में 95% समय का उपयोग होता है" थोड़ा अशुद्ध है और गलत प्रभाव छोड़ता है। वास्तव में, मैं एक ठोस तर्क दे सकता हूं (मेरा मानना ​​है) कि इस तरह के शब्द एक सीआई की परिभाषा होने के बहुत करीब हैं।
कार्डिनल

11
निवेदन : इस उत्तरदाता के लिए टिप्पणी में अपनी राय / कारण व्यक्त करने के लिए यह उपयोगी होगा। हालांकि यह सवाल विस्तारित चर्चा का नेतृत्व करने के लिए सबसे अधिक संभावना है, उत्तरदाताओं के लिए रचनात्मक प्रतिक्रिया प्रदान करना अभी भी उपयोगी है; साइट की समग्र सामग्री को बेहतर बनाने में मदद करने के सबसे आसान तरीकों में से एक है। चीयर्स।
कार्डिनल

9
डिक्रान, हां, मैं सहमत हूं। यह वह था जो मैं संपादन में थोड़ा और अधिक करने की कोशिश कर रहा था। एक कट्टरपंथी व्यक्तिवादी (जो कि मैं निश्चित रूप से नहीं हूं ) इसे उकसाने वाला बता सकता है: "A CI रूढ़िवादी है कि मैं अंतराल को पहले से ही डिजाइन करता हूं जैसे कि कोई विशेष डेटा जो मैं निरीक्षण करने के लिए होता है, पैरामीटर को 95% अंतराल में कैप्चर किया जाएगा। समय का। एक विश्वसनीय अंतराल 'ऊप्स' कहने से उत्पन्न होता है, किसी ने मेरी गोद में कुछ डेटा फेंक दिया है। उस डेटा से मेरे द्वारा निर्मित अंतराल की संभावना क्या है जिसमें सही पैरामीटर है? '' '' यह बाद के मामले में थोड़ा अनुचित है ..? ।
कार्डिनल

2
डिक्रान, हम सभी विभिन्न पृष्ठभूमि से आते हैं और यह हमारी समझ को समृद्ध करने में मदद करता है। जैसा कि संभाव्यता और संबंधित अवधारणाओं के संबंध में, शायद सबसे शानदार विचारक मेरे साथ बातचीत करने की खुशी थी, जिसमें औपचारिक आंकड़े या (गणितीय) संभावना पृष्ठभूमि नहीं थी; वह एक इंजीनियर था।
कार्डिनल

28

लगातार आंकड़ों में संभावनाएं लंबे समय में घटनाओं के बारे में होती हैं। ऐसा होने के बाद वे केवल एक ही घटना पर लागू नहीं होते हैं। और सीआई के एक प्रयोग और गणना का चलना केवल एक ऐसी घटना है।

आप इसे एक छिपे हुए सिक्के के प्रमुख होने की संभावना से तुलना करना चाहते थे लेकिन आप नहीं कर सकते। आप इसे कुछ बहुत करीब से संबंधित कर सकते हैं। यदि आपके खेल में एक नियम था जहां आपको फ्लिप "हेड्स" के बाद राज्य करना होगा, तो लंबे समय में आपके द्वारा सही होने की संभावना 50% है और यह अनुरूप है।

जब आप अपना प्रयोग चलाते हैं और अपना डेटा एकत्र करते हैं तो आपको सिक्के के वास्तविक फ्लिप के समान कुछ मिलता है। प्रयोग की प्रक्रिया सिक्के के फड़फड़ाने की प्रक्रिया की तरह है कि यह उत्पन्न करता हैμμया यह ठीक नहीं है कि सिक्का सिर है या यह नहीं है। एक बार जब आप सिक्का फ्लिप करते हैं, तो आप इसे देखते हैं या नहीं, इस बात की कोई संभावना नहीं है कि यह सिर है, यह या तो सिर है या यह नहीं है। अब मान लीजिए कि आप हेड कहते हैं। यही सीआई की गणना है। क्योंकि आप कभी भी सिक्का प्रकट नहीं कर सकते हैं (एक प्रयोग के लिए आपका सादृश्य गायब हो जाएगा)। या तो आप सही हैं या आप गलत हैं, बस। क्या यह वर्तमान स्थिति है कि इसका अगले फ्लिप पर सिर आने की संभावना से कोई संबंध है, या कि मैं भविष्यवाणी कर सकता हूं कि यह क्या है? नहीं, जिस प्रक्रिया से सिर का उत्पादन किया जाता है, उनके निर्माण की 0.5 संभावना होती है, लेकिन इसका मतलब यह नहीं है कि पहले से मौजूद सिर में 0.5 होने की संभावना है। एक बार जब आप अपने सीआई की गणना करते हैं तो इस बात की कोई संभावना नहीं है कि यह कैप्चर करता हैμ, यह या तो करता है या यह नहीं है - आप पहले से ही सिक्का फ़्लिप कर चुके हैं।

ठीक है, मुझे लगता है कि मैंने काफी यातना दी है। महत्वपूर्ण बिंदु यह है कि आपका सादृश्य गुमराह है। आप सिक्के को कभी प्रकट नहीं कर सकते; आप केवल सिक्कों (प्रयोगों) के बारे में मान्यताओं के आधार पर सिर या पूंछ कह सकते हैं। आप बाद में अपने सिर या पूंछ के सही होने की शर्त लगाना चाहते हैं, लेकिन आप कभी भी उस पर इकट्ठा नहीं हो सकते। इसके अलावा, यह CI प्रक्रिया का एक महत्वपूर्ण घटक है जिसे आप आयात का मान बता रहे हैं जो अंतराल में है। यदि आप नहीं करते हैं, तो आपके पास CI नहीं है (या कम से कम बताए गए% पर एक नहीं है)।

संभवतः सीआई को भ्रमित करने वाली बात यह नाम है। यह उन मानों की एक सीमा है जो या तो नहीं करते हैं । हमें लगता है कि उनमें लेकिन इसकी संभावना उस प्रक्रिया के समान नहीं है जो इसे विकसित करने में गई थी। 95% CI नाम का 95% हिस्सा प्रक्रिया के बारे में है। आप एक सीमा की गणना कर सकते हैं जो आपको लगता है कि बाद में कुछ संभाव्यता स्तर पर शामिल है, लेकिन यह एक अलग गणना है और सीआई नहीं है।μ μμμμ

95% CI के नाम के बारे में सोचने से बेहतर है कि आप एक मान के एक प्रकार के माप का एक पदनाम करें, जो आपको लगता है कि संभवत: और 95% को उस पठनीयता से अलग करते हैं। हम इसे जेनिफर सीआई कह सकते हैं जबकि 99% सीआई वेंडी सीआई हैं। यह वास्तव में बेहतर हो सकता है। फिर, बाद में हम यह कह सकते हैं कि हम मानते हैं कि मानों की सीमा में होने की संभावना है और कोई यह कहते हुए अटक नहीं जाएगा कि वेन्डी संभावना है कि हमने कब्जा कर लिया है । यदि आप एक अलग पदनाम चाहते हैं तो मुझे लगता है कि आपको शायद सीआई के "विश्वास" भाग से छुटकारा पाने के लिए स्वतंत्र महसूस करना चाहिए (लेकिन यह एक अंतराल है)।μ μμμμ


काफी हद तक यह उत्तर ठीक लगता है, लेकिन मुझे इसका औपचारिक (गणितीय) विवरण देखना अच्छा लगेगा। औपचारिक के साथ, मेरा मतलब है कि इसे घटनाओं में परिवर्तित करना। मैं अपनी बात समझाता हूँ: मुझे याद है शुरू में मानों में बहुत उलझन थी। कहीं मैंने पढ़ा है कि "जो मान वास्तव में गणना करते हैं, वे दिए गए डेटा की संभावना है कि अशक्त परिकल्पना, , सत्य है"। जब मैंने इसे बायस प्रमेय से संबंधित किया, तो सभी ने इतना समझ लिया कि अब मैं इसे हर किसी को समझा सकता हूं (यानी एक गणना )। हालाँकि, मैं (विडंबना) यह विश्वास नहीं है ...p H 0 p ( D | H 0 )ppH0p(D|H0)
Néstor

... (जारी) विश्वास अंतराल के साथ: क्या ज्ञान के संदर्भ में आपने जो कहा है उसे व्यक्त करने का एक तरीका है? फ्रीक में। आँकड़े। एक आमतौर पर एक बिंदु अनुमान की गणना करता है , कुछ विधि (जैसे, MLE) के साथ । क्या लिखने का एक तरीका है (उदाहरण के लिए एक बायेसियन केंद्रीय पीछे के अंतराल के साथ, "वास्तविक अर्थ" के साथ) एक फंक्शन के रूप में (अर्थात वास्तव में आत्मविश्वास का % क्या है), जब आप को व्यक्त कर सकते हैं। का एक कार्य ? सहज रूप से मैंने हमेशा सोचा है कि यह किया जा सकता है, लेकिन कभी नहीं किया। पी(एल1( μ )<μ<एल2( ^ m यू )|डी)μपी(एल ' 1 < ˉ एक्स -μ<एल ' 2 )=अल्फाअल्फापी(एच0|डी)पी(D|H0)μ^P(L1(μ^)<μ<L2(mu^)|D)μP(L1<X¯μ<L2)=ααp(H0|D)p(D|H0)
नेस्टर

कभी-कभी टिप्पणियों को हटाने में सक्षम होने के कारण इसकी कमियां हैं। मैं इस बदलाव में तेजी से बदलाव के साथ नहीं रख सका!
कार्डिनल

1
" यदि आप अपने विश्वास अंतराल की गणना नहीं करते हैं तो आपको छिपे हुए सिक्के के समान कुछ मिला है और इसमें 95% म्यू होने की संभावना है, जैसे सिक्के के सिर होने की 50% संभावना है। " - मुझे लगता है कि आपको मिल गया है। यहाँ सादृश्य गलत है। "सीआई की गणना" सिक्के को प्रकट करने के अनुरूप नहीं है, यह "हेड्स" या "टेल्स" को कॉल करने से मेल खाती है, जिस बिंदु पर आपके पास अभी भी सही होने का 50-50 मौका है। सिक्का खुलासा करने के लिए * की आबादी मूल्य देखकर मेल खाती है , इसके बाद से आप चाहे वह "कहा जाता है" अंतराल में है इस सवाल का जवाब कर सकते हैं। ओपी की पहेली बनी हुई है। μ
Glen_b

1
@vonjd, मैं नहीं देखता कि इसके बारे में क्या मतलब नहीं है। यह काफी स्पष्ट रूप से मामला है कि आपके प्रतिद्वंद्वी के पास एक फ्लश है या नहीं। यदि पूर्व, प्रायिकता (तुच्छ रूप से) 1 है, और यदि बाद वाला है। नतीजतन, आप समझदारी से यह नहीं कह सकते हैं कि संभावना 19 है। यह सही समझ में आता है। हाथ से निपटने से पहले , फ्लश से निपटने की संभावना के बारे में बात करना उचित है। इसी तरह, एक कार्ड खींचने से पहले, आपके द्वारा आवश्यक सूट प्राप्त करने की संभावना के बारे में बात करना उचित है। आपके पास कार्ड होने के बाद , यह बस जो भी सूट है।
गंग

22

पश्चिमी परंपरा के भीतर अरस्तू के साथ तर्क, तर्क और तर्क के बारे में स्पष्ट विचार उत्पन्न हुए। अरस्तू ने कई अलग-अलग कार्यों में इन विषयों के बारे में लिखा था (एक विषय; ;-)) सहित । हालांकि, सबसे बुनियादी एकल सिद्धांत गैर-विरोधाभास का कानून है , जो विभिन्न स्थानों में पाया जा सकता है, जिसमें मेटाफिजिक्स भी शामिल है।पुस्तक IV, अध्याय 3 और 4. एक विशिष्ट सूत्रीकरण है: "... यह किसी भी चीज के लिए एक ही समय में [समान अर्थ में] होना और न होना असंभव है" (1006 a 1)। इसका महत्व थोड़ा पहले बताया गया है, "... यह स्वाभाविक रूप से अन्य सभी स्वयंसिद्धों के लिए भी प्रारंभिक बिंदु है" (1005 बी 30)। दार्शनिक वैक्सिंग के लिए मुझे क्षमा करें, लेकिन इसकी प्रकृति के इस प्रश्न में दार्शनिक सामग्री है जिसे केवल सुविधा के लिए अलग नहीं किया जा सकता है।

इस विचार-प्रयोग पर विचार करें: एलेक्स एक सिक्का फ़्लिप करता है, उसे पकड़ता है और अपने अग्र भाग को अपने हाथ से ऊपर की ओर रखते हुए ऊपर की ओर ढकता है। बॉब सही स्थिति में खड़ा था; उन्होंने संक्षेप में एलेक्स के हाथ में सिक्का देखा, और इस प्रकार यह निकाल सकते हैं कि अब किस तरफ का सामना करना पड़ रहा है। हालांकि, कार्लोस ने सिक्का नहीं देखा - वह सही स्थान पर नहीं था। इस बिंदु पर, एलेक्स उनसे पूछता है कि क्या संभावना है कि सिक्का सिर दिखाता है। कार्लोस का सुझाव है कि संभावना 5 है, क्योंकि यह लंबे समय तक चलने वाली आवृत्ति है। बॉब असहमत हैं, उन्होंने विश्वास दिलाया कि संभावना कुछ और नहीं बल्कि ठीक 0 है

अब, कौन सही है? यह संभव है, कि बॉब गलत देखा और गलत है (हमें लगता है कि वह गलत नहीं देखा था)। फिर भी, आप यह नहीं पकड़ सकते कि दोनों सही हैं और गैर-विरोधाभास के कानून पर पकड़ रखते हैं। (मुझे लगता है कि यदि आप गैर-विरोधाभास के कानून में विश्वास नहीं करते हैं, तो आप सोच सकते हैं कि वे दोनों सही हैं, या इस तरह के कुछ सूत्रीकरण।) अब एक समान मामले की कल्पना करें, लेकिन बॉब के बिना, कार्लोस का सुझाव हो सकता है। अधिक सही (एह) बॉब के बिना चारों ओर, क्योंकि किसी ने सिक्का नहीं देखा? गैर-विरोधाभास के कानून का आवेदन इस मामले में बिल्कुल स्पष्ट नहीं है, लेकिन मुझे लगता है कि यह स्पष्ट है कि स्थिति के कुछ हिस्सों को महत्वपूर्ण लगता है जो पूर्व से उत्तरार्द्ध तक स्थिर हैं। प्रायिकता को परिभाषित करने के लिए कई प्रयास किए गए हैं, और भविष्य में अभी और भी बहुत कुछ हो सकता है, लेकिन जो वहाँ होता है और जहाँ वे तैनात होते हैं, वहाँ बहुत कम अपील होती है। किसी भी दर पर (वाक्यांश के आपके उपयोग द्वारा अनुमान लगाना)विश्वास अंतराल "), हम फ़्रीक्वेंटिस्ट दृष्टिकोण के भीतर काम कर रहे हैं, और इसमें कि क्या किसी को पता है कि सिक्के की वास्तविक स्थिति अप्रासंगिक है। यह एक यादृच्छिक चर नहीं है - यह एक वास्तविक मूल्य है और या तो यह सिर दिखाता है, या यह पूंछ दिखाता है ।

@ जॉन नोटों के रूप में, एक सिक्के की स्थिति पहली बार में इस सवाल के समान नहीं हो सकती है कि क्या आत्मविश्वास अंतराल सही अर्थ को कवर करता है। हालांकि, एक सिक्के के बजाय, हम इस सार को पैरामीटर साथ बर्नौली वितरण से प्राप्त एक वास्तविक मूल्य के रूप में समझ सकते हैं । सिक्के की स्थिति में, , जबकि 95% सीआई के लिए, । क्या कनेक्शन बनाने में महसूस करने के लिए महत्वपूर्ण है कि रूपक का महत्वपूर्ण हिस्सा नहीं है उस स्थिति को नियंत्रित करता है, बल्कि यह है कि रूप से फ़्लिप सिक्का या गणना की सीआई एक है प्राप्त महत्व को , न कि एक यादृच्छिक चर। p = .5 p = .95 पीpp=.5p=.95p

मेरे लिए इस बिंदु पर ध्यान देना महत्वपूर्ण है कि यह सब प्रायिकता के एक आवृत्तिवादी गर्भाधान के मामले में है। बायेसियन परिप्रेक्ष्य गैर-विरोधाभास के कानून का उल्लंघन नहीं करता है, यह बस वास्तविकता की प्रकृति के बारे में अलग-अलग रूपक मान्यताओं से शुरू होता है (विशेष रूप से संभावना के बारे में)। सीवी पर अन्य लोग मैं की तुलना में बायेसियन परिप्रेक्ष्य में बहुत बेहतर हैं, और शायद वे यह समझा सकते हैं कि आपके प्रश्न के पीछे की धारणाएं बायेसियन दृष्टिकोण के भीतर क्यों नहीं लागू होती हैं, और वास्तव में, मतलब की 95% संभावना हो सकती है। एक 95% विश्वसनीय के भीतर झूठ बोल रही हैअंतराल, कुछ शर्तों के तहत (दूसरों के बीच) जिसमें पहले इस्तेमाल किया गया था, सटीक था (नीचे @DikranMarsupial द्वारा टिप्पणी देखें)। हालाँकि, मुझे लगता है कि सभी सहमत होंगे, कि एक बार जब आप राज्य आप आवृत्तिवादी दृष्टिकोण के भीतर काम कर रहे हैं, तो यह मामला नहीं हो सकता है कि किसी विशेष 95% सीआई के भीतर झूठ बोलने वाले सही अर्थ की संभावना है ।95।


5
बायेसियन दृष्टिकोण के तहत यह सच नहीं है कि वास्तव में 95% संभावना है कि सच्चा मूल्य 95% विश्वसनीय अंतराल में निहित है। यह कहना अधिक सही होगा कि आँकड़ों के मूल्य के लिए एक विशेष पूर्व वितरण दिया गया है (हमारे ज्ञान की प्रारंभिक अवस्था का प्रतिनिधित्व करते हुए) फिर हमने देखा कि हमारे पास एक सुव्यवस्थित वितरण है जो ज्ञान की अद्यतन स्थिति का प्रतिनिधित्व करता है, जो हमें एक अंतराल देता है जहां हम 95% सुनिश्चित हैं कि सही मूल्य निहित है। यह तभी सही होगा जब हमारी पूर्व की स्थिति सही हो (और अन्य मान्यताओं जैसे कि संभावना का रूप)।
डिक्रान मार्सुपियल

@DikranMarsupial, नोट के लिए धन्यवाद। वह थोड़ा मुंहफट है। मैंने इसे आपके सुझाव के अनुरूप बनाने के लिए अपना उत्तर संपादित किया, लेकिन इसे टोटो में कॉपी नहीं किया । मुझे पता है अगर आगे संपादन उपयुक्त हैं।
गंग

मूल रूप से बायेसियन दृष्टिकोण को ब्याज के पैरामीटर के बारे में आपके ज्ञान के राज्य के एक बयान के रूप में सबसे अच्छा समझा जाता है (देखें कार्डिनल, मैं सीख रहा हूं; ओ), लेकिन यह गारंटी नहीं देता कि ज्ञान की स्थिति सही है जब तक कि सभी धारणाएं सही न हों। । मैंने दार्शनिक चर्चा का आनंद लिया, मुझे अगली बार के लिए गैर-विरोधाभास के कानून को याद रखना होगा, चर्चा की गई है; ओ)
डिक्रान मार्सुपियल

12

एक 95% सीआई मतलब रखने के 95% संभावना क्यों नहीं करता है?

इस प्रश्न में और दिए गए प्रतिक्रियाओं के बहुमत में कई मुद्दों को स्पष्ट किया जाना है। मैं खुद को उनमें से केवल दो तक ही सीमित रखूंगा।

ए। जनसंख्या का क्या मतलब है? क्या एक सही आबादी मौजूद है?

जनसंख्या की अवधारणा का अर्थ मॉडल-निर्भर है। जैसा कि सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं, इस जनसंख्या का मतलब एक कल्पना है जिसे केवल उपयोगी व्याख्याएं प्रदान करने के लिए परिभाषित किया गया है। कल्पना एक संभावना मॉडल के साथ शुरू होती है।

संभावना मॉडल को ट्रिपलेट द्वारा परिभाषित किया गया है जहां नमूना स्थान (एक गैर-खाली सेट) है, एक परिवार है और के सबसेट, एक अच्छी तरह से परिभाषित प्रायिकता उपाय है, जिसे पर परिभाषित किया जाता है (यह डेटा व्यवहार को नियंत्रित करता है)। व्यापकता के नुकसान के बिना, केवल असतत मामले पर विचार करें। जनसंख्या का मतलब परिभाषित किया गया है अर्थात यह अंतर्गत केंद्रीय प्रवृत्ति का प्रतिनिधित्व करता है और इसे व्याख्या के द्रव्यमान के केंद्र के रूप में भी समझा जा सकता है सभी अंक , जहां प्रत्येक का वजन एक्स एफ एक्स पी एफ μ = Σ एक्स एक्स एक्स पी ( एक्स = एक्स ) , पी एक्स एक्स एक्स पी ( एक्स = एक्स )

(X,F,P),
XFXPF
μ=xXxP(X=x),
PXxX द्वारा दिया जाता है ।P(X=x)

संभाव्यता सिद्धांत में, माप को माना जाता है, इसलिए जनसंख्या का मतलब उपरोक्त सरल ऑपरेशन के माध्यम से सुलभ है। हालांकि, व्यवहार में, संभावना शायद ही जाना जाता है। संभाव्यता बिना , कोई डेटा के संभाव्य व्यवहार का वर्णन नहीं कर सकता है। जैसा कि हम डेटा व्यवहार की व्याख्या करने के लिए एक सटीक संभावना सेट नहीं कर सकते हैं, हम डेटा व्यवहार को नियंत्रित (या व्याख्या) करने वाले प्रायिकता उपायों से युक्त एक पारिवारिक सेट करते हैं। फिर, शास्त्रीय सांख्यिकीय मॉडल उभरता है उपर्युक्त मॉडल को पैरामीट्रिक मॉडल कहा जाता है यदि साथ मौजूद हैP P P M ( X , F , M ) Θ आर पी पी < एम{ पी θ : θ Θ }PPPPM

(X,F,M).
ΘRpp< जैसे कि । आइए इस पोस्ट में सिर्फ पैरामीट्रिक मॉडल पर विचार करें।M{Pθ: θΘ}

ध्यान दें कि, प्रत्येक संभाव्यता के लिए , एक संबंधित औसत परिभाषा है अर्थात्, जनसंख्या का एक परिवार है जिसका अर्थ है जो कसकर की परिभाषा पर निर्भर करता है । परिवार को सीमित मनुष्यों द्वारा परिभाषित किया गया है और इसलिए इसमें डेटा व्यवहार को नियंत्रित करने वाली सही संभावना माप नहीं हो सकती है। वास्तव में, चुने हुए परिवार में शायद ही सही माप होगा, इसके अलावा इस सच्चे उपाय का अस्तित्व भी नहीं हो सकता है। जैसा कि जनसंख्या माध्य की अवधारणा में संभाव्यता उपायों पर निर्भर करती है , जनसंख्या का मतलब मॉडल-निर्भर है।μ θ = Σ एक्स एक्स एक्स पी θ ( एक्स = एक्स ) { Μ θ : θ Θ } एम एम एमPθM

μθ=xXxPθ(X=x).
{μθ: θΘ}MMM

बायेसियन दृष्टिकोण (या, समतुल्य, ) के सबसेट पर एक पूर्व संभाव्यता पर विचार करता है , लेकिन इस पोस्ट में मैं केवल शास्त्रीय संस्करण पर ध्यान केंद्रित करूंगा। ΘMΘ

ख। आत्मविश्वास अंतराल की परिभाषा और उद्देश्य क्या है?

उपर्युक्त के रूप में, जनसंख्या का मतलब मॉडल-निर्भर है और उपयोगी व्याख्याएं प्रदान करता है। हालाँकि, हमारे पास जनसंख्या का एक परिवार का मतलब है, क्योंकि सांख्यिकीय मॉडल को संभाव्यता उपायों के परिवार द्वारा परिभाषित किया गया है (प्रत्येक प्रायिकता उपाय जनसंख्या का मतलब उत्पन्न करता है)। इसलिए, एक प्रयोग के आधार पर, एक छोटे से सेट (अंतराल) का अनुमान लगाने के लिए हीनतापूर्ण प्रक्रियाओं को नियोजित किया जाना चाहिए, जिसमें जनसंख्या के अच्छे उम्मीदवार शामिल हैं। एक अच्छी तरह से ज्ञात प्रक्रिया है ( ) विश्वास क्षेत्र, जिसे एक सेट द्वारा परिभाषित किया जाता है, जैसे कि, सभी , जहांसी अल्फा θ Θ पी θ ( सी अल्फा ( एक्स ) μ θ ) 1 - अल्फा और inf θ Θ पी θ ( सी अल्फा ( एक्स ) μ θ ) = 1 - अल्फा , पी θ ( सी α ( एक्स ) = ) = 0 पी θ1αCαθΘ

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
Pθ(Cα(X)=)=0 varn सुखदायक (Schervish, 1995 देखें)। यह एक बहुत ही सामान्य परिभाषा है और इसमें लगभग किसी भी प्रकार के आत्मविश्वास अंतराल शामिल हैं। यहाँ, की संभावना है कि में को मापने के तहत । यह प्रायिकता हमेशा की तुलना में (या बराबर) से अधिक होनी चाहिए , समानता सबसे खराब स्थिति में होती है।Pθ(Cα(X)μθ)Cα(X)μθPθ1α

टिप्पणी: पाठकों को ध्यान देना चाहिए कि वास्तविकता की स्थिति पर धारणा बनाने के लिए आवश्यक नहीं है, आत्मविश्वास क्षेत्र को किसी भी "सही" अर्थ के संदर्भ के बिना एक अच्छी तरह से परिभाषित सांख्यिकीय मॉडल के लिए परिभाषित किया गया है। यहां तक ​​कि अगर "सही" संभावना माप मौजूद नहीं है या यह , तो विश्वास क्षेत्र की परिभाषा काम करेगी, क्योंकि धारणाएं वास्तविकता के राज्यों के बजाय सांख्यिकीय मॉडलिंग के बारे में हैं।M

एक ओर, पहले डेटा को देख, एक यादृच्छिक सेट (या यादृच्छिक अंतराल) और संभावना है कि "है मतलब होता है है, कम से कम," सभी के लिए । यह लगातार प्रतिमान के लिए एक बहुत ही वांछनीय विशेषता है।Cα(X)Cα(X)μθ(1α)θΘ

दूसरी ओर, डेटा अवलोकन करने के बाद , केवल एक निश्चित सेट है और संभावना है कि " में माध्य " {0,1} के लिए होना चाहिए ऑल ।xCα(x)Cα(x)μθθΘ

अर्थात्, डेटा अवलोकन करने के बाद , हम अब संभाव्य तर्क को नियोजित नहीं कर सकते हैं। जहां तक ​​मुझे पता है, एक मनाया नमूना के लिए विश्वास सेट का इलाज करने के लिए कोई सिद्धांत नहीं है (मैं इस पर काम कर रहा हूं और मुझे कुछ अच्छे परिणाम मिल रहे हैं)। थोड़ी देर के लिए, frequentist विश्वास होना चाहिए कि मनाया सेट (या अंतराल) में से एक है सेट स्थापित करता है, सभी के लिए ।सी α ( एक्स ) ( 1 - α ) 100 % μ θ θ ΘxCα(x)(1α)100%μθθΘ

पुनश्च: मैं अपनी पोस्ट पर किसी भी टिप्पणी, समीक्षा, आलोचना, या यहां तक ​​कि आपत्तियां आमंत्रित करता हूं। आइए इसकी गहराई से चर्चा करें। जैसा कि मैं एक देशी अंग्रेजी वक्ता नहीं हूं, मेरी पोस्ट में निश्चित रूप से टाइपो और व्याकरण की गलतियाँ हैं।

संदर्भ:

शर्विश, एम। (1995), थ्योरी ऑफ़ स्टेटिस्टिक्स, सेकंड एड, स्प्रिंगर।


क्या कोई इस पर चर्चा करना चाहता है?
अलेक्जेंड्रे पैट्रियोटा

4
चर्चाएँ चैट में हो सकती हैं, लेकिन हमारी मुख्य साइट पर अनुपयुक्त हैं। यह कैसे काम करता है, इसके बारे में अधिक जानकारी के लिए कृपया हमारा सहायता केंद्र देखें । इस बीच, मैं आपकी पोस्ट के प्रारूपण से हैरान हूं: लगभग सभी इसे एक उद्धरण के रूप में स्वरूपित करते हैं। क्या आपने इस सामग्री को किसी प्रकाशित स्रोत से निकाला है या यह आपका अपना है, इस उत्तर के लिए नया लिखा गया है? यदि यह बाद की बात है, तो कृपया उद्धरण हटा दें!
whuber

2
(+1)। एक प्रभावशाली स्पष्ट सारांश के लिए धन्यवाद। हमारी साइट पर आपका स्वागत है!
whuber

11

मुझे आश्चर्य है कि किसी ने भी बर्जर के उदाहरण को "द लाइकेलीहुड प्रिंसिपल" के दूसरे अध्याय में वर्णित एक अनिवार्य रूप से बेकार 75% विश्वास अंतराल को नहीं लाया है। विवरण मूल पाठ में पाया जा सकता है (जो कि प्रोजेक्ट यूक्लिड पर मुफ्त में उपलब्ध है ): उदाहरण के बारे में जो आवश्यक है वह यह है कि यह स्पष्ट रूप से वर्णन करता है, एक ऐसी स्थिति जिसमें आप पूरी तरह से निश्चित रूप से एक सामान्य पैरामीटर के मान के बाद जानते हैं डेटा का अवलोकन करना, लेकिन आप यह दावा करेंगे कि आपके पास केवल 75% विश्वास है कि आपके अंतराल में सही मूल्य है। उस उदाहरण के विवरणों के माध्यम से काम करना, जिसने मुझे आत्मविश्वास के अंतराल के निर्माण के पूरे तर्क को समझने में सक्षम बनाया।


8
एक निरंतर सेटिंग में, कोई "जोर देकर नहीं कहता है कि आपके पास केवल 75% विश्वास है कि आपके अंतराल में सही मूल्य है", सीआई के संदर्भ में, पहले स्थान पर। यहाँ, इस मुद्दे की क्रूरता निहित है। :)
कार्डिनल

1
क्या आप उस उदाहरण के लिए एक सीधा लिंक / पृष्ठ संदर्भ प्रदान कर सकते हैं? मैंने अध्याय खोजा लेकिन मैं सही उदाहरण की पहचान नहीं कर पाया।
रोनाल्ड

@ रोनाल्ड: यह अध्याय 2 के पहले पृष्ठ पर पहला है। एक सीधा लिंक एक स्वागत योग्य अतिरिक्त होगा।
कार्डिनल

1
अनुरोध के अनुसार लिंक करें। आह येस। इस उदाहरण में, यह स्पष्ट लगता है: यदि हम एक प्रयोग करते हैं, वहाँ एक 75% संभावना है कि जिसके परिणामस्वरूप विश्वास अंतराल है जाएगा मतलब होते हैं। एक बार जब हम प्रयोग कर चुके होते हैं और हम जानते हैं कि यह कैसे खेला जाता है, तो संभावना अलग हो सकती है, जिसके परिणामस्वरूप नमूने के वितरण पर निर्भर करता है।
रोनाल्ड

7

मैं नहीं जानता कि क्या इसे एक नए प्रश्न के रूप में पूछा जाना चाहिए, लेकिन यह एक ही प्रयोग को प्रस्तावित करके ऊपर पूछे गए उसी प्रश्न को संबोधित कर रहा है।

सबसे पहले, मैं यह मानने जा रहा हूं कि अगर मैं एक मानक डेक से यादृच्छिक पर एक प्लेइंग कार्ड का चयन करता हूं, तो मैंने जिस क्लब (इसे देखे बिना) का चयन किया है, उसकी संभावना १३ / ५२ = २५% है।

और दूसरी बात, यह कई बार कहा गया है कि एक प्रयोग को कई बार दोहराने के संदर्भ में ९ ५% आत्मविश्वास अंतराल की व्याख्या की जानी चाहिए और परिकलित अंतराल में सही मायने में ९ ५% समय होगा - मुझे लगता है कि यह जेम्स वाटर्स द्वारा उचित रूप से आश्वस्त किया गया था सिमुलेशन। ज्यादातर लोग 95% सीआई की इस व्याख्या को स्वीकार करते हैं।

अब, सोचा प्रयोग के लिए। मान लेते हैं कि हमारे पास एक बड़ी आबादी में सामान्य रूप से वितरित चर है - शायद वयस्क पुरुषों या महिलाओं की ऊंचाई। मेरे पास एक इच्छुक और अथक सहायक है, जिसे मैं आबादी से दिए गए नमूने के आकार के कई नमूने लेने की प्रक्रिया के साथ काम करता हूं और नमूना का मतलब और प्रत्येक नमूने के लिए 95% विश्वास अंतराल की गणना करता हूं। मेरा सहायक बहुत उत्सुक है और आबादी से सभी संभव नमूनों को मापने का प्रबंधन करता है। फिर, प्रत्येक नमूने के लिए, मेरा सहायक या तो परिणामी आत्मविश्वास अंतराल को हरा के रूप में दर्ज करता है (यदि CI में सही अर्थ है) या लाल (यदि CI में सही अर्थ नहीं है)। दुर्भाग्य से, मेरे सहायक मुझे उनके प्रयोगों के परिणाम नहीं दिखाएंगे। मुझे आबादी में वयस्कों की ऊंचाई के बारे में कुछ जानकारी प्राप्त करने की आवश्यकता है, लेकिन मेरे पास केवल समय है, एक बार प्रयोग करने के लिए संसाधन और धैर्य। मैं एक एकल यादृच्छिक नमूना बनाता हूं (मेरे सहायक द्वारा उपयोग किए गए समान नमूने का आकार) और आत्मविश्वास अंतराल (समान समीकरण का उपयोग करके) की गणना करता हूं।

मेरे पास अपने सहायक के परिणाम देखने का कोई तरीका नहीं है। तो, क्या संभावना है कि मैंने जो यादृच्छिक नमूना चुना है वह एक हरे रंग की सीआई (यानी अंतराल में सही अर्थ होता है) का उत्पादन करेगा?

मेरे मन में, यह वही है जो कार्ड की स्थिति के डेक पहले उल्लिखित है और यह व्याख्या की जा सकती है कि 95% संभावना है कि गणना किए गए अंतराल में सही मतलब होता है (यानी हरा है)। और फिर भी, यह निष्कर्ष प्रतीत होता है कि 95% विश्वास अंतराल की व्याख्या नहीं की जा सकती है क्योंकि 95% संभावना है कि अंतराल में सही अर्थ है। उपरोक्त विचार प्रयोग में मेरा तर्क क्यों और कहाँ) अलग हो जाता है?


+1 यह सामान्य आबादी से एक द्विआधारी नमूनाकरण स्थिति के लिए वैचारिक प्रगति का एक उल्लेखनीय स्पष्ट खाता है। इसे हमारे साथ साझा करने के लिए धन्यवाद, और हमारी साइट पर आपका स्वागत है!
whuber

कृपया इसे एक प्रश्न के रूप में पोस्ट करें।
जॉन

टिप्पणी के लिए धन्यवाद, जॉन। अब एक अलग प्रश्न ( आंकड़े . stackexchange.com/questions/301478/… ) के रूप में पोस्ट किया है ।
user1718097

4

हालांकि कई महान जवाबों में व्यापक चर्चा हुई है, मैं अधिक सरल परिप्रेक्ष्य जोड़ना चाहता हूं। (हालाँकि यह अन्य उत्तरों में स्पष्ट किया गया है - लेकिन स्पष्ट रूप से नहीं।) कुछ पैरामीटर , और एक नमूना , एक विश्वास अंतराल फॉर्म का एक संभावना विवरण हैθ(X1,X2,,Xn)100p%

P(g(X1,X2,,Xn)<θ<f(X1,X2,,Xn))=p

यदि हम को एक स्थिर मानते हैं , तो उपरोक्त कथन यादृच्छिक चर और , या अधिक सटीक रूप से, यह इसके बारे में है यादृच्छिक अंतराल ।जी ( एक्स 1 , एक्स 2 , , एक्स एन ) ( एक्स 1 , एक्स 2 , , एक्स एन )θg(X1,X2,,Xn)f(X1,X2,,Xn)(g(X1,X2,,Xn),f(X1,X2,,Xn))

इसलिए अंतराल में निहित पैरामीटर की संभावना के बारे में कोई जानकारी देने के बजाय, यह पैरामीटर वाले अंतराल की संभावना के बारे में जानकारी दे रहा है - चूंकि अंतराल यादृच्छिक चर से बना है।


3

व्यावहारिक उद्देश्यों के लिए, आप शर्त लगाने के लिए अधिक गलत नहीं हैं कि आपके 95% सीआई ने 95: 5 बाधाओं पर सही मतलब शामिल किया है, जितना कि आप अपने दोस्त के सिक्के पर 50:50 बाधाओं पर दांव लगाते हैं।

यदि आपका दोस्त पहले ही सिक्का फ़्लिप कर चुका है, और आपको लगता है कि इसके प्रमुख होने की 50% संभावना है, तो आप शब्द संभाव्यता की एक अलग परिभाषा का उपयोग कर रहे हैं। जैसा कि अन्य लोगों ने कहा है, आवृत्तियों के लिए आप किसी घटना के घटित होने की संभावना नहीं बता सकते हैं, बल्कि आप किसी दिए गए प्रक्रिया का उपयोग करके भविष्य में होने वाली किसी घटना की संभावना का वर्णन कर सकते हैं।

दूसरे ब्लॉग से: अक्सर कहने वाला कहेगा: "किसी विशेष घटना की संभावना नहीं हो सकती है। सिक्का या तो सिर या पूंछ दिखाता है, और जब तक आप इसे नहीं दिखाते हैं, मैं बस यह नहीं कह सकता कि तथ्य क्या है। केवल तभी जब आप टॉस दोहराएंगे। बहुत से, कई बार, यदि आप टॉस की प्रारंभिक शर्तों को दृढ़ता से पर्याप्त रूप से बदलते हैं, तो मुझे उम्मीद है कि सभी टोस में सभी हेड्स की सापेक्ष आवृत्ति 0.5 तक पहुंच जाएगी। http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability


2
वह ब्लॉग एक स्ट्रॉ मैन तर्क की तरह लगता है। यह प्रायिकता मॉडल बनाने की क्षमता में निहित (कोई नहीं) निहित सीमा के साथ संभाव्यता के एक दर्शन को भ्रमित करने के लिए प्रकट होता है। मैं उस चरित्र चित्रण में शास्त्रीय सांख्यिकीय प्रक्रियाओं या कार्यप्रणाली के किसी भी रूप को नहीं पहचानता। फिर भी, मुझे लगता है कि आपका अंतिम निष्कर्ष एक अच्छा है - लेकिन यह जिस भाषा का उपयोग करता है, वह यह स्पष्ट नहीं करता है कि शर्त सीआई को चिंतित करती है और इसका मतलब नहीं है, जोखिम भ्रम का एक रूप है जो इस प्रश्न को संबोधित करने का इरादा है।
व्हिबर

1
एक तरीका जो मैं अक्सर देखता हूं वह यह है कि सीआई एक प्रक्रिया का परिणाम है पर जोर देना है। आपके अंतिम विवरण के बारे में मुझे जो पसंद है, वह यह है कि इस तरह के रूप में आसानी से फिर से तैयार किया जा सकता है, जैसे कि "आप 95: 5 में शर्त लगाने के लिए अधिक गलत नहीं हैं, आपके 95% विश्वास अंतराल ने वास्तविक अर्थ को कवर किया है, जैसे आप हैं। अपने दोस्त के सिक्के पर दांव लगाने के लिए 50:50 बाधाओं पर पलटें। "
whuber

ठीक है, इसे बदल दिया।
nigelhenry

2

यह कहें कि आपके द्वारा लिए गए डेटा के विशेष सेट से आपके द्वारा गणना की गई CI संभावित CI के 5% में से एक है जिसमें माध्य नहीं है। यह 95% विश्वसनीय अंतराल होने के लिए कितना करीब है कि आप इसे होने की कल्पना करना चाहेंगे? (यह है, 95% संभावना के साथ माध्य को सम्‍मिलित करने के लिए यह कितना निकट है?) आपको इस बात का कोई भरोसा नहीं है कि यह बिल्‍कुल करीब है। वास्तव में, आपका सीआई 95% सीआई के 95% में से एक भी के साथ ओवरलैप नहीं हो सकता है जो वास्तव में माध्य को शामिल करते हैं। यह उल्लेख करने के लिए नहीं कि इसमें माध्य ही नहीं है, जो यह भी बताता है कि यह 95% विश्वसनीय अंतराल नहीं है।

हो सकता है कि आप इसे अनदेखा करना चाहते हैं और आशावादी रूप से यह मानते हैं कि आपका सीआई 95% से एक है जिसमें इसका मतलब नहीं है। ठीक है, हम आपके सीआई के बारे में क्या जानते हैं, यह देखते हुए कि यह 95% है? यह मतलब होता है, लेकिन शायद केवल चरम पर बाहर का रास्ता, मतलब के दूसरी तरफ सब कुछ छोड़कर। वितरण के 95% शामिल होने की संभावना नहीं है।

किसी भी तरह से, कोई गारंटी नहीं है, शायद यह भी एक उचित उम्मीद नहीं है कि आपका 95% सीआई 95% विश्वसनीय अंतराल है।


मैं पहले पैराग्राफ को लेकर उत्सुक हूं। शायद मैं इसे गलत बता रहा हूं, लेकिन यह तर्क इस तथ्य के साथ थोड़ा अजीब लगता है कि ऐसे कई उदाहरण हैं जिनमें CI और विश्वसनीय अंतराल टिप्पणियों के सभी संभावित सेटों के लिए मेल खाते हैं । मुझे क्या याद किया?
कार्डिनल

@कार्डिनल: मैं गलत हो सकता हूं। मैं सामान्य मामले की बात कर रहा था, लेकिन मेरा अनुमान यह होगा कि उस मामले में जहां सीआई और विश्वसनीय अंतराल समान हैं, सामान्यता जैसे अन्य प्रतिबंध हैं जो सीआई के बहुत दूर होने से रहते हैं।
वेन

मेरा ध्यान पैराग्राफ में अंतिम वाक्य के लिए सबसे दृढ़ता से खींचा गया था; संयोग के अंतराल का उदाहरण एक बिंदु को उजागर करने के लिए था। आप इस बात पर विचार कर सकते हैं कि आप वास्तव में उस वाक्य को मानते हैं या नहीं। :)
कार्डिनल

क्या आपका मतलब है कि 95% सीआई का मतलब यह नहीं है कि 5% का मतलब शामिल नहीं है? मुझे कहना चाहिए "परिभाषा के अनुसार, क्या इसका मतलब स्वयं भी नहीं है?" या मैं और भी ज्यादा लापता हूँ?
वेन

वेन, इस तथ्य को कैसे बताता है कि एक विशेष अंतराल में इसका मतलब नहीं होता है जो इसे एक वैध विश्वसनीय अंतराल होने से रोकता है? क्या मैं इस टिप्पणी को गलत ठहरा रहा हूं?
कार्डिनल

2

(यानी एक दोस्त निष्पक्ष सिक्का फहराता है, परिणाम छिपाता है, और मुझे यह कहने से मना कर दिया जाता है कि 50% मौका है कि यह प्रमुख है)

यदि आप केवल अनुमान लगा रहे हैं कि आपके दोस्त सिक्का 50% सिर / पूंछ के साथ फड़फड़ा रहे हैं तो आप इसे सही नहीं कर रहे हैं।

  • आपको सिक्का के बाद / जब यह जमीन पर और परिणाम के छिपने से पहले जल्दी से देखने की कोशिश करनी चाहिए।
  • इसके अलावा आपको पहले से ही सिक्के की निष्पक्षता का कुछ पूर्व अनुमान लगाने का प्रयास करना चाहिए।

सिक्का फ्लिप के बारे में निश्चित रूप से आपके अनुमान की विश्वसनीयता इन स्थितियों पर निर्भर करेगी और हमेशा समान 50% नहीं होगी (कभी-कभी 'धोखा देने का आपका तरीका बेहतर काम कर सकता है')।

आपका समग्र अनुमान हो सकता है, यदि आप धोखा देते हैं, x> समय का 50% सही है, लेकिन इसका मतलब यह नहीं है कि हर विशेष फेंक की संभावना लगातार x% सिर थी। तो यह एक विशिष्ट फेंक के लिए संभावना पर अपनी समग्र संभावना को प्रोजेक्ट करने के लिए थोड़ा अजीब होगा। यह एक अलग 'संभावना का प्रकार' है।


यह इस बात का एक सा है कि आप 'संभावना' को किस स्तर या गहराई में निर्दिष्ट / परिभाषित करते हैं ।

  • यह विश्वास 'विशेष प्रयोग / प्रवाह में विशिष्ट संभावना' से स्वतंत्र है और 'एक प्रायोरिटी संभावनाओं' से स्वतंत्र है

  • विश्वास प्रयोगों के कलाकारों की टुकड़ी के बारे में है । इसका निर्माण इस तरह किया गया है कि आपको आबादी में प्राथमिकताओं या वितरण को जानने की आवश्यकता नहीं है।

  • विश्वास अनुमान की समग्र 'असफलता दर' के बारे में है, लेकिन विशिष्ट मामलों के लिए संभावना में अधिक सटीक रूपांतरों को निर्दिष्ट करने में सक्षम हो सकता है

    ( संभावना में ये विविधताएँ कम से कम निहित रूप से , सिद्धांत रूप में मौजूद हैं , और हमें उनके अस्तित्व के लिए उन्हें जानने की आवश्यकता नहीं है। लेकिन हम स्पष्ट रूप से एक बायेसियन दृष्टिकोण का उपयोग करके इन संभावनाओं को स्पष्ट रूप से व्यक्त कर सकते हैं)।


उदाहरण 1:

कहते हैं कि आप एक बहुत ही दुर्लभ बीमारी के लिए परीक्षण कर रहे हैं। आप जो एक उच्च है एक परीक्षण है कि एक Bernoulli परीक्षण (सकारात्मक या नकारात्मक) के रूप में देखा जा सकता है प्रदर्शन जब व्यक्ति बीमार या कम है सकारात्मक परिणाम के लिए जब व्यक्ति बीमार नहीं है।p=0.99p=0.01

अब यह आमतौर पर लिए एक सीआई अंतराल का अनुमान लगाने के लिए (नैदानिक ​​अभ्यास में) नहीं किया जाता है, लेकिन यदि आप चाहें तो आप ऐसा कर सकते हैं (उदाहरण के लिए)। यदि परीक्षण सकारात्मक है तो आप अनुमान लगाते हैं कि और यदि परीक्षण नकारात्मक है तो आप अनुमान लगाते हैं ।p0.05p10p0.95

यदि आपके पास आबादी का 1% बीमार है, तो औसतन आपको परीक्षण का 1.98% सकारात्मक मिलेगा (99% स्वस्थ लोगों में से 1% सकारात्मक परीक्षण करता है और 1% बीमार लोगों का सकारात्मक परीक्षण से 99%)। यह आपके 95% CI अंतराल, (सशर्त) को बनाता है जब आप एक सकारात्मक परीक्षण करते हैं , केवल 50% समय सही करते हैं।

दूसरी ओर जब आप एक नकारात्मक परीक्षा का सामना करते हैं, तो आप 95% से अधिक समय सही होंगे, इसलिए कुल मिलाकर आपका सीआई अंतराल का अनुमान सही है (कम से कम) 95% समय, लेकिन मामले के आधार पर एक मामले के लिए (विशिष्ट मामलों के लिए) ) आप वास्तव में यह नहीं कह सकते कि अंतराल के अंदर की संभावना 95% है। कुछ बदलाव की संभावना है।p

उदाहरण 2:

मान लीजिए कि आपके पास 300 आईक्यू प्रश्न हैं। भोली विश्वास अंतराल और देखने के frequentist बिंदु से आप यह मान सकते हैं कि प्रत्येक व्यक्ति को एक सैद्धांतिक व्यक्तिगत है परीक्षण प्रदर्शन के लिए वितरण, और देखे गए परीक्षण प्रदर्शन के आधार पर एक अंतराल के लिए कुछ का अनुमान बना सकते हैं इस तरह के 95% मामलों में आप अंतराल में को ठीक से शामिल करने के लिए सही होंगे ।iN(μi,σi2)μi

यह इस बात को नजरअंदाज करता है कि अर्थ के प्रतिगमन का एक प्रभाव है और किसी भी व्यक्ति के IQ के लिए पूर्व-प्राथमिकता संभावना रूप में वितरित की है । फिर चरम मामलों में, कम या उच्च, परिणामों के परिणाम, माप / परीक्षणों के आधार पर 95%-आत्मविश्वास के अंतराल में किसी व्यक्ति के आईक्यू की संभावना 95% से कम होगी ।μiN(100,15)

(विपरीत उन व्यक्तियों के लिए सही है जिनके पास 100 के करीब परिणाम हैं, उनका आईक्यू शायद 95% -CI के अंदर 95% से अधिक होने की संभावना है, और यह उन गलतियों की भरपाई कर सकता है जो आपने चरम सीमा पर किए थे जैसे कि आप सही हो रहे हैं 95% मामलों में)


2

सबसे पहले, आइए विश्वास अंतराल की परिभाषा दें, या, एक से अधिक आयाम वाले स्थानों में, आत्मविश्वास क्षेत्र। यह परिभाषा एक संक्षिप्त संस्करण है, जिसे जेरज़ी नेमन ने 1937 में रॉयल सोसाइटी को अपने पत्र में दिया था।

पैरामीटर और सांख्यिकीय be । प्रत्येक संभव पैरामीटर मान एक स्वीकृति क्षेत्र से जुड़ा है जिसके लिए , साथ जा रहा है आत्मविश्वास गुणांक, या आत्मविश्वास का स्तर (आम तौर पर 0.95), और जो हम अपने संभावनाओं को परिभाषित करने के लिए है पृष्ठभूमि जानकारी की जा रही है । लिए विश्वास क्षेत्र , दिए गए , तो ।pspA(p,α)prob(sA(p,α)|p=p,I)=ααIps=sC(s,α)={p|sA(p,α)}

दूसरे शब्दों में, पैरामीटर मान जो विश्वास क्षेत्र बनाते हैं, वे ही हैं जिनके नमूना स्थान के संबंधित Alpha -probability क्षेत्र में आँकड़ा होता है।α

अब विचार करें कि किसी भी संभावित पैरामीटर मान :p

[pC(s,α)]prob(s=s|p=p,I)ds=[sA(p,α)]prob(s=s|p=p,I)ds=α

जहां वर्ग कोष्ठक आइवरसन कोष्ठक हैं। यह एक विश्वास अंतराल या क्षेत्र के लिए महत्वपूर्ण परिणाम है। यह कहता है कि , पर नमूना वितरण सशर्त के तहत की उम्मीद है , । इस परिणाम को स्वीकृति क्षेत्रों के निर्माण की गारंटी है, और इसके अलावा यह पर लागू होता है , क्योंकि एक संभावित पैरामीटर मान है। हालांकि, यह बारे में एक संभावना बयान नहीं है , क्योंकि उम्मीदें संभावनाएं नहीं हैं![pC(s,α)]pαppp

वह संभावना जिसके लिए वह अपेक्षा आमतौर पर गलत है, प्रायिकता है, जो सशर्त , कि पैरामीटर विश्वास क्षेत्र में है:s=s

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=s|p=p,I)prob(p=p|I)dpprob(s=s|p=p,I)prob(p=p|I)dp

यह संभावना को कम कर देता है केवल जानकारी के कुछ संयोजन के लिए और स्वीकृति क्षेत्रों । उदाहरण के लिए, यदि पूर्व समान है और नमूना वितरण और में सममित है (उदाहरण के लिए साथ एक गाऊसी जैसे ), तो:αIA(p,α)spp

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=p|p=s,I)dpprob(s=p|p=s,I)dp=prob(sC(s,α)|p=s,I)=prob(sA(s,α)|p=s,I)

यदि इसके अलावा स्वीकृति क्षेत्र ऐसे हैं जो , तो:sA(s,α)sA(s,α)

prob(pC(s,α)|s=s,I)=prob(sA(s,α)|p=s,I)=α

एक जनसंख्या का आकलन करने के लिए पाठ्यपुस्तक का उदाहरण सामान्य सांख्यिकीय के बारे में निर्मित एक मानक आत्मविश्वास अंतराल के साथ होता है जो पूर्ववर्ती धारणाओं का एक विशेष मामला है। इसलिए मानक 95% विश्वास अंतराल करता संभावना 0.95 के साथ मतलब होता है; लेकिन यह पत्राचार आम तौर पर पकड़ में नहीं आता है।


-1

यहां कुछ दिलचस्प जवाब हैं, लेकिन मुझे लगा कि मैं आर का उपयोग करके थोड़ा हाथ जोड़कर प्रदर्शन करूंगा। हमने हाल ही में एक आँकड़ों के पाठ्यक्रम में इस कोड का इस्तेमाल किया था ताकि यह उजागर हो सके कि आत्मविश्वास अंतराल कैसे काम करता है। यहाँ कोड क्या है:

1 - यह एक ज्ञात वितरण से नमूने (n = 1000)

2 - यह प्रत्येक नमूने के माध्य के लिए 95% CI की गणना करता है

3 - यह पूछता है कि प्रत्येक नमूने के सीआई में सही मतलब शामिल है या नहीं।

4 - यह कंसोल में CI के अंश को रिपोर्ट करता है जिसमें सही अर्थ शामिल है।

मैंने बस स्क्रिप्ट को कई बार चलाया और यह वास्तव में बहुत असामान्य नहीं है कि 94% से कम CI को सही मायने में शामिल किया जाए। कम से कम मेरे लिए, यह इस विचार को दूर करने में मदद करता है कि एक आत्मविश्वास अंतराल में 95% सही पैरामीटर होने की संभावना है।

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

उम्मीद है की यह मदद करेगा!


2
आलोचना के लिए क्षमा याचना, लेकिन मुझे इस उत्तर को (अस्थायी रूप से) नीचे देना पड़ा है। मेरा मानना ​​है कि यह एक विश्वास अंतराल के अर्थ को गलत समझ रहा है और मुझे पूरी उम्मीद है कि यह आपकी कक्षा में प्रयुक्त तर्क नहीं था। सिमुलेशन एक (काफी विस्तृत) द्विपद नमूना प्रयोग को कम करते हैं।
कार्डिनल

5
@कार्डिनल वेल ... वह बार-बार सांख्यिकी के लंबे समय तक व्याख्या का उपयोग कर रहा है। जनसंख्या से नमूना कई बार, सीआई की गणना करें कि कई बार और आप पाते हैं कि सही मायने में सीआई 95% समय ( ) में निहित है । कम से कम मेरे लिए यह बहुत स्पष्ट था। 1α=0.95
नेस्टर

4
1000 सीआई के नमूने में "94% से कम" निश्चित रूप से इस विचार के खिलाफ महत्वपूर्ण सबूत नहीं है कि 95% सीआई में इसका मतलब है। वास्तव में, मुझे उम्मीद है कि इस मामले में 95% सीआई वास्तव में माध्य धारण करेंगे।
रोनाल्ड

3
@ रोनाल्ड: हाँ, यह बिल्कुल टिप्पणी के साथ मेरी बात थी, लेकिन आपने इसे बहुत सरल और स्पष्ट रूप से कहा है । धन्यवाद। जैसा कि टिप्पणियों में कहा गया है, किसी को 940 सफलताओं या समय के लगभग 8.7% से कम दिखाई देगा और यह किसी भी 95% सीआई के बारे में सच है कि एक 1000 प्रयोगों के दौरान निर्माण करता है। :)
कार्डिनल

2
@JamesWaters: प्रतिक्रिया देने के लिए समय निकालने के लिए धन्यवाद। कोड ठीक है, लेकिन मैं यह नहीं देखता कि यह "ऐसे उदाहरणों को कैसे प्रदर्शित करता है जिसमें यह गलत है"। क्या आप उस आशय की व्याख्या कर सकते हैं? मुझे अभी भी संदेह है कि यहां एक बुनियादी गलतफहमी हो सकती है। आप समझते हैं कि मैं CI क्या है और इसे सही तरीके से कैसे समझा जा सकता है, लेकिन सिमुलेशन प्रयोग उस सवाल का जवाब नहीं देता है जिससे आप यह दावा करते हैं कि यह जवाब देता है। मुझे लगता है कि इस उत्तर की क्षमता है, इसलिए मैं इसे उस बिंदु को स्पष्ट करने के लिए एक अच्छे संपादन के साथ देखना चाहता हूं जिसे आप प्राप्त करना चाहते हैं। चीयर्स। :)
कार्डिनल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.