जब विश्वास अंतराल उपयोगी होते हैं?


30

अगर मैं सही ढंग से समझता हूं कि एक पैरामीटर का एक आत्मविश्वास अंतराल एक विधि द्वारा निर्मित अंतराल है जो नमूनों के निर्दिष्ट अनुपात के लिए सही मूल्य वाले अंतराल की पैदावार करता है। इसलिए 'विश्वास' उस पद्धति के बारे में है जो अंतराल के बजाय मैं एक विशेष नमूने से गणना करता हूं।

आँकड़ों के उपयोगकर्ता के रूप में मैंने हमेशा इसे धोखा दिया है क्योंकि सभी नमूनों का स्थान काल्पनिक है। मेरे पास एक नमूना है और मैं जानना चाहता हूं कि वह नमूना मुझे एक पैरामीटर के बारे में क्या बताता है।

क्या यह फैसला गलत है? क्या आत्मविश्वास के अंतराल को देखने के तरीके कम से कम कुछ परिस्थितियों में हैं, जो आंकड़ों के उपयोगकर्ताओं के लिए सार्थक होंगे?

[एक math.se उत्तर https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 में आत्मविश्वास के अंतराल को समाप्त करने के बाद यह प्रश्न दूसरे विचारों से उत्पन्न होता है। # 7572 ]

जवाबों:


15

मैं सीआई के बारे में सोचना चाहता हूं कि हाइपोथीसिस टेस्टिंग (एचटी) ढांचे से बचने के लिए, नेमन के दृष्टिकोण के बाद कम से कम द्विआधारी निर्णय ढांचा है , और किसी तरह से माप के सिद्धांत के अनुरूप है। अधिक सटीक रूप से, मैं उन्हें एक अनुमान की विश्वसनीयता (उदाहरण के लिए, अंतर का अंतर) के अधिक करीब देखता हूं, और इसके विपरीत एचटी हाइपोथेटिको-डिडक्टिव रीजनिंग के अधिक करीब हैं, इसके नुकसान के साथ (हम अशक्त स्वीकार नहीं कर सकते हैं, विकल्प है) अक्सर स्टोकेस्टिक, आदि)। फिर भी, अंतराल के अनुमान और एचटी दोनों के साथ हमें अधिकतर समय वितरण मान्यताओं पर निर्भर रहना पड़ता है (उदाहरण के लिए तहत एक नमूना वितरण H0), जो हमारे नमूने से सामान्य आबादी या प्रतिनिधि एक (कम से कम एक) में प्रवेश करने की अनुमति देता है। लगातार दृष्टिकोण)।

कई संदर्भों में, सीआई सामान्य एचटी के पूरक हैं, और मैं उन्हें निम्न चित्र के रूप में देखता हूं (यह तहत है ):H0

वैकल्पिक शब्द

यानी, एचटी फ्रेमवर्क (बाएं) के तहत, आप देखते हैं कि आपका आँकड़ा शून्य से कितना दूर है, जबकि CI (दाएं) के साथ आप एक निश्चित अर्थ में "अपने आंकड़े से" अशक्त प्रभाव को देख रहे हैं।

इसके अलावा, ध्यान दें कि कुछ प्रकार के आंकड़ों के लिए, जैसे कि अनुपात-अनुपात, HT अक्सर अर्थहीन होते हैं और इसके संबद्ध CI को देखना बेहतर होता है जो कि सममित होता है और एसोसिएशन की दिशा और परिशुद्धता, यदि कोई हो, के रूप में अधिक प्रासंगिक जानकारी प्रदान करता है।


आप क्यों कहते हैं कि परिकल्पना परीक्षण अक्सर बाधाओं अनुपात के लिए अर्थहीन होते हैं, किसी भी अन्य प्रभाव अनुमान से अधिक? मैं इसके बजाय तनाव चाहता हूं कि आत्मविश्वास अंतराल, अनुपात अनुपात के लिए मानक त्रुटियों और परिमित नमूनों में असममित नमूना वितरण के साथ अन्य अनुमानों की तुलना में अधिक उपयोगी है।
onestop

@ अच्छी तरह से, मैं आंशिक रूप से सोच रहा था कि आप "असममित नमूना वितरण के बारे में क्या कहते हैं ..." (और ऐसा लगता है कि मैं इतना स्पष्ट नहीं था), लेकिन इस तथ्य के भी कि महामारी विज्ञान के अध्ययनों में हम आमतौर पर सीआईएस में सबसे अधिक रुचि रखते हैं (जो कि) HT की तुलना में हमारा अनुमान कितना सही है)।
chl

+1। यह मुझे याद दिलाता है कि मैं अलग-अलग चीज़ों को आज़माकर और सामान बदलकर कूद कर और सीखने के लिए आपकी स्क्रिप्ट का उपयोग कर रहा हूं। इसके लिए फिर से धन्यवाद, आरंभ करने के लिए बहुत उपयोगी।
ars

@ars वास्तव में, मुझे याद है कि यह चित्र PStricks के साथ बनाया गया था। वैसे भी, Asymptote के लिए एक अच्छा प्रारंभिक बिंदु piprime.fr/asymptote है
chl

@chl, यह ऑफ-टॉपिक हो सकता है, लेकिन क्या आप मुझे बता सकते हैं कि क्या आपने R में ये ग्राफ बनाए हैं?
सनकूलसु

7

आपके 2nd Q से संबंधित एक वैकल्पिक दृष्टिकोण, "क्या आत्मविश्वास के अंतराल को देखने के तरीके कम से कम कुछ परिस्थितियों में हैं, जो आंकड़ों के उपयोगकर्ताओं के लिए सार्थक होंगे?"

आपको बायेसियन इंट्रेंस और परिणामस्वरूप विश्वसनीय अंतराल पर एक नज़र डालनी चाहिए । एक 95% विश्वसनीय अंतराल को एक अंतराल के रूप में व्याख्या किया जा सकता है, जो आपको लगता है कि सच्चे पैरामीटर मान सहित 95% संभावना है। आपके द्वारा भुगतान किया जाने वाला मूल्य यह है कि आपको उन मानों पर एक पूर्व संभाव्यता वितरण डालने की आवश्यकता है जो आपको विश्वास है कि डेटा एकत्र करने से पहले सही पैरामीटर लेने की संभावना है । और आपका पूर्व किसी और के पूर्व से भिन्न हो सकता है, इसलिए जब आप समान डेटा का उपयोग करते हैं तो आपके परिणामी विश्वसनीय अंतराल भी भिन्न हो सकते हैं।

यह केवल संक्षेप में प्रस्तुत करने का मेरा त्वरित और क्रूड प्रयास है! एक व्यावहारिक फोकस वाली एक अच्छी पाठ्यपुस्तक है:

एंड्रयू गेलमैन, जॉन बी। कार्लिन, हाल एस स्टर्न और डोनाल्ड बी। रुबिन। "बायेसियन डेटा एनालिसिस" (दूसरा संस्करण)। चैपमैन एंड हॉल / सीआरसी, 2003. आईएसबीएन 978-1584883883


धन्यवाद। लेकिन विशेष रूप से लगातार विश्वास अंतराल के बारे में क्या? क्या ऐसी कोई भी परिस्थिति है जहाँ वे प्रासंगिक होंगे?
ज्योतिर्मय भट्टाचार्य

मेरा मानना ​​है कि अलग-अलग पुजारियों का होना एक गैर-मुद्दा है (कम से कम उद्देश्य बायेसियन दृष्टिकोण से), अगर ऐसा होता है कि आपको हाथ में स्थिति के बारे में अलग-अलग ज्ञान है। हमने पुजारियों को अपनी प्राथमिकता की जानकारी देने के तरीके के रूप में देखा। मुझे पता है कि यह सरल नहीं है ...
टेक्टर

बायोटियन के बारे में @ ज्योतिर्मय बनाम अक्सरवादी दृष्टिकोण, दिलचस्प बिंदु यहां बनाए गए थे: आंकड़े ।stackexchange.com
chl

6

मुझे लगता है कि इस प्रश्न का आधार त्रुटिपूर्ण है क्योंकि यह अनिश्चित और ज्ञात के बीच के अंतर को नकारता है ।

एक सिक्का फ्लिप का वर्णन एक अच्छा सादृश्य प्रदान करता है। सिक्का फ़्लिप होने से पहले, परिणाम अनिश्चित है; बाद में, यह अब "काल्पनिक" नहीं है। वास्तविक स्थिति के साथ इस दोष को समझने के लिए, हम समझने की इच्छा रखते हैं (सिक्के के व्यवहार, या निर्णय जो इसके परिणाम के रूप में किए जाने हैं) अनिवार्य रूप से दुनिया को समझने में संभावना के लिए एक भूमिका से इनकार करते हैं।

यह विपरीत एक प्रायोगिक या नियामक क्षेत्र में तेज राहत में फेंक दिया जाता है। ऐसे मामलों में वैज्ञानिक या नियामक को पता है कि वे उन परिस्थितियों से सामना करेंगे जिनके परिणाम, किसी भी समय, पहले से अज्ञात हैं, फिर भी उन्हें महत्वपूर्ण निर्धारण करना होगा जैसे कि प्रयोगों को कैसे डिज़ाइन करना है या नियमों के अनुपालन का उपयोग करने के लिए मानदंड स्थापित करना है। (दवा परीक्षण, कार्यस्थल सुरक्षा, पर्यावरण मानकों, और इसी तरह के लिए)। इन लोगों और संस्थाओं जिसके लिए वे जरूरत काम के तरीकों और का ज्ञान उन तरीकों की संभाव्य विशेषताओं ऐसी अच्छा प्रयोगात्मक डिजाइन और निष्पक्ष निर्णय प्रक्रियाओं के रूप में इष्टतम और सफ़ाई रणनीतियों, विकसित करने के लिए है कि संभव के रूप में छोटे रूप में अं।

आत्मविश्वास के अंतराल, उनके शास्त्रीय रूप से खराब औचित्य के बावजूद, इस निर्णय-सैद्धांतिक ढांचे में फिट होते हैं। जब एक यादृच्छिक अंतराल के निर्माण की विधि में अच्छे गुणों का एक संयोजन होता है, जैसे कि अंतराल की न्यूनतम अपेक्षित कवरेज को सुनिश्चित करना और अंतराल की अपेक्षित लंबाई को कम करना - दोनों एक प्राथमिक गुण हैं, एक पोस्टीरियर नहीं - तो खत्म उस पद्धति का उपयोग करने का एक लंबा कैरियर हम उस विधि द्वारा इंगित किए गए कार्यों से जुड़े लागत को कम कर सकते हैं।


निर्णय लेने के लिए आत्मविश्वास अंतराल का उपयोग करने का एक उदाहरण दें। या, बेहतर, अभी तक, दो आत्मविश्वास अंतरालों की तुलना करें और आप हर एक के साथ अलग-अलग निर्णय कैसे करेंगे, जबकि लगातार रूपरेखा में पूरी तरह से रखते हैं।
ब्रेनप्रेमफ्रॉस्ट

@ किसी भी परिचयात्मक आँकड़े पाठ्यपुस्तक इस तरह के उदाहरण प्रदान करेगा। एक है कि बिना सोचे-समझे अक्सर फ़्रीडमैन, पिसानी, और पर्स, सांख्यिकी (कोई भी संस्करण) है।
whuber

6

आप यह कहने में सही हैं कि 95% विश्वास अंतराल एक ऐसी चीज है जो 95% मामलों में काम करने वाली विधि का उपयोग करने के परिणामस्वरूप होती है, बजाय किसी व्यक्तिगत अंतराल के जिसमें 95% अपेक्षित मान होने की संभावना होती है।

"विश्वास सीमा का तार्किक आधार और व्याख्या, अब भी, विवाद का विषय है।" {डेविड कोलक्वाउन, 1971, जीवविज्ञान पर व्याख्यान}

यह उद्धरण 1971 में प्रकाशित एक सांख्यिकी पाठ्यपुस्तक से लिया गया है, लेकिन मैं इस बात पर ध्यान दूंगा कि यह 2010 में अभी भी सही है। द्विपदीय अनुपात के लिए विश्वास अंतराल के मामले में विवाद शायद सबसे चरम है। उन आत्मविश्वास अंतरालों की गणना के लिए कई प्रतिस्पर्धी तरीके हैं, लेकिन वे सभी एक या अधिक इंद्रियों में गलत हैं और यहां तक ​​कि सबसे खराब प्रदर्शन करने वाली विधि में पाठ्यपुस्तक के लेखकों के बीच प्रस्तावक हैं। यहां तक ​​कि तथाकथित 'सटीक' अंतराल विश्वास अंतराल की उम्मीद की गई संपत्तियों का उत्पादन करने में विफल होते हैं।

सर्जनों के लिए लिखे गए एक पेपर में (आंकड़ों में उनकी रुचि के लिए व्यापक रूप से जाना जाता है!), जॉन लुडब्रुक और मैंने एक समान बायेसियन का उपयोग करके गणना किए गए आत्मविश्वास अंतरालों के नियमित उपयोग के लिए तर्क दिया क्योंकि ऐसे अंतरालों में लगातार किसी भी विधि के रूप में अच्छा गुण होता है (औसतन सभी सही अनुपातों पर ठीक 95% कवरेज) लेकिन, महत्वपूर्ण बात यह है कि सभी मनाया अनुपातों (95% कवरेज) पर बहुत बेहतर कवरेज। अपने लक्षित श्रोताओं के कारण, कागज बहुत विस्तृत नहीं है और इसलिए यह सभी सांख्यिकीविदों को आश्वस्त नहीं कर सकता है, लेकिन मैं परिणाम और औचित्य के पूर्ण सेट के साथ एक अनुवर्ती पेपर पर काम कर रहा हूं।

यह एक ऐसा मामला है जहां बेयसियन दृष्टिकोण के पास लगातारवादी दृष्टिकोण के रूप में अच्छे गुण होते हैं, कुछ ऐसा होता है जो अक्सर होता है। एक समान पूर्व की धारणा समस्यागत नहीं है क्योंकि जनसंख्या अनुपात का एक समान वितरण उस निरंतर कवरेज की प्रत्येक गणना में निर्मित होता है जिसे मैंने पार किया है।

आप पूछते हैं: "क्या आत्मविश्वास के अंतराल को देखने के तरीके कम से कम कुछ परिस्थितियों में हैं, जो आंकड़ों के उपयोगकर्ताओं के लिए सार्थक होंगे?" मेरा जवाब, तब यह है कि द्विपद विश्वास अंतराल के लिए एक अंतराल प्राप्त कर सकते हैं, जिसमें सभी मनाया अनुपातों के लिए जनसंख्या अनुपात वास्तव में 95% है। यह एक हाँ है। हालांकि, आत्मविश्वास अंतराल का पारंपरिक उपयोग सभी जनसंख्या अनुपात के लिए कवरेज की उम्मीद करता है और इसके लिए जवाब "नहीं!" है।

आपके प्रश्न के उत्तर की लंबाई, और उनके लिए विभिन्न प्रतिक्रियाएं बताती हैं कि आत्मविश्वास के अंतराल को व्यापक रूप से गलत समझा जाता है। यदि हम सभी सच्चे पैरामीटर मानों के लिए सभी नमूना मानों के लिए सच्चे पैरामीटर मान के कवरेज के लिए अपने उद्देश्य को बदल देते हैं, तो यह आसान हो सकता है क्योंकि अंतराल को तब प्रदर्शन मानों के प्रदर्शन के बजाय सीधे प्रासंगिक मानों के रूप में आकार दिया जाएगा। विधि प्रति से।


5

यह एक बड़ी चर्चा है। मुझे लगता है कि बायेसियन विश्वसनीय अंतराल और संभावना समर्थन अंतराल जाने के लिए रास्ता है, साथ ही साथ ब्याज की घटनाओं की बायेसियन पश्चगामी संभावनाएं (जैसे, एक दवा प्रभावहीन है)। लेकिन आत्मविश्वास के अंतराल के साथ पी-मूल्यों को दबाने से एक प्रमुख लाभ होता है। वस्तुतः NEJM और JAMA जैसी बेहतरीन मेडिकल पत्रिकाओं के हर अंक में "एब्सट्रैक्ट्स ऑफ एविडेंस इज नॉट ए प्रूफ़ ऑफ़ एब्सेंस" प्रॉब्लम है जो उनके एब्सट्रैक्ट में है। आत्मविश्वास अंतराल का उपयोग काफी हद तक इस तरह के भूलों को रोक देगा। एक छोटा सा पाठ है http://www.amazon.com/Statistics-Confidence-Intervals-Statutic-Guidelines/dp/0727913751


3

अपने प्रश्न को सीधे संबोधित करने के लिए: मान लीजिए कि आप एक निश्चित मात्रा में अनाज के साथ एक अनाज बॉक्स को भरने के लिए मशीन के उपयोग पर विचार कर रहे हैं। जाहिर है, आप बॉक्स को ओवरफिल / कम नहीं करना चाहते हैं। आप मशीन की विश्वसनीयता का आकलन करना चाहते हैं। आप इस तरह के परीक्षणों की एक श्रृंखला करते हैं: (ए) बॉक्स को भरने के लिए मशीन का उपयोग करें और (बी) बॉक्स में भरे गए अनाज की मात्रा को मापें।

एकत्र किए गए डेटा का उपयोग करके आप अनाज की मात्रा के लिए एक विश्वास अंतराल का निर्माण करते हैं जो मशीन को बॉक्स में भरने की संभावना है। यह आत्मविश्वास अंतराल बताता है कि हमने जो अंतराल प्राप्त किया है, उसमें 95% संभावना है कि इसमें सही मात्रा में अनाज होगा जो मशीन बॉक्स में डालेगी। जैसा कि आप कहते हैं, विश्वास अंतराल की व्याख्या विचार के तहत विधि द्वारा उत्पन्न काल्पनिक, अनदेखी नमूनों पर निर्भर करती है। लेकिन, यह ठीक वही है जो हम अपने संदर्भ में चाहते हैं। उपरोक्त संदर्भ में, हम बॉक्स को भरने के लिए बार-बार मशीन का उपयोग करेंगे और इस प्रकार हम मशीन में बॉक्स में भरने वाले अनाज की मात्रा का काल्पनिक, अनदेखी अहसास करते हैं।

उपरोक्त संदर्भ से दूर होने के लिए: एक आत्मविश्वास अंतराल हमें एक गारंटी देता है कि अगर हम जांच के तहत विधि का उपयोग करने के लिए थे (उपरोक्त उदाहरण विधि = मशीन में) बार-बार 95% संभावना है कि विश्वास अंतराल में सही पैरामीटर होगा ।


2
μσ2μ

1
@ ज्योतिर्मय, निश्चित रूप से एक विशिष्ट CI तरीका बंद हो सकता है। दूसरे शब्दों में, 5% संभावना है कि CI में सही मूल्य नहीं है। फिर भी, मैंने जो व्याख्या दी, वह इस बात के अनुरूप है कि वास्तव में CI का निर्माण कैसे किया जाता है। हम बार-बार विधि का उपयोग करने की कल्पना करते हैं और सीआई का निर्माण करते हैं, इस बात की संभावना है कि देखे गए सीआई में सही मान 0.95 है। ध्यान दें कि मेरा जवाब इस बात की संभावना के बारे में कुछ भी नहीं कहता है कि वास्तविक मूल्य वास्तव में कहां है क्योंकि यह एक बयान है जो केवल विश्वसनीय अंतराल के साथ बनाया जा सकता है और आत्मविश्वास अंतराल नहीं।

1
(100α)H0tz

@Srikant। मैं शायद जवाब में "विधि = मशीन" गलत समझा। मुझे लगा कि आप कह रहे हैं कि असेंबली लाइन से बाहर आने वाले सभी बॉक्सों में से 95% बक्से के एक विशेष नमूने से प्राप्त 95% विश्वास अंतराल के भीतर वजन होगा।
ज्योतिर्मय भट्टाचार्य
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.