इन कथनों का माध्य के लिए 95% CI से तार्किक रूप से अनुसरण क्यों नहीं किया जाता है?


26

मैं "आत्मविश्वास अंतराल के मजबूत गलत अर्थ" पर होकेस्ट्रा एट अल 2014 का पेपर पढ़ रहा हूं, जिसे मैंने वागेनमेकर्स की वेबसाइट से डाउनलोड किया है ।

पृष्ठ के पृष्ठ पर निम्न छवि दिखाई देती है।

प्रश्नोत्तरी

लेखकों के अनुसार, गलत इन सभी कथनों का सही उत्तर है। मुझे बहुत यकीन नहीं है कि बयान झूठे क्यों हैं, और जहां तक ​​मैं बता सकता हूं बाकी कागज यह समझाने का प्रयास नहीं करता है।

मेरा मानना ​​है कि 1-2 और 4 सही नहीं हैं क्योंकि वे सही अर्थ के संभावित मूल्य के बारे में कुछ कहते हैं, जब सही मतलब का एक निश्चित मूल्य होता है जो अज्ञात होता है। क्या यह एक ठोस अंतर है?

3 के बारे में, मैं समझता हूं कि किसी की संभावना के बारे में यह अनुमान लगाने के लिए नहीं है कि अशक्त परिकल्पना गलत है, हालांकि मैं इस कारण से इतना निश्चित नहीं हूं।

इसी तरह 6 सच नहीं हो सकते क्योंकि इसका मतलब है कि प्रयोग से प्रयोग करने के लिए सही मायने बदल रहे हैं।

जिसे मैं वास्तव में बिल्कुल नहीं समझ पा रहा हूं, वह 5. गलत क्यों है? अगर मेरे पास एक प्रक्रिया है कि 95% समय सीआई का उत्पादन करता है जिसमें सही मतलब होता है, तो मुझे यह क्यों नहीं कहना चाहिए कि मुझे 95% विश्वास है जनसंख्या मान 0.1 और 0.4 के बीच है? क्या ऐसा इसलिए है क्योंकि हमारे पास जो नमूना लिया गया था, उसके बारे में हमें कुछ विशेष जानकारी हो सकती है, जिससे हमें लगेगा कि यह 5% में से एक है जिसमें सही अर्थ नहीं है? उदाहरण के लिए, 0.13 को विश्वास अंतराल में शामिल किया गया है और किसी कारण से 0.13 को कुछ विशिष्ट शोध संदर्भ के भीतर एक प्रशंसनीय मूल्य नहीं माना जाता है, उदाहरण के लिए क्योंकि यह मूल्य पिछले सिद्धांत के साथ संघर्ष करेगा।

वैसे भी इस संदर्भ में आत्मविश्वास का क्या मतलब है?


जवाबों:


11

प्रश्न का बहुत अर्थ (5) "अविश्वास" की कुछ अज्ञात व्याख्या पर निर्भर करता है। मैंने कागज को ध्यान से खोजा और "आत्मविश्वास" को परिभाषित करने का कोई प्रयास नहीं पाया या इस संदर्भ में इसका क्या मतलब हो सकता है। प्रश्न (5) के उत्तर के पेपर की व्याख्या है

"... [यह] CI की सीमाओं का उल्लेख करता है, जबकि ... एक CI का उपयोग केवल प्रक्रिया का मूल्यांकन करने के लिए किया जा सकता है न कि एक विशिष्ट अंतराल के लिए।"

यह विशिष्ट और भ्रामक दोनों है। सबसे पहले, यदि आप प्रक्रिया के परिणाम का मूल्यांकन नहीं कर सकते हैं, तो पहली जगह में क्या प्रक्रिया अच्छी है? दूसरा, प्रश्न में कथन प्रक्रिया के बारे में नहीं है, बल्कि इसके परिणामों में पाठक के "आत्मविश्वास" के बारे में है।

लेखक अपना बचाव करते हैं:

"आगे बढ़ने से पहले, सीआई की सही परिभाषा को याद रखना महत्वपूर्ण है। एक सीआई एक पैरामीटर के अनुमान के आसपास निर्मित एक संख्यात्मक अंतराल है। ऐसा अंतराल, हालांकि, पैरामीटर के एक संपत्ति को सीधे इंगित नहीं करता है; इसके बजाय, यह इंगित करता है। प्रक्रिया की एक संपत्ति, जैसा कि एक लगातार तकनीक के लिए विशिष्ट है। "

उनका पूर्वाग्रह अंतिम वाक्यांश में उभरता है: "लगातार तकनीक" (लिखित, शायद, एक निहित छल के साथ)। हालांकि यह लक्षण वर्णन सही है, लेकिन यह गंभीर रूप से अपूर्ण है। यह ध्यान देने में विफल रहता है कि एक आत्मविश्वास अंतराल प्रायोगिक विधियों (कैसे नमूने प्राप्त किए गए और मापा गया था) की एक संपत्ति है, और इससे भी महत्वपूर्ण बात, प्रकृति की। यही कारण है कि किसी को भी इसके मूल्य में दिलचस्पी होगी।

मुझे हाल ही में जीवविज्ञान (अकादमिक प्रेस, 1981) में एडवर्ड बैटशैलेट के सर्कुलर स्टैटिस्टिक्स पढ़ने की खुशी मिली । Batschelet स्पष्ट रूप से और इस बिंदु पर लिखते हैं, एक शैली में काम करने वाले वैज्ञानिक के निर्देशन में। यहाँ वह विश्वास अंतराल के बारे में क्या कहता है:

" मौका में उतार-चढ़ाव के कारण होने वाले विचलन के संकेत के बिना एक पैरामीटर का अनुमान बहुत कम वैज्ञानिक मूल्य है। "

"जबकि पैरामीटर का अनुमान लगाया जाना एक निश्चित संख्या है, विश्वास सीमाएं नमूने द्वारा निर्धारित की जाती हैं। वे आंकड़े हैं और इसलिए, मौका में उतार-चढ़ाव पर निर्भर हैं। समान जनसंख्या से खींचे गए अलग-अलग नमूने अलग-अलग आत्मविश्वास अंतराल की ओर ले जाते हैं।"

[जोर मूल में है, पीपी 84-85 पर।]

जोर में अंतर को नोटिस करें: जबकि प्रश्न में कागज प्रक्रिया पर ध्यान केंद्रित करता है, Batschelet नमूना पर ध्यान केंद्रित करता है और विशेष रूप से यह पैरामीटर के बारे में क्या प्रकट कर सकता है और कितनी जानकारी "मौका उतार-चढ़ाव" से प्रभावित हो सकता है। मुझे यह व्यावहारिक रूप से व्यावहारिक, वैज्ञानिक दृष्टिकोण कहीं अधिक रचनात्मक, रोशन और अंततः उपयोगी लगता है।

इसलिए कागज़ की पेशकश की तुलना में आत्मविश्वास अंतराल का एक पूर्ण लक्षण वर्णन इस तरह से कुछ आगे बढ़ना होगा:

एक CI एक संख्यात्मक अंतराल है जो एक पैरामीटर के अनुमान के आसपास निर्मित होता है। सीआई निर्माण से जुड़ी मान्यताओं से सहमत किसी को भी यह कहना उचित है कि वे आश्वस्त हैं कि पैरामीटर अंतराल के भीतर है: यह "आत्मविश्वास" का अर्थ है। यह अर्थ मोटे तौर पर विश्वास के पारंपरिक गैर-तकनीकी अर्थों के अनुरूप है क्योंकि प्रयोग के कई प्रतिकृति के तहत (चाहे वे वास्तव में जगह लेते हों या नहीं) सीआई, हालांकि यह भिन्न होगा, अधिकांश समय पैरामीटर होने की उम्मीद है।

इस फुलर में, अधिक पारंपरिक और "आत्मविश्वास" का रचनात्मक अर्थ है, सवाल (5) का उत्तर सही है।


2
यह उल्लेखनीय है कि Batschelet का दृष्टिकोण कुछ प्रकार के आत्मविश्वास अंतराल को प्रकट करता है जो विचारशील पाठकों को विराम देता है, जैसे कि CI जो खाली हो सकते हैं। इस तरह के एक सीआई "मौका में उतार-चढ़ाव के कारण विचलन के संकेत" के विचार को बुरी तरह से पकड़ लेंगे। यह संकेत देता है कि शायद आत्मविश्वास अंतराल की मानक परिभाषा का उद्देश्य पूरा नहीं होता है। भले ही, प्रश्न (5) में "आत्मविश्वास" का क्या अर्थ हो, इसके किसी भी स्पष्ट संकेत के अभाव में, हमें उस प्रश्न के उत्तर के आधार पर लेखकों द्वारा निकाले गए किसी भी निष्कर्ष को छोड़ना होगा।
whuber

मैं विश्वास अंतराल की आपकी परिष्कृत परिभाषा के तहत 5 सही होने के बारे में असहमत हूं। CI को एक पर्याप्त आँकड़ा पर आधारित होना चाहिए - अन्यथा आप CI बना सकते हैं जिसमें "खराब" और "अच्छा" मामलों का उपवर्ग है, जो आपके पास के नमूने से पहचाने जा सकते हैं, जैसे कि उन कक्षाओं में कवरेज बहुत कम या बहुत अधिक है। सबसे बुनियादी उदाहरण से आकार 2 का एक iid नमूना है । नमूना माध्य लिए पर्याप्त नहीं है तो अपने सीआई कवरेज विशेष नमूना आपको मिल पर निर्भर करता है। μyमैं~सीयूसीy(μ,1)μ
प्रोबेबिलिसलॉजिक

... cont'd ... इसलिए लंबे समय तक औसत कवरेज हासिल करने के बावजूद, नमूनों के किसी विशेष वर्ग में कवरेज नहीं होगा।
प्रोबेबिलिसलॉजिक

10

प्रश्न 1-2, 4: लगातार विश्लेषण में, सही अर्थ यादृच्छिक चर नहीं है, इस प्रकार से संभाव्यताएं परिभाषित नहीं होती हैं, जबकि बायेसियन विश्लेषण में संभावनाएं पूर्व पर निर्भर होती हैं।

प्रश्न 3: उदाहरण के लिए, एक ऐसे मामले पर विचार करें, जहाँ हम यह जानते हैं कि यह अभी भी इन परिणामों को प्राप्त करना संभव है, लेकिन यह कहना अनुचित होगा कि अशक्त परिकल्पना सच होने की 'संभावना' नहीं है। हमने ऐसे आंकड़े प्राप्त किए जो अशक्त परिकल्पना के सत्य होने की संभावना नहीं है, लेकिन इसका अर्थ यह नहीं है कि अशक्त परिकल्पना सच होने की संभावना नहीं है।

प्रश्न 5: यह थोड़ा संदिग्ध है क्योंकि यह "हम पी% आश्वस्त हो सकते हैं" की परिभाषा पर निर्भर करता है। यदि हम पी% आत्मविश्वास के अंतराल से निकली बात का मतलब निकालने के लिए कथन को परिभाषित करते हैं, तो कथन परिभाषा सही है। विशिष्ट प्रो-बायेसियन तर्क में कहा गया है कि लोग इन कथनों की व्याख्या सहज रूप से करने के लिए करते हैं, जिसका अर्थ है "संभावना पी% है", जो गलत होगा (1-2,4 के जवाबों की तुलना करें)।

प्रश्न 6: आपकी व्याख्या "इसका तात्पर्य है कि सही अर्थ प्रयोग से प्रयोग में बदल रहा है" बिल्कुल सही है।

लेख हाल ही में एंड्रयू गेलमैन के ब्लॉग ( http://andrewgelman.com/2014/03/15/problematic-interpretations-confidence-intervals/ ) में चर्चा की गई । उदाहरण के लिए, प्रश्न 5 में कथन की व्याख्या के विषय में टिप्पणियों में चर्चा की गई है।


1
इसलिए, यदि कोई वापस चला गया और "सही अर्थ" के लिए "सही अर्थ के लिए सर्वोत्तम अनुमान" के साथ हर उदाहरण को बदल दिया जाए, तो क्या कथन सही हो जाएंगे?
16

@Superbest No. यदि हम "इस डेटा को दिए गए सर्वश्रेष्ठ अनुमान" पर विचार करें, तो यह एक ज्ञात स्थिरांक है (बशर्ते कि यह सबसे अच्छी तरह से परिभाषित हो)। अगर हम "भविष्य के नमूने का सबसे अच्छा अनुमान" मानते हैं, तो हमें नहीं पता कि यह कैसे बदलता है क्योंकि हम सही अर्थ नहीं जानते हैं।
जुहो कोक्कल

यह उपरोक्त टिप्पणी का बिल्कुल खंडन नहीं है, लेकिन मुझे यह कहना चाहिए कि वास्तव में "सर्वश्रेष्ठ अनुमान" का अर्थ एक वितरण के बजाय एक वास्तविक संख्या है। एक CI के साथ, शायद "वितरण का सही अर्थ जहां यह डेटा दिया जा सकता है" के बारे में बात कर सकता है।
शानदार

1
@ सुपर पेपर में सीआई को संबोधित करने की गलतफहमी। विशेष रूप से, सही अर्थ एक संख्या है ; इसका कोई वितरण नहीं है। आगे की चर्चा के लिए आत्मविश्वास अंतराल के लिए एक साइट खोज में पहले दो हिट देखें ।
whuber

1
@ सुपर, "विश्वसनीय अंतराल" करीब आएगा।
whuber

8

"95% आश्वस्त" होने का क्या अर्थ है, इसकी कोई औपचारिक परिभाषा के बिना, # 5 सही या गलत लेबल लगाने का क्या औचित्य है? एक आम आदमी निस्संदेह गलत व्याख्या करेगा जो उस अंतराल में मतलब के 95% होने की संभावना के पर्याय के रूप में है: लेकिन कुछ लोग इसका उपयोग अंतराल पैदा करने की विधि के अर्थ में करते हैं, जिनके अंतराल में सही मायने में 95% समय होता है, अज्ञात पैरामीटर की संभावना वितरण के बारे में बात करने से बचने के लिए ठीक है; जो शब्दावली का एक स्वाभाविक पर्याप्त विस्तार लगता है।

पूर्ववर्ती कथन (# 4) की समान संरचना ने उत्तरदाताओं को "हम 95% आश्वस्त हो सकते हैं" और "95% संभावना है" के बीच एक अंतर को आकर्षित करने की कोशिश करने के लिए प्रोत्साहित किया है, भले ही उन्होंने पहले विचार का मनोरंजन नहीं किया हो। मैंने इस चालाकी की अपेक्षा की थी कि # 5 समझौते में सबसे अधिक अनुपात हो सकता है - कागज को देखते हुए, मुझे पता चला कि मैं गलत था, लेकिन ध्यान दिया कि कम से कम 80% ने डच संस्करण में प्रश्नावली को पढ़ा, जिसके बारे में शायद सवाल उठने चाहिए। अंग्रेजी अनुवाद की प्रासंगिकता।


4

यहाँ बीएस एविट के डिक्शनरी ऑफ़ स्टैटिस्टिक्स से एक आत्मविश्वास अंतराल की परिभाषा दी गई है :

"नमूना मानों से गणना की गई मानों की एक श्रृंखला, जो एक निश्चित संभावना के साथ सही मान मान रखने के लिए माना जाता है। 95% CI, उदाहरण के लिए, अनुमान है कि बार-बार दोहराए गए अनुमान प्रक्रिया को दोहराया गया था। परिकलित अंतरालों में वास्तविक पैरामीटर मान सम्‍मिलित होने की अपेक्षा की जाएगी। ध्यान दें कि निर्दिष्ट संभाव्यता स्तर अंतराल के गुणों को संदर्भित करता है न कि पैरामीटर को ही, जिसे एक यादृच्छिक चर नहीं माना जाता है "

एक बहुत ही आम गलत धारणा है कि एक विश्वसनीय अंतराल , एकेए "बायेसियन आत्मविश्वास अंतराल" के साथ एक आत्मविश्वास अंतराल के अर्थ को भ्रमित करना है , जो प्रश्नों में उन लोगों के समान बयान करता है।

मैंने सुना है कि आत्मविश्वास अंतराल अक्सर विश्वसनीय अंतराल के समान होते हैं, जो एक असंगत से निकले थे, लेकिन वह मुझे अनायास ही बता दिया गया था (वैसे व्यक्ति जो मैं बहुत सम्मान करता हूं)।


जेनेस 1976 कागजी विश्वास अंतराल बनाम बेसेसियन अंतराल। वह कम से कम एक विश्वसनीय स्मारिका है। इसमें बर्जर और बर्नार्डो के संदर्भ पुजारी भी हैं। सच में, आप इनमें से कभी नहीं सुना है?
प्रोबेबिलिसलॉजिक

2

प्रश्न 5 के झूठ के अंतर्ज्ञान के बारे में, मैं इस विषय पर निम्नलिखित चर्चा यहाँ से प्राप्त करता हूँ

यह कहना सही है कि 95% संभावना है कि आपने जिस आत्मविश्वास अंतराल की गणना की है, उसमें सही आबादी का मतलब है। यह कहना बिल्कुल सही नहीं है कि 95% संभावना है कि आबादी का मतलब अंतराल के भीतर है।

क्या फर्क पड़ता है? जनसंख्या का मतलब एक मूल्य है। आप नहीं जानते कि यह क्या है (जब तक आप सिमुलेशन नहीं कर रहे हैं) लेकिन इसका एक मूल्य है। यदि आपने प्रयोग दोहराया है, तो वह मूल्य नहीं बदलेगा (और आपको अभी भी नहीं पता होगा कि यह क्या है)। इसलिए यह इस संभावना के बारे में पूछने के लिए कड़ाई से सही नहीं है कि आबादी का मतलब एक निश्चित सीमा के भीतर है। इसके विपरीत, आपके द्वारा गणना किया जाने वाला आत्मविश्वास अंतराल आपके द्वारा एकत्र किए गए डेटा पर निर्भर करता है। यदि आपने प्रयोग दोहराया है, तो आपका आत्मविश्वास अंतराल लगभग निश्चित रूप से अलग होगा। इसलिए इस संभावना के बारे में पूछना ठीक है कि अंतराल में जनसंख्या का मतलब है।

अब आपके विशिष्ट प्रश्नों के बारे में 5. यह गलत क्यों है ...

  1. क्या ऐसा इसलिए है क्योंकि हमारे पास अभी जो नमूना लिया गया है उसके बारे में कुछ विशेष जानकारी हो सकती है जिससे हमें लगेगा कि यह 5% में से एक है जिसमें सही मतलब नहीं है? नहीं, बल्कि, मुझे लगता है कि यह है क्योंकि सही मतलब यादृच्छिक चर नहीं है, लेकिन विश्वास अंतराल डेटा का एक फ़ंक्शन है।
  2. 100(1-α)100(1-α)

एक साइड नोट के रूप में (इस प्रश्न के अन्य उत्तरों में उल्लेख किया गया है), एक विश्वसनीय अंतराल , बायेसियन आंकड़ों से एक अवधारणा, यह अनुमान लगाती है कि पैरामीटर के सही मूल्य में विश्वास अंतराल होने की एक विशेष संभावना है जो वास्तव में प्राप्त आंकड़ों को दिया गया है। शायद आप इस पर गेलमैन के ब्लॉग से अधिक पृष्ठभूमि प्राप्त कर सकते हैं।


5
"अंतराल में सही मूल्य होता है" और "सही मूल्य अंतराल के भीतर निहित है" का अर्थ बिल्कुल एक ही बात है। यह पूर्व के संदर्भ में सोचने के लिए अधिक उपयोगी है, लेकिन यह कहना सही नहीं है कि एक सही है और दूसरा गलत है।
डेविड रिचरबी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.