संकीर्ण आत्मविश्वास अंतराल - उच्च सटीकता?


18

मुझे विश्वास अंतराल के बारे में दो प्रश्न हैं:

स्पष्ट रूप से एक संकीर्ण आत्मविश्वास अंतराल का अर्थ है कि उस अंतराल के भीतर एक अवलोकन प्राप्त करने का एक छोटा मौका है, इसलिए, हमारी सटीकता अधिक है।

साथ ही ९ ५% आत्मविश्वास अंतराल ९९% विश्वास अंतराल की तुलना में संकीर्ण है जो व्यापक है।

९९% आत्मविश्वास अंतराल ९ ५% से अधिक सटीक है।

क्या कोई सरल स्पष्टीकरण दे सकता है जो मुझे सटीकता और संकीर्णता के बीच इस अंतर को समझने में मदद कर सकता है?


2
मुझे लगता है कि आपका मतलब है " उस अंतराल के बाहर अवलोकन प्राप्त करने का एक छोटा मौका है "। दुर्भाग्य से, एक आत्मविश्वास अंतराल का मतलब यह नहीं हो सकता है कि तकनीकी, सांख्यिकीय मुद्दों के कारण इसका क्या अर्थ प्रतीत होता है, लेकिन सामान्य रूप से अंतराल (किसी दिए गए आत्मविश्वास के स्तर पर) कम अनिश्चितता परिणाम के बारे में है। इस साइट पर कई सूत्र हैं जो इस बात पर चर्चा कर रहे हैं कि एक कॉन्फिडेंस इंटरवल का क्या मतलब है (जैसा कि कहें, एक विश्वसनीय अंतराल के विपरीत)। हम प्रेडिक्टिव इंटरव्यूज़ में भी शामिल नहीं हो रहे हैं ...
वेन

@Wayne यह कथन क्यों नहीं है " उस अंतराल के भीतर अवलोकन प्राप्त करने का एक छोटा मौका है "? चूंकि संकीर्ण अंतराल में एक बड़ी प्रकार की 1 त्रुटि है, इसलिए यह सच अशक्त परिकल्पना को अस्वीकार करने की अधिक संभावना है, अर्थात, मेरा वास्तविक शून्य मान उस अंतराल में निहित नहीं है। इसलिए, यह मुझे a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalसही लगता है । क्या आप मुझे समझाएंगे कि मैं कहाँ गलती कर रहा हूँ?
उपयोगकर्ता 31466

जवाबों:


19

95% संख्यात्मक रूप से संलग्न नहीं है कि आप कितने आश्वस्त हैं कि आपने अपने प्रयोग में सही प्रभाव को कवर किया है। शायद यह मानते हुए कि "95% कवरेज रेंज गणना का उपयोग करके अंतराल" इसके लिए अधिक सटीक नाम हो सकता है। आप यह तय करने का विकल्प बना सकते हैं कि अंतराल में सही मूल्य है; और यदि आप उस समय का लगातार 95% करते हैं तो आप सही होंगे। लेकिन आप वास्तव में यह नहीं जानते हैं कि अधिक जानकारी के बिना आपके विशेष प्रयोग के लिए यह कितनी संभावना है।

Q1: आपकी पहली क्वेरी दो चीजों को भ्रमित करती है और एक शब्द का दुरुपयोग करती है। कोई आश्चर्य नहीं कि आप भ्रमित हैं। एक संकीर्ण आत्मविश्वास अंतराल अधिक सटीक हो सकता है लेकिन, जब उसी तरीके से गणना की जाती है, जैसे कि 95% विधि, तो वे सभी एक ही सटीकता होती हैं। वे समय के समान अनुपात पर सही मूल्य पर कब्जा कर लेते हैं।

इसके अलावा, सिर्फ इसलिए कि यह संकीर्ण नहीं है इसका मतलब है कि आप उस संकीर्ण आत्मविश्वास अंतराल के भीतर आने वाले नमूने का सामना करने की संभावना कम है। एक संकीर्ण आत्मविश्वास अंतराल को तीन तरीकों में से एक प्राप्त किया जा सकता है। डेटा की प्रायोगिक विधि या प्रकृति बस बहुत कम विचरण हो सकती है। समुद्र के स्तर पर नल के पानी के क्वथनांक के आसपास का आत्मविश्वास का नमूना आकार की परवाह किए बिना बहुत छोटा है। लोगों के औसत वजन के आसपास आत्मविश्वास अंतराल बड़ा हो सकता है क्योंकि लोग बहुत परिवर्तनशील होते हैं, लेकिन व्यक्ति केवल अधिक टिप्पणियों को प्राप्त करके उस विश्वास अंतराल को छोटा बना सकता है। उस मामले में, जैसा कि आप इस बात के बारे में अधिक निश्चितता प्राप्त करते हैं कि आप कहाँ मानते हैं कि सही मूल्य है, अधिक नमूने एकत्र करके और एक संकीर्ण आत्मविश्वास अंतराल बनाकर, तब उस आत्मविश्वास अंतराल में किसी व्यक्ति के सामना होने की संभावना कम हो जाती है। (यह किसी भी मामले में नीचे चला जाता है जब आप नमूना आकार बढ़ाते हैं, लेकिन आप उबलते पानी के मामले में बड़े नमूने को इकट्ठा करने से परेशान नहीं हो सकते हैं)। अंत में, यह संकीर्ण हो सकता है क्योंकि आपका नमूना अप्रमाणिक है। उस मामले में आप वास्तव में 5% अंतरालों में से एक होने की अधिक संभावना रखते हैं जिसमें सही मूल्य नहीं होता है। यह सीआई चौड़ाई के बारे में एक विरोधाभास का एक सा है और कुछ जिसे आपको साहित्य को जानकर जांचना चाहिए कि यह डेटा आमतौर पर कितना परिवर्तनशील है। उस मामले में आप वास्तव में 5% अंतरालों में से एक होने की अधिक संभावना रखते हैं जिसमें सही मूल्य नहीं होता है। यह सीआई चौड़ाई के बारे में एक विरोधाभास का एक सा है और कुछ जिसे आपको साहित्य को जानकर जांचना चाहिए कि यह डेटा आमतौर पर कितना परिवर्तनशील है। उस मामले में आप वास्तव में 5% अंतरालों में से एक होने की अधिक संभावना रखते हैं जिसमें सही मूल्य नहीं होता है। यह सीआई चौड़ाई के बारे में एक विरोधाभास का एक सा है और कुछ जिसे आपको साहित्य को जानकर जांचना चाहिए कि यह डेटा आमतौर पर कितना परिवर्तनशील है।

इसके अलावा विचार करें कि विश्वास अंतराल जनसंख्या के वास्तविक औसत मूल्य का अनुमान लगाने की कोशिश कर रहा है। यदि आप उस स्थान को जानते थे तो आप और भी अधिक सटीक (और सटीक) होंगे और अनुमानों की एक सीमा भी नहीं होगी। लेकिन उस सटीक मान के साथ एक अवलोकन का सामना करने की आपकी संभावना किसी भी विशेष नमूना आधारित सीआई के भीतर खोजने की तुलना में बहुत कम होगी।

Q2 : एक 99% विश्वास अंतराल एक 95% से अधिक व्यापक है। इसलिए, यह अधिक संभावना है कि इसमें सही मूल्य होगा। सटीक और सटीक के बीच का अंतर देखें, आप दोनों को भ्रमित कर रहे हैं। यदि मैं कम परिवर्तनशीलता और उच्च नमूना आकार के साथ एक आत्मविश्वास अंतराल संकरा बनाता हूं तो यह अधिक सटीक हो जाता है, संभावित मान एक छोटी श्रेणी को कवर करते हैं। यदि मैं 99% गणना का उपयोग करके कवरेज बढ़ाता हूं तो यह अधिक सटीक हो जाता है, सही मूल्य सीमा के भीतर होने की अधिक संभावना है।


2
जनसंख्या में माध्य (= जो आप अनुमान लगाने की कोशिश कर रहे हैं) की परिवर्तनशीलता शून्य है।
निक सब्बे सिप

10

किसी दिए गए डेटासेट के लिए, एक आत्मविश्वास अंतराल के स्तर को बढ़ाने से केवल बड़े अंतराल (या कम से कम छोटे नहीं ) में परिणाम होगा । यह सटीकता या सटीकता के बारे में नहीं है, बल्कि इसके बारे में है कि आप वास्तविक मूल्य को याद करने के बारे में कितना जोखिम उठाने को तैयार हैं।

यदि आप कई डेटा सेट से एक ही प्रकार के पैरामीटर के लिए आत्मविश्वास अंतराल की तुलना कर रहे हैं और एक दूसरे से छोटा है, तो आप कह सकते हैं कि छोटा एक अधिक सटीक है । मैं के बारे में बात करना पसंद करते परिशुद्धता के बजाय सटीकता (देखें इस स्थिति में यह प्रासंगिक विकिपीडिया लेख )।


"एक ही प्रकार के पैरामीटर" और "कई डेटा सेट" से क्या मतलब है? कहते हैं, निरक्षरता पर एक सर्वेक्षण और सर्वेक्षण अलग समय, 1995, 1998, आदि में किया जाता है। फिर "निरक्षरता दर" एक ही प्रकार का पैरामीटर है और क्या 1995, 1998 के डेटा सेट आदि कई डेटा सेटों का संकेत देते हैं?
उपयोगकर्ता 31466

उदाहरण के लिए, विश्वास अंतराल का एक सेट, कुछ आबादी के मतलब के लिए प्रत्येक। आपका उदाहरण भी फिट बैठता है, मुझे लगता है।
कार्ल

3

सबसे पहले, किसी दिए गए विश्वास प्रतिशत (उदाहरण के लिए ९ ५%) के लिए एक सीआई, सभी व्यावहारिक उद्देश्यों (हालांकि तकनीकी रूप से यह सही नहीं है) के लिए इसका मतलब है कि आप आश्वस्त हैं कि सही मूल्य अंतराल में है।

यदि यह अंतराल "संकीर्ण" है (ध्यान दें कि यह केवल एक रिश्तेदार फैशन में माना जा सकता है, इसलिए, इस प्रकार की तुलना के लिए, यह कहें कि यह 1 इकाई चौड़ा है), इसका मतलब है कि खेलने के लिए बहुत जगह नहीं है: जो भी मान आपको लगता है कि अंतराल सही मूल्य के करीब होने वाला है (क्योंकि अंतराल संकीर्ण है), और आप उस (95%) के बारे में निश्चित हैं।

इसकी तुलना अपेक्षाकृत विस्तृत 95% CI से करें (उदाहरण से पहले मिलान करने के लिए, मान लें कि यह 100 इकाई चौड़ी है): यहाँ, आप अभी भी 95% निश्चित हैं कि सही मूल्य इस अंतराल के भीतर होगा, फिर भी यह आपको बहुत नहीं बताता है बहुत, चूंकि अंतराल में अपेक्षाकृत बहुत सारे मूल्य हैं (एक कारक 100 के बारे में 1 के विपरीत - और मैं सरलीकरण को अनदेखा करने के लिए फिर से, शुद्धतावादियों से पूछता हूं)।

आमतौर पर, आपको एक बड़े अंतराल की आवश्यकता होती है जब आप 99% निश्चित होना चाहते हैं कि सही मूल्य इसमें है, जब आपको केवल 95% निश्चित होना चाहिए (ध्यान दें: यह सच नहीं हो सकता है यदि अंतराल नेस्टेड नहीं है ), इसलिए वास्तव में, जितना अधिक आत्मविश्वास की आवश्यकता है, उतना व्यापक अंतराल आपको लेने की आवश्यकता होगी।

दूसरी ओर, यदि आप कर रहे हैं उच्च विश्वास अंतराल के साथ अधिक कुछ। इसलिए, यदि मैं आपको एक ही चौड़ाई के 2 अंतराल देता हूं, और मैं कहता हूं कि एक 95% सीआई है और दूसरा 99% सीआई है, तो मुझे उम्मीद है कि आप 99% एक को पसंद करेंगे। इस अर्थ में, 99% सीआई अधिक सटीक हैं: आपको कम संदेह है कि आपने सच्चाई को याद किया होगा।


धन्यवाद! इसलिए जब वे कहते हैं कि न्यूट्रिनो पर प्रकाश की तुलना में तेजी से होने वाले इस नए शोध में बहुत कम आत्मविश्वास अंतराल है (मुझे लगता है कि इसका मतलब संकीर्ण है) तो इसका मतलब है कि उनके सटीक होने की अधिक संभावना है, अगर यह एक व्यापक आत्मविश्वास अंतराल था? (अन्य सभी पहलुओं की अवहेलना)
upabove

10
निक, आपका पहला बयान गलत है। यह एक "तकनीकी समस्या" नहीं है, यह सिर्फ सही नहीं है। आत्मविश्वास अंतराल एक कथन है कि बार-बार किए जाने वाले प्रयोगों में क्या होगा, कि वे 95% समय के वास्तविक मूल्य को कवर करेंगे। इस विश्वास के बारे में एक कथन कि मेरा मूल्य मेरे दिए गए प्रयोग में पाई गई सीमा के भीतर है, ऐसा बिल्कुल भी नहीं है। यदि आपने "उस" उस "आत्मविश्वास" और "पैतृक संख्यात्मक राशि" को हटा दिया है, तो आप सच्चाई के करीब होंगे। आप बस यह कह सकते हैं कि इसका मतलब है कि आप मानते हैं कि अंतराल में गिरावट की संभावना है।
जॉन

अन्यथा, जवाब बहुत अच्छा है ...
जॉन

4
@ जॉन: मैंने यह कहते हुए विशेष रूप से परहेज किया कि अंतराल स्वयं यादृच्छिक चर है, हालांकि मेरा वाक्य यह नहीं कहता है कि (बेशक, यह ऐसा सुझाव देता है)। मैं इसमें शामिल मुद्दों को जानता हूं, लेकिन उन्हें सवाल के लिए अप्रासंगिक पाया गया। मैंने कभी भी एक व्यावहारिक स्थिति नहीं देखी है जहां अंतर या तो मायने रखता है, इसलिए "सभी व्यावहारिक उद्देश्यों के लिए"।
निक सबबे

4
इस मुद्दे का सामना नहीं किया? यह पी-मूल्य = अशक्तता की संभावना और फिर यह कहने की तरह है कि आपने इसके साथ कभी कोई समस्या नहीं उठाई है। यदि आप सही पत्रिकाओं में रहते हैं तो आप नहीं करेंगे। यह कहना गलत है कि आप 95% निश्चित हैं कि सही मूल्य आपकी वर्तमान सीमा में है। इसे कुछ गूढ़ बात के रूप में मानने का मतलब है कि अब हमारे पास (कम से कम) एक और व्यक्ति होगा जो यह कहते हुए घूमेगा, "मुझे विश्वास है कि 95% मूल्य इस सीमा में है।" इसे सही करने के लिए शायद ही आप अपना जवाब बदलेंगे। यदि आप उस एक बयान को बदल देते हैं तो अन्य मुद्दों को आप नजरअंदाज कर सकते हैं।
जॉन

3

मैं यहाँ कुछ अच्छे उत्तरों को जोड़ रहा हूँ, जिन्हें मैंने दिया था। मुझे लगता है कि निष्कर्ष को पूरी तरह से स्पष्ट करने के लिए कुछ और कहा जाना चाहिए। मुझे शर्तें सटीक और सही लगती हैं क्योंकि एफ्रॉन उन्हें परिभाषित करता है। मैंने हाल ही में एक अलग सवाल पर इस पर एक लंबी चर्चा की। मॉडरेट व्हॉबर को वास्तव में यह उत्तर पसंद आया। मैं यहाँ दोहराने के लिए उसी लंगोटी पर नहीं जाऊँगा। हालांकि एफ्रॉन सटीकता आत्मविश्वास स्तर और चौड़ाई की अंतराल या शुद्धता से संबंधित है। लेकिन आप पहले सटीकता पर विचार किए बिना तंगी के बारे में बात नहीं कर सकते। कुछ आत्मविश्वास अंतराल सटीक होते हैं क्योंकि वे वास्तविक कवरेज होते हैं जो वे विज्ञापन करते हैं। 95% आत्मविश्वास अंतराल भी अनुमानित हो सकता है क्योंकि यह एक एसिम्प्टोटिक वितरण का उपयोग करता है। एसिम्पोटिक्स पर आधारित अनुमानित अंतराल एक परिमित नमूने के आकार के लिए हैं न कि विज्ञापित कवरेज के लिए जा रहे हैं जो कि कवरेज है जो आपको मिलेगा यदि एसिम्प्टोटिक वितरण सटीक वितरण है। तो एक अनुमानित अंतराल अंडरकवर हो सकता है (अर्थात 95% का विज्ञापन करें जब इसका वास्तविक कवरेज केवल 91% हो) या कम लेकिन गंभीर मामले में ओवरकवर (यानी विज्ञापित कवरेज 95% है लेकिन 98% में वास्तविक है)। पूर्व के मामले में हम चिंता करते हैं कि विज्ञापित कवरेज के लिए वास्तविक कवरेज कितना करीब है)। निकटता का एक माप सटीकता का क्रम है जिसे 1 / orn या 1 / n कहा जा सकता है। यदि वास्तविक विश्वास स्तर करीब है तो हम इसे सटीक कहते हैं। सटीक बूटस्ट्रैप विश्वास अंतराल के साथ महत्वपूर्ण है जो कभी सटीक नहीं होते हैं लेकिन कुछ संस्करण दूसरों की तुलना में अधिक सटीक होते हैं।

सटीकता की यह परिभाषा भिन्न हो सकती है जिसे ओपी संदर्भित कर रहा है, लेकिन यह अब स्पष्ट होना चाहिए कि एफ्रॉन की परिभाषा क्या है और सटीक होना क्यों महत्वपूर्ण है। अब यदि आपके पास दो विधियाँ हैं जो सटीक हैं, तो हम एक के ऊपर एक पसंद कर सकते हैं यदि किसी भी विश्वास स्तर के लिए इसकी अपेक्षा कम चौड़ाई है। एक आत्मविश्वास अंतराल जो इस अर्थ में सबसे अच्छा है (जिसे कभी-कभी सबसे छोटा कहा जाता है) चुनने वाला होगा। लेकिन इसके लिए सटीकता की आवश्यकता थी। यदि विश्वास स्तर केवल अनुमानित है तो हम सेब और संतरे की तुलना कर सकते हैं। एक दूसरे की तुलना में संकीर्ण हो सकता है क्योंकि यह कम सटीक है और इसलिए इसके विज्ञापित कवरेज की तुलना में वास्तविक कवरेज कम है।

यदि दो आत्मविश्वास अंतराल बहुत सटीक हैं या एक सटीक है और दूसरा बहुत ही सटीक तुलना अपेक्षित चौड़ाई ठीक हो सकती है क्योंकि कम से कम अब हम सेब की सिर्फ दो दो किस्मों को देख रहे हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.