क्या आत्मविश्वास अंतराल उपयोगी हैं?


11

लगातार आंकड़ों में, 95% आत्मविश्वास अंतराल एक अंतराल-उत्पादक प्रक्रिया है, जो यदि बार-बार अनंत संख्या में दोहराई जाती है, तो 95% समय का सही पैरामीटर होगा। यह क्यों उपयोगी है?

आत्मविश्वास के अंतराल अक्सर गलत समझा जाता है। वे एक अंतराल नहीं हैं कि हम 95% निश्चित हो सकते हैं जब तक कि पैरामीटर (जब तक आप समान बायेसियन विश्वसनीयता अंतराल का उपयोग नहीं कर रहे हैं)। कॉन्फिडेंस इंटरवल मेरे लिए एक बैट-एंड-स्विच की तरह लगता है।

एक उपयोग मामला जिसके बारे में मैं सोच सकता हूं वह है मानों की श्रेणी प्रदान करना जिसके लिए हम अशक्त परिकल्पना को अस्वीकार नहीं कर सके कि पैरामीटर वह मान है। क्या पी-वैल्यू इस जानकारी को प्रदान नहीं करेंगे, लेकिन बेहतर है? इतना भ्रामक होने के बिना?

संक्षेप में: हमें विश्वास अंतराल की आवश्यकता क्यों है? वे कैसे हैं, जब सही ढंग से व्याख्या की जाती है, उपयोगी है?



बायेसियन विश्वसनीयता अंतराल न तो एक अंतराल है जिसे हम 95% निश्चित कर सकते हैं जैसे कि पैरामीटर में है।
सेक्स्टस एम्पिरिकस

@MartijnWeterings: जब तक आप अपने पूर्व के 100% निश्चित नहीं हैं।
शीआन

@ शीआन जो तब काम करता है जब एक पैरामीटर 100% निश्चित रूप से एक यादृच्छिक चर माना जाता है और एक प्रयोग एक संयुक्त आवृत्ति वितरण से नमूना लेने जैसा होता है , अर्थात आप Bayes नियम का उपयोग करते हैं: बिना स्पष्ट' पूर्व '। यह तय किए गए पैरामीटर के लिए समान नहीं है। तब पीछे की मान्यताओं के लिए आपको और के पुराने संयुक्त आवृत्ति वितरण को भी 'अपडेट' करना होगा । S पूर्व मान्यताओं ’को अद्यतन करने का दावा करना थोड़ा बेतुका है जो 100% सुनिश्चित थे। पी ( θ , एक्स ) पी ( θ | x ) = पी ( θ , एक्स ) / पी ( एक्स ) एक्स θθP(θ,x)P(θ|x)=P(θ,x)/P(x)Xθ
सेक्स्टस एम्पिरिकस

जवाबों:


10

इसलिए जब तक आत्मविश्वास अंतराल को यादृच्छिक के रूप में माना जाता है (यानी, डेटा को यादृच्छिक चर के एक सेट के रूप में इलाज करने के दृष्टिकोण से देखा जाता है जिसे हमने अभी तक नहीं देखा है) तो हम वास्तव में इसके बारे में उपयोगी संभावना बयान कर सकते हैं। विशेष रूप से, मान लें कि आपके पास पैरामीटर लिए स्तर पर एक आत्मविश्वास अंतराल है , और अंतराल में सीमा । तब हम कह सकते हैं कि:1αθL(x)U(x)

P(L(X)θU(X)|θ)=1αfor all θΘ.

लगातार प्रतिमान के बाहर घूमना और किसी भी पूर्व वितरण के लिए से अधिक हाशिए पर जाना इसी (कमजोर) सीमांत संभावना परिणाम देता है:θ

P(L(X)θU(X))=1α.

एक बार जब हम डेटा को ठीक करके विश्वास अंतराल की सीमा तय करते हैं , तो हम अब इस प्रायिकता कथन के लिए अपील नहीं करते हैं, क्योंकि हमने अब डेटा को ठीक कर लिया है। हालाँकि, यदि विश्वास अंतराल को एक यादृच्छिक अंतराल के रूप में माना जाता है, तो हम वास्तव में यह प्रायिकता बयान कर सकते हैं --- अर्थात, प्रायिकता के साथ पैरामीटर (यादृच्छिक) अंतराल के भीतर गिर जाएगी।X=x1αθ

लगातार आंकड़ों के भीतर, प्रायिकता वाले कथन अनंत बार दोहराए जाने वाले सापेक्ष आवृत्तियों के बारे में कथन हैं। लेकिन बार-बार होने वाले प्रतिमान में प्रत्येक संभाव्यता कथन के बारे में यह सच है , इसलिए यदि आपकी आपत्ति सापेक्ष आवृत्ति कथनों के लिए है, तो यह आपत्ति नहीं है जो आत्मविश्वास के अंतराल के लिए विशिष्ट है। यदि हम लगातार प्रतिमान के बाहर चले जाते हैं तो हम वैध रूप से कह सकते हैं कि आत्मविश्वास अंतराल में वांछित संभावना के साथ इसका लक्ष्य पैरामीटर होता है, इसलिए जब तक हम इस संभावना को मामूली रूप से बयान करते हैं (यानी, डेटा पर सशर्त नहीं) और हम इस प्रकार विश्वास अंतराल का इलाज करते हैं अपने यादृच्छिक अर्थों में।

मैं दूसरों के बारे में नहीं जानता, लेकिन यह मुझे एक बहुत शक्तिशाली संभावना परिणाम लगता है, और अंतराल के इस रूप के लिए एक उचित औचित्य है। मैं खुद बायेसियन विधियों के लिए अधिक आंशिक हूं, लेकिन संभावना अंतराल (उनके यादृच्छिक अर्थों में) का समर्थन करने वाले संभावित परिणाम शक्तिशाली परिणाम हैं जिन्हें सूँघा नहीं जाना है।


1
"लगातार प्रतिमान के बाहर जाना" क्या वास्तव में समस्या नहीं है? सामान्य तौर पर हम एक अंतराल चाहते हैं जिसमें कुछ संभावना के साथ ब्याज के पैरामीटर का सही मूल्य होता है। कोई भी लगातार विश्लेषण हमें यह नहीं दे सकता है, और एक बायेसियन विश्लेषण के रूप में इसे फिर से व्याख्या करने से गलतफहमी पैदा होती है। एक बायेसियन विश्वसनीय अंतराल के माध्यम से सीधे सवाल का जवाब देने के लिए बेहतर है। आत्मविश्वास के अंतराल के लिए उपयोग किए जाते हैं जहां आप बार-बार "प्रयोग" कर रहे हैं, जैसे गुणवत्ता नियंत्रण।
डिक्रान मार्सुपियल

यह बेइज़ियन के रूप में स्पष्ट रूप से पुनर्व्याख्या करने का मामला नहीं है (उत्तरार्द्ध प्राप्त करने के लिए डेटा पर बाद की स्थिति)। जवाब केवल ओपी दिखा रहा है कि हम विश्वास अंतराल के बारे में उपयोगी संभावना बयान कर सकते हैं। लगातार प्रतिमान के लिए अधिक सामान्य आपत्तियों के रूप में, वे अच्छी तरह से और अच्छे हैं, लेकिन वे आत्मविश्वास के अंतराल के लिए विशिष्ट आपत्तियां नहीं हैं।
बेन -

1
जैसा कि आप उपरोक्त संभाव्यता कथनों से देख सकते हैं, हम गारंटी दे सकते हैं कि सीआई में कुछ प्रायिकता के साथ पैरामीटर शामिल है, इसलिए जब तक हम इसे प्राथमिकता के रूप में देखते हैं
बेन -

1
यदि आप लगातार प्रतिमान से बाहर चले गए हैं, लेकिन एक बायेसियन ढांचे में नहीं जा रहे हैं, तो यह क्या रूपरेखा है? मैं बार-बार होने वाली आपत्ति को व्यक्त नहीं कर रहा था, मेरा मानना ​​है कि आपको उस फ्रेमवर्क का उपयोग करना चाहिए जो उस सवाल का सबसे सीधे जवाब देता है जिसे आप वास्तव में करना चाहते हैं। आत्मविश्वास और विश्वसनीय अंतराल विभिन्न सवालों के जवाब देते हैं।
डिक्रान मार्सुपियल

1
@ डिक्रान: संभाव्यता कथन लिखित है, और एक शुद्ध गणितीय कथन है। मैं वास्तव में नहीं देखता कि आप इस पर आपत्ति कैसे कर सकते हैं।
बेन -

5

मैं उपरोक्त @ से सहमत हूं, और मैंने सोचा कि मैं एक सरल उदाहरण प्रदान करूंगा जहां एक बायिसियन बनाम एक फ्रीक्वेंटिस्ट अंतराल एक ही परिस्थिति में मूल्य का होगा।

समानांतर विधानसभा लाइनों के साथ एक कारखाने की कल्पना करें। एक पंक्ति को रोकना महंगा है, और एक ही समय में, वे गुणवत्ता वाले उत्पादों का उत्पादन करना चाहते हैं। वे समय के साथ झूठी सकारात्मक और झूठी नकारात्मक दोनों के बारे में चिंतित हैं। कारखाने के लिए, यह एक औसत प्रक्रिया है: झूठी सकारात्मक चीजों के खिलाफ शक्ति और गारंटीकृत सुरक्षा दोनों। आत्मविश्वास अंतराल, साथ ही सहिष्णुता अंतराल, कारखाने के लिए मायने रखता है। फिर भी, मशीनें संरेखण से बाहर चली जाएंगी, जो कि , और डिटेक्शन गियर स्प्यूरियस घटनाओं का अवलोकन करेगा। औसत परिणाम मायने रखता है जबकि विशिष्ट परिणाम एक परिचालन विस्तार है।θΘ

इसके विपरीत तरफ एक एकल ग्राहक एक एकल उत्पाद या बहुत सारे उत्पाद खरीद रहा है। वे असेंबली लाइन के पुनरावृत्ति गुणों की परवाह नहीं करते हैं। वे उस एक उत्पाद की परवाह करते हैं जो उन्होंने खरीदा था। हमें कल्पना कीजिए कि ग्राहक नासा है और उन्हें एक विनिर्देश को पूरा करने के लिए उत्पाद की आवश्यकता है, वे उन हिस्सों की गुणवत्ता के बारे में परवाह नहीं करते हैं जिन्हें उन्होंने नहीं खरीदा था। उन्हें किसी न किसी रूप में बायेसियन अंतराल की आवश्यकता है। इसके अलावा, एक भी विफलता कई अंतरिक्ष यात्रियों और अरबों डॉलर की लागत को मार सकती है। उन्हें यह जानने की जरूरत है कि खरीदा गया हर एक हिस्सा विनिर्देशों से मिलता है। एवरेजिंग जानलेवा होगी। सैटर्न वी रॉकेट के लिए, एक प्रतिशत दोष दर ने अपोलो उड़ानों के दौरान 10,000 दोषपूर्ण भागों को निहित किया होगा। उन्हें सभी मिशनों पर 0% दोषों की आवश्यकता थी।γΓ.

जब आप एक कारखाने के रूप में नमूना अंतरिक्ष में काम कर रहे हैं तो आप एक आत्मविश्वास अंतराल होने के बारे में चिंता करते हैं। यह नमूना स्थान बना रहा है। जब आप पैरामीटर स्पेस में काम कर रहे होते हैं, तो एक ग्राहक के रूप में आप विश्वसनीय अंतराल की चिंता करते हैं। अगर आपको अपने बाहर की टिप्पणियों की परवाह नहीं है, तो आप बायेसियन हैं। यदि आप उन नमूनों के बारे में ध्यान रखते हैं जो देखे नहीं गए थे, लेकिन देखे जा सकते थे, तो आप फ़्रीक्वेंटिस्ट हैं।

क्या आप लंबे समय से औसत या विशिष्ट घटना से संबंधित हैं?


क्या नासा वास्तव में बायेसियन अंतराल के आधार पर भागों की खरीद करता है? मैं आपकी बात समझता हूं, लेकिन क्या वे वास्तव में ऐसा करते हैं?
अक्कल ५

@ अक्षल मैं नहीं जानता। जरन ने बेशक, नासा में गुणवत्ता आश्वासन पर एक अद्भुत काम लिखा था, लेकिन मुझे यह बिल्कुल याद नहीं है कि परीक्षण प्रक्रिया पर चर्चा की गई थी क्योंकि मुझे इसे पढ़े एक दशक से अधिक हो गया है। मुझे पता है कि डब्ल्यू एडवर्ड्स डिमिंग विश्वसनीय अंतराल के पक्ष में आत्मविश्वास के अंतराल का विरोध कर रहे थे, लेकिन फिर से, यह सीधे संबंधित नहीं है। मेरा अनुमान है, और मैं ऐसे लोगों को जानता हूं जो जानते होंगे लेकिन फिलहाल यह पूछना असुविधाजनक है कि क्या वे फ़्रीक्वेंटिस्ट विधियों का उपयोग करते हैं क्योंकि यही वह है जिसमें अधिकांश लोग प्रशिक्षित होते हैं। आप उस हथौड़ा का उपयोग करते हैं जो आपके पास है।
डेव हैरिस

क्या यह "हथौड़ा" का मामला है? हो सकता है कि इसका इंजीनियरिंग में चीजों के साथ कुछ लेना-देना हो?
अक्कल

@ अक्षल मैं उस पर ओपन करने के योग्य नहीं हूं।
डेव हैरिस

कहते हैं कि एक कंपनी बनाता है भागों, एक साथ α स्तर समग्र परिकल्पना परीक्षण एच 0 : γ > Γ आप उन्हें गलतियों के लिए परीक्षण किया है: एक्स उनमें से गलतियों और बिना पारित y उनमें से असफल। आप नासा को एक उचित गारंटी दे सकते हैं। उत्पादों की अधिकतम मात्रा जो गलती से परीक्षण पास कर सकती है (गलत तरीके से बिना त्रुटि के माना जाता है) n α है । यह जानते हुए कि आपने एक्स आइटम बेचा है आप एक अधिकतम संभावना की गणना कर सकते हैं कि एक बेचा गया हिस्सा वास्तव में वैकल्पिक परिकल्पना अनुसार नहीं है । nαH0:γ>ΓxynαxγΓ
सेक्सटस एम्पिरिकस

4

ध्यान दें कि द्वारा सख्त विश्वास अंतराल की परिभाषा यह है संभव है कि वे पूरी तरह से व्यर्थ हैं, यानी, ब्याज की पैरामीटर के बारे में जानकारीपूर्ण नहीं। हालांकि, व्यवहार में, वे आम तौर पर बहुत सार्थक होते हैं।

[0,1]UminUmaxUmin,UmaxUmin<Umax[0.01,0.011]pp

दूसरी ओर, अधिकांश आत्मविश्वास अंतराल एक अधिक उपयोगी फैशन में निर्मित होते हैं। उदाहरण के लिए, अगर मैंने आपसे कहा कि यह एक वाल्ड इंटरवल प्रक्रिया का उपयोग करके बनाया गया है, तो हम जानते हैं कि

p^ ˙ N(p,se)

sep^p


2

आत्मविश्वास अंतराल न केवल उपयोगी है, बल्कि कुछ क्षेत्र में आवश्यक है, जैसे भौतिकी। दुर्भाग्य से, CI के बारे में सबसे अधिक शोर Bayesians से आया है जो फ़्रीक्वैंसर्स के साथ नकली बहस में पकड़े गए, आमतौर पर सामाजिक "विज्ञान" और अन्य विज्ञान जैसे विषयों के संदर्भ में।

मान लीजिए कि मैं भौतिकी में एक मात्रा को मापता हूं, जैसे कि बिजली का प्रभार। मैं हमेशा मूल्य की अनिश्चितता के माप के साथ इसकी आपूर्ति करूंगा, जो आमतौर पर एक मानक विचलन है। चूंकि, भौतिकी त्रुटियों में अक्सर गॉसियन होते हैं, यह सीधे सीआई में अनुवादित होता है। हालाँकि, जब त्रुटियां गॉसियन नहीं होती हैं, तो यह थोड़ा जटिल हो जाता है, कुछ अभिन्न लोगों को मूल्यांकन करने की आवश्यकता होती है आदि कुछ भी नहीं है, हालांकि आमतौर पर गूढ़।

यहाँ कण भौतिकी में CI पर एक संक्षिप्त प्रस्तुति है, और परिभाषा:

समय के अंश के बारे में मात्रात्मक बयान कि इस तरह के अंतराल में बड़ी संख्या में दोहराया प्रयोगों में पैरामीटर का सही मूल्य होगा

ध्यान दें, कि भौतिकी में "दोहराया प्रयोगों" का अक्सर शाब्दिक अर्थ होता है: यह माना जाता है कि आप वास्तव में कागज में प्रयोगों को दोहरा सकते हैं, और वास्तव में उस अंश का निरीक्षण करेंगे। तो, CI का आपके लिए लगभग शाब्दिक अर्थ है, और माप की अनिश्चितता के बारे में जानकारी व्यक्त करने का एक तरीका है। यह एक विचार प्रयोग नहीं है, एक व्यक्तिपरक राय नहीं है, न कि आपकी या मेरी भावनाओं के बारे में संभावनाएं आदि। यह वह है जो आप प्रयोगों से तैयार करने में सक्षम थे, और जो मुझे आपके प्रयोग को पुन: पेश करते समय देखने में सक्षम होना चाहिए।


1

यह धागा फ़्रिक्वेंटिस्ट बनाम बेयसियन बहस में जल्दी से विकसित हो गया है, और यह आसानी से हल करने योग्य नहीं है। दोनों दृष्टिकोणों में गणित ठोस है, इसलिए यह हमेशा दार्शनिक प्राथमिकताओं के लिए नीचे आता है। घटना की सापेक्ष आवृत्ति की सीमा के रूप में प्रायिकता की लगातार व्याख्या बड़ी संख्या के मजबूत कानून द्वारा उचित है; संभावना की आपकी पसंदीदा व्याख्या की परवाह किए बिना, एक घटना की सापेक्ष आवृत्ति संभावना 1 के साथ इसकी संभावना में परिवर्तित हो जाएगी।

बारिसियन विश्वसनीय अंतरालों की तुलना में बार-बार विश्वास अंतराल वास्तव में पेचीदा होते हैं। एक अज्ञात मात्रा को एक यादृच्छिक चर के रूप में मानकर, बायेसियन दावा कर सकते हैं कि एक अंतराल में कुछ संभाव्यता के साथ वह मात्रा होती है। फ़्रीक्वेंटर्स कुछ मात्राओं को यादृच्छिक चर के रूप में मानने से इनकार करते हैं, और केवल स्थिरांक युक्त कोई भी समीकरण केवल सही या गलत हो सकते हैं। इसलिए जब एक अज्ञात स्थिरांक का अनुमान लगाया जाता है, तो फ्रीक्वोलॉजिस्टों को प्रायः प्रायिकता शामिल करने के लिए उन्हें रैंडम अंतराल के साथ बाध्य करना चाहिए। कुछ अंतराल के साथ यादृच्छिक चर वाले एक अंतराल के बजाय, एक निरंतर पद्धति कई अलग-अलग संभव अंतराल उत्पन्न करती है, जिनमें से कुछ में अज्ञात निरंतरता होती है। यदि कवरेज संभावना बहुत अधिक है, तो यह विश्वास की एक उचित छलांग है कि यह सुनिश्चित करने के लिए कि किसी विशेष अंतराल में अज्ञात स्थिर (नोट है, नहीं)

एक बेइज़ियन विश्वास की ऐसी छलांग लगाता है जितना कि एक फ़्रिक्वेंटिस्ट किसी अनजान मात्रा को रैंडम वैरिएबल मानने में। वास्तव में निरंतर नेमन निर्माण पद्धति ने विश्वास की ऐसी छलांग के साथ एक शर्मनाक मुद्दा उजागर किया। सक्रिय रूप से इसे रोकने के बिना (एक दृष्टिकोण के लिए फेल्डमैन और चचेरे भाई, 1997), दुर्लभ परिणाम वितरण पैरामीटर के लिए ईएमपीटीआई विश्वास अंतराल उत्पन्न कर सकते हैं। विश्वास की ऐसी छलांग बहुत अनुचित होगी! मैंने कुछ बायेसियों को अक्सर उदाहरणवादी तरीकों का मजाक उड़ाने के लिए देखा है, जबकि फ़्रीक्वेटर्स आमतौर पर "अच्छी तरह से जवाब देते हैं कि मैं अभी भी ज्यादातर समय एक सही अंतराल प्राप्त करता हूं, और गलत धारणाएं बनाए बिना।" मैं बताता हूं कि बायेसियन / अक्सरवादी आवेग सबसे महत्वपूर्ण नहीं है जो अपने तरीकों को लागू करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.