क्या संभावनाओं पर त्रुटि सलाखों का कोई अर्थ है?


25

लोग अक्सर कहते हैं कि किसी घटना के 50-60% होने की संभावना है। कभी-कभी मैं यहां तक ​​कि लोगों को प्रायिकता असाइनमेंट पर स्पष्ट त्रुटि बार देता देखूंगा। क्या इन कथनों का कोई अर्थ है या क्या वे किसी समस्या के लिए विशिष्ट संख्या का चयन करने में असहजता का भाषाई उत्कर्ष मात्र हैं जो स्वाभाविक रूप से अनजाना है?


1
कम्प्यूटेशनल लर्निंग थ्योरी में संभवतः लगभग सही ढांचा नहीं है, जो आमतौर पर एक क्लासिफायर की त्रुटि दर पर एक बाउंड देता है जो प्रायिकता ? यदि यह एक अर्थहीन अवधारणा थी, तो मुझे संदेह है कि वे (अत्यंत चतुर) CoLT लोग इसे स्पॉट करने में विफल रहे होंगे! 1-δ
डिक्रान मार्सुपियल

5
@DikranMarsupial पीएसी सीखने में त्रुटियां स्वयं संभावनाओं पर नहीं हैं (जो कि यह प्रश्न पूछता है), लेकिन डेटा पर। यही है, हम एक एल्गोरिथ्म के आउटपुट को संभवतः लगभग सही कहते हैं यदि हम यह साबित कर सकते हैं कि की एक संभावना के साथ , उत्तर सही मूल्य के की दूरी के भीतर है । 1-δε
छिपकली

@Discretelizard लेकिन वर्गीकरण सेटिंग में, क्या वह त्रुटि दर (जो त्रुटि की संभावना है) पर बाध्य नहीं है? लंबे समय के बाद मैंने CoLT को देखा!
डिक्रान मार्सुपियल

1
@DikranMarsupial पीएसी-सीखने के लिए सामान्य सेटिंग में, 'अनुमानित' भाग त्रुटि की 'परिमाण' को मापता है, न कि 'संभावना' को। पीएसी सीमा के लिए एक प्रेरणा उदाहरण के जोखिम की तुलना में अधिक बारीक विश्लेषण प्राप्त करना है। मुझे नहीं लगता कि वर्गीकरण सेटिंग में यह बदलाव, हालांकि पीएसी को समझ में आने के लिए, कक्षाओं के बीच परिभाषित एक 'दूरी' (या हानि समारोह) होना चाहिए। (बाइनरी वर्गीकरण के अधिक विशेष मामले में, त्रुटि करने का केवल एक ही तरीका है, इसलिए अनुमानित हिस्सा उस मामले में कोई मतलब नहीं रखता है)
छिपकली छिपकली

जवाबों:


36

अगर आप ज्ञात संभावनाओं के बारे में बात कर रहे हैं तो इसका कोई मतलब नहीं होगा , उदाहरण के लिए निष्पक्ष सिक्के के साथ सिर फेंकने की संभावना 0.5 है। हालाँकि, जब तक आप पाठ्यपुस्तक के उदाहरण के बारे में बात नहीं कर रहे हैं, तब तक सटीक संभावना कभी नहीं जानी जाती है, हम केवल इसे लगभग जानते हैं।

जब आप डेटा से संभावनाओं का अनुमान लगाते हैं तो अलग कहानी होती है , उदाहरण के लिए, आपने अपने द्वारा खरीदे गए 12563 टिकटों में से 13 विजयी टिकटों का अवलोकन किया, इसलिए इस डेटा से आप 13/12563 होने की संभावना का अनुमान लगाते हैं। यह वह चीज है जिसका आप नमूने से अनुमान लगाते हैं, इसलिए यह अनिश्चित है, क्योंकि अलग-अलग नमूने से आप अलग-अलग मूल्य देख सकते हैं। अनिश्चितता का अनुमान संभावना के बारे में नहीं है, बल्कि इसके अनुमान के आसपास है।

एक और उदाहरण तब होगा जब संभावना तय नहीं हो, लेकिन अन्य कारकों पर निर्भर करता है। कहें कि हम कार दुर्घटना में मरने की संभावना के बारे में बात कर रहे हैं। हम "वैश्विक" संभावना पर विचार कर सकते हैं, एकल मूल्य जो सभी कारकों पर हाशिए पर है जो प्रत्यक्ष और अप्रत्यक्ष रूप से कार दुर्घटनाओं को जन्म देते हैं। दूसरी ओर, आप विचार कर सकते हैं कि जोखिम कारकों को देखते हुए आबादी के बीच संभावनाएं कैसे भिन्न होती हैं।

आप कई और उदाहरण पा सकते हैं, जहां संभाव्यताएं खुद को यादृच्छिक चर के रूप में माना जाता है , इसलिए वे फिर तय होने के बजाय बदलती हैं।


1
यदि एक संभावना अनुमान की गणना कुछ के माध्यम से की गई थी, जैसे कि लॉजिस्टिक रिग्रेशन यह मान लेना भी स्वाभाविक नहीं होगा कि ये "त्रुटि बार" भविष्यवाणी अंतराल का संदर्भ देते हैं? (मैं ज्यादातर आपके द्वारा
उठाए

1
@ us @r11852 आत्मविश्वास अंतराल, भविष्यवाणी अंतराल, उच्चतम घनत्व क्षेत्रों आदि, वास्तविक मामले पर निर्भर करता है। मैंने उत्तर को बहुत व्यापक बना दिया, क्योंकि हमारे पास कई परिदृश्यों में "बदलती" संभावनाएं हैं और वे अलग-अलग तरीकों से भिन्न हैं। इसके अलावा, आप उन्हें अलग-अलग परिदृश्यों में अलग-अलग तरीके से व्याख्या कर सकते हैं।
टिम

1
यहां तक ​​कि "ज्ञात" संभावनाएं बहुत छोटी त्रुटि सलाखों के लिए शॉर्टहैंड हो सकती हैं। संभवतः यह दिखा सकता है कि एक सिक्का फ्लिप शायद 50.00001% है - 49.99999% पर्याप्त परीक्षणों के साथ छोटे पर्याप्त त्रुटि सलाखों को प्राप्त करने के लिए जो 50.00000% को बाहर करता है। कोई भी भौतिक नियम नहीं है जो यह सुझाव देता है कि विषम सिक्के के लिए भी बाधाओं को ठीक होना चाहिए, लेकिन किसी की देखभाल के लिए त्रुटि पट्टियां बहुत छोटी हैं।
परमाणु वांग

5
@ न्यूक्लियरंग का हिसाब "निष्पक्ष सिक्का" वाक्यांश के ओपी उपयोग से है। परिभाषा के अनुसार, निष्पक्ष सिक्के के लिए P (HEADS) 0.5 है। एक उचित सिक्का एक गणितीय निर्माण है। मैं इस बिंदु पर जोर देने के लिए "भौतिक विज्ञान के नियमों के अनुसार" "के साथ" द्वारा एक संपादन की जगह का सुझाव दूंगा।
डी नोवो

2
@DeNovo ही शारीरिक सिक्के पर लागू होता है stat.columbia.edu/~gelman/research/published/diceRev2.pdf , लेकिन हाँ मैं 'निष्पक्ष' कहा इस चर्चा शुरू करने के लिए नहीं
टिम

23

Xkcd का सबसे प्रासंगिक चित्रण :

यहाँ छवि विवरण दर्ज करें

संबंधित शीर्षक के साथ:

... 1.68 (95% CI: 1.56 (95% CI: 1.52) (95% CI: 1.504 (95% CI: 1.494) (95% CI: 1.488 (95% CI: 1.485) (95% CI: 1.482) का प्रभाव आकार (95% CI: 1.481 (95% CI: 1.4799 (95% CI: 1.4791) (95% CI: 47,479 ...)


क्या इसका मतलब यह है कि संभावनाओं पर त्रुटि बार निरर्थक हैं?
BalinKingOfMoria

12
मजाक के अलावा, इसका मतलब है कि त्रुटि सलाखों की सटीकता अनिश्चित है और यह अनिश्चितता का मूल्यांकन खुद को अनिश्चित है, एक अनन्तता में।
शीआन

7
यही कारण है कि मैं आंकड़े में त्रुटियों का आकलन करने की मूलभूत कठिनाई (और सुंदर चुनौती) से प्रासंगिक और गहराई से जुड़ा हुआ चित्रण करता हूं।
शीआन

14
यह आंकड़ा मेटा-अनिश्चितता को दर्शाता है , जो एक संभावना पर अनिश्चितता से संबंधित हो सकता है क्योंकि अनिश्चितता खुद एक संभावना वितरण की चौड़ाई का एक उपाय है, लेकिन आपका पोस्ट किसी भी तरह से यह व्याख्या नहीं करता है; वास्तव में XKCD कॉमिक से यह पता चलता है कि त्रुटि प्रसार (जो कि गलत है) के साथ कुछ करना है, जो प्रश्न नहीं करता है।
गेरिट

6

मुझे दो व्याख्याओं का पता है। पहले टिम द्वारा कहा गया था: हमने वाई परीक्षणों से एक्स सफलताओं का अवलोकन किया है , इसलिए यदि हम मानते हैं कि परीक्षण IID थे तो हम कुछ त्रुटि सलाखों के साथ X / Y पर प्रक्रिया की संभावना का अनुमान लगा सकते हैं , उदाहरण के लिए क्रम 1 / TimYएक्स/Y1/Y

दूसरी में "उच्च-क्रम की संभावनाएं" या एक जनरेटिंग प्रक्रिया के बारे में अनिश्चितताएं शामिल हैं। उदाहरण के लिए, मान लें कि मेरे हाथ में एक सिक्का है जो एक अनुगूंज जुआरी द्वारा निर्मित है, जिसने 0.5 प्रायिकता के साथ 60% -हेड्स का सिक्का बनाया है, और 0.5 प्रायिकता के साथ 40% -हेड्स का सिक्का बनाया है। मेरा सबसे अच्छा अनुमान 50% मौका है कि सिक्का सिर पर आता है, लेकिन बड़ी त्रुटि सलाखों के साथ: "सच्चा" मौका या तो 40% या 60% है।

दूसरे शब्दों में, आप एक अरब बार प्रयोग चलाने और एक्स/Y (वास्तव में सीमित अंश) की सफलताओं का अंश लेने की कल्पना कर सकते हैं । यह समझ में आता है, कम से कम एक बायेसियन परिप्रेक्ष्य से, उदाहरण के लिए उस संख्या के चारों ओर एक 95% विश्वास अंतराल देने के लिए। उपरोक्त उदाहरण में, वर्तमान ज्ञान को देखते हुए, यह [0.4,0.6] । असली सिक्के के लिए, शायद यह [0.47,0.53] या कुछ और है। अधिक के लिए, देखें:

क्या हमें उच्च-क्रम की संभावनाओं की आवश्यकता है और, यदि हां, तो उनका क्या मतलब है? यहूदिया पर्ल। UAI 1987. https://arxiv.org/abs/1304.2716


4

सभी माप अनिश्चित हैं।

इसलिए, संभाव्यता का कोई भी माप अनिश्चित है।

प्रायिकता के माप पर यह अनिश्चितता अनिश्चित रूप से एक अनिश्चितता पट्टी के साथ दर्शायी जा सकती है। ध्यान दें कि अनिश्चितता सलाखों को अक्सर त्रुटि सलाखों के रूप में संदर्भित किया जाता है। यह गलत या कम से कम भ्रामक है, क्योंकि यह अनिश्चितता दिखाता है और त्रुटि नहीं (त्रुटि माप और अज्ञात सत्य के बीच का अंतर है, इसलिए त्रुटि अज्ञात है; अनिश्चितता घनत्व घनत्व की चौड़ाई का एक उपाय है जो लेने के बाद होता है; माप)।

एक संबंधित विषय मेटा-अनिश्चितता है । अनिश्चितता एक पश्चवर्ती संभाव्यता वितरण समारोह की चौड़ाई का वर्णन करती है, और एक प्रकार की अनिश्चितता (बार-बार माप द्वारा अनुमानित अनिश्चितता) के मामले में, अनिश्चितता पर एक अनिश्चितता अपरिहार्य है; मेट्रोलॉजिस्ट ने मुझे बताया है कि मेट्रोलॉजिकल प्रैक्टिस इस मामले में अनिश्चितता का विस्तार करने का आदेश देती है (IIRC, यदि अनिश्चितता का अनुमान एन के बार-बार माप के मानक विचलन से होता है, तो किसी को एन द्वारा परिणामी मानक विचलन को गुणा करना चाहिएएनएन-2 ), जो अनिवार्य रूप से मेटा-अनिश्चितता है।


3

प्रायिकता पर त्रुटि बार कैसे उत्पन्न हो सकता है? मान लीजिए हम कर सकते हैं असाइन prob(A|Θ=θ,I) । अगर I तात्पर्य Θ=θ0 , फिर prob(Θ=θ|I)=δθθ0 और

prob(A|I)=θprob(A|Θ=θ,I)δθθ0=prob(A|Θ=θ0,I)

अब अगर Θ से निष्कर्ष निकाला नहीं जा सकता मैं , तो यह लगता है कि में अनिश्चितता अच्छा लगता है पीआर(Θ=θ|मैं) अनिश्चितता करने के लिए ले जाना चाहिए पीआर(|मैं) । लेकिन यह नहीं है। यह केवल के लिए एक संयुक्त संभाव्यता का तात्पर्य और Θ=θ , जो जब Θ हाशिए पर है, के लिए एक निश्चित संभावना देता है :

पीआर(,Θ=θ|मैं)=पीआर(|Θ=θ,मैं)पीआर(Θ=θ|मैं)पीआर(|मैं)=Σθपीआर(|Θ=θ,मैं)पीआर(Θ=θ|मैं)

इस प्रकार, त्रुटि सलाखों को एक संभावना में जोड़ना उपद्रव मापदंडों में अनिश्चितता को जोड़ने के लिए समान है, जो संभावना को संशोधित कर सकता है, लेकिन इसे अनिश्चित नहीं बना सकता है।


1

बहुत बार ऐसे अवसर आते हैं जहाँ आप एक संभावना की संभावना चाहते हैं। उदाहरण के लिए कहें कि आपने खाद्य सुरक्षा में काम किया था और भोजन की तैयारी के चरणों (यानी खाना पकाने) और ऊष्मायन समय / तापमान (cf) के एक समारोह के रूप में बोटुलिनम बीजाणु अंकुरित (और इस तरह घातक विष का उत्पादन) की संभावना का अनुमान लगाने के लिए एक उत्तरजीविता विश्लेषण मॉडल का उपयोग किया। कागज़)। खाद्य उत्पादक तब उस मॉडल का उपयोग सुरक्षित "उपयोग-द्वारा" तिथियों को निर्धारित करने के लिए कर सकते हैं, ताकि उपभोक्ता को बोटुलिज़्म का जोखिम उचित रूप से छोटा हो। हालांकि, मॉडल एक परिमित प्रशिक्षण नमूने के लिए उपयुक्त है, इसलिए उपयोग की तारीख चुनने के बजाय जिसके अंकुरण की संभावना कम है, 0.001 का कहना है, आप पहले की तारीख चुन सकते हैं जिसके लिए (मॉडलिंग मान्यताओं को देखते हुए) आप 95% यकीन कर सकते हैं कि अंकुरण की संभावना 0.001 से कम है। यह एक बायसियन सेटिंग में करने के लिए एक काफी स्वाभाविक बात लगती है।


0

tl; dr - किसी विशेष अनुमानक से किसी भी एक अनुमान को घटाकर एक ही संभावना तक कम किया जा सकता है। हालाँकि, यह सिर्फ तुच्छ मामला है; जब भी कुछ प्रासंगिक प्रासंगिकता होती है, तो संभावना संरचनाएं समझ में आती हैं।


हेड्स पर एक यादृच्छिक सिक्के के उतरने की संभावना 50% है।

कोई फर्क नहीं पड़ता कि यह एक उचित सिक्का है या नहीं; कम से कम मुझे तो नहीं। क्योंकि सिक्का में पूर्वाग्रह हो सकता है कि एक जानकार पर्यवेक्षक अधिक सूचित पूर्वानुमान बनाने के लिए उपयोग कर सकता है, मुझे 50% बाधाओं का अनुमान लगाना होगा।

प्रमुखोंपूंछ50%50%
पहले फ्लिपदूसराफ्लिपप्रमुखोंपूंछप्रमुखों25%25%पूंछ25%25%,
उसी तरफ़दो बारप्रमुखोंऔर पूंछता है50%50%

पीप्रमुखों,

प्रमुखोंपूंछपीप्रमुखों1-पीप्रमुखों
पहले फ्लिपदूसराफ्लिपप्रमुखोंपूंछप्रमुखोंपीप्रमुखों2पीप्रमुखों(1-पीप्रमुखों)पूंछपीप्रमुखों(1-पीप्रमुखों)(1-पीप्रमुखों)2,
उसी तरफ़दो बारप्रमुखोंऔर पूंछता है1-2पीप्रमुखों(1-पीप्रमुखों)2पीप्रमुखों(1-पीप्रमुखों)
पीप्रमुखों,50%,

तो यह एक ही बात है, है ना?

यह बताता है कि टू-हेड्स-ऑर-टेल्स प्राप्त करने की संभावना हमेशा पूरी तरह से उचित सिक्के के विशेष मामले को छोड़कर, एक-एक प्राप्त करने से अधिक होती है। इसलिए यदि आप तालिका को कम करते हैं, तो यह मानते हुए कि संभावना स्वयं अनिश्चितता को पकड़ लेती है, विस्तारित होने पर आपकी भविष्यवाणियां बेतुकी होंगी।

पीप्रमुखों

''50%",''शायद के बारे में 50%"

और मैं जो कहना चाहूंगा वह मोटे तौर पर है:

50%


लोग अक्सर कहते हैं कि किसी घटना के 50-60% होने की संभावना है।

यदि आप उनके साथ बैठते हैं और उनके सभी डेटा, मॉडल आदि के बारे में काम करते हैं, तो आप एक बेहतर संख्या उत्पन्न करने में सक्षम हो सकते हैं, या, आदर्श रूप से, एक बेहतर मॉडल जो उनकी भविष्य कहनेवाला क्षमता को और अधिक मजबूती से पकड़ सकेगा।

पीप्रमुखों=50%


0

मैं तर्क दूंगा कि केवल एरर बार ही मायने रखता है, लेकिन दिए गए उदाहरण में, पूरी बात शायद लगभग व्यर्थ है।
उदाहरण एक व्याख्या अंतराल के रूप में खुद को व्याख्यात्मकता के लिए उधार देता है, जिसमें कुछ हद तक निश्चितता के ऊपरी और निचले सीमा संभावना की सीमा होती है। यह प्रस्तावित उत्तर उस व्याख्या से निपटेगा। प्रमुख स्रोत - https://www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U


उदाहरण कहता है कि एक निश्चित स्तर के विश्वास के लिए, उत्तर 60% से ऊपर होने की संभावना नहीं है और 50% से कम होने की संभावना नहीं है। यह संख्याओं का इतना सुविधाजनक है कि यह "बिनिंग" जैसा दिखता है, जिसमें 55% का एक स्वैग आगे +/- 5% की सीमा तक स्वाहा हो जाता है। परिचित दौर की संख्या तुरंत संदिग्ध हैं।
एक विश्वास अंतराल पर पहुंचने का एक तरीका आत्मविश्वास के एक चुने हुए स्तर पर निर्णय लेना है - चलो 90% कहते हैं - और हम अनुमति देते हैं कि बात हमारे अनुमान से कम या अधिक हो सकती है, लेकिन यह केवल 10% मौका है "सही" उत्तर हमारे अंतराल के बाहर है। तो हम एक उच्च सीमा का अनुमान लगाते हैं जैसे कि "इस ऊपरी सीमा से अधिक होने पर उचित उत्तर का केवल 1/20 मौका है" और निम्न सीमा के लिए भी ऐसा ही करें। यह "कैलिब्रेटेड आकलन" के माध्यम से किया जा सकता है, जो माप का एक रूप है, या माप के अन्य रूपों के बावजूद।
भले ही, बिंदु ए) शुरुआत से मानता है कि हमारी अनिश्चितता से जुड़ी एक अनिश्चितता है, और बी) इस चीज़ पर हमारे हाथ फेंकने से बचें, इसे गड़बड़ कहते हैं, और बस ऊपर और नीचे 5% से निपटने। लाभ यह है कि एक चुने हुए डिग्री के लिए कठोर दृष्टिकोण से ऐसे परिणाम मिल सकते हैं जो अभी भी गणितीय रूप से प्रासंगिक हैं, एक हद तक जिसे गणितीय रूप से कहा जा सकता है: "90% संभावना है कि सही उत्तर इन दो सीमाओं के बीच है ..." यह एक उचित रूप से गठित आत्मविश्वास अंतराल (CI) है, इसे आगे की गणना में इस्तेमाल किया जा सकता है।
क्या अधिक है, इसे एक विश्वास को आत्मसात करके, हम अनुमानों बनाम परिणामों की तुलना करके और अनुमान लगाने की विधि में सुधार करने के लिए जो कुछ भी करते हैं उस पर कार्य करके हम अनुमान पर पहुंचने के लिए उपयोग की गई विधि को जांच सकते हैं। कुछ भी सही नहीं बनाया जा सकता है, लेकिन कई चीजों को 90% प्रभावी बनाया जा सकता है।
ध्यान दें कि 90% CI का इस तथ्य से कोई लेना-देना नहीं है कि ओपी में दिए गए उदाहरण में 10% क्षेत्र है और 90% भाग है। एक बोइंग 747-100
के पंख को 90% सीआई के लिए क्या कहा जाता है? खैर, मुझे 95% यकीन है कि यह 300 फीट से अधिक नहीं है, और मुझे भी उतना ही यकीन है कि यह 200 फीट से कम नहीं है। इसलिए मेरे सिर के ऊपर से, मैं आपको 200% का 90% सीआई दूंगा। -235 फीट।
ध्यान दें कि कोई "केंद्रीय" अनुमान नहीं है। CI अनुमानों और ठगना कारकों से नहीं बनते हैं। यही कारण है कि मैं कहता हूं कि त्रुटि बार दिए गए अनुमान से अधिक मायने रखते हैं।


उस ने कहा, एक अंतराल अनुमान (ऊपर सब कुछ) जरूरी नहीं कि ठीक से शांत त्रुटि के साथ एक बिंदु अनुमान से बेहतर है (जो इस बिंदु पर मेरे स्मरण से परे है - मुझे केवल याद है कि यह अक्सर गलत तरीके से किया जाता है)। मैं सिर्फ इतना कह रहा हूं कि कई अनुमानों को पर्वतमाला के रूप में व्यक्त किया गया है - और मुझे खतरा होगा कि अधिकांश संख्याएं गोल संख्याओं के साथ हैं - अंतराल या बिंदु + त्रुटि अनुमानों के बजाय बिंदु + ठगना हैं।


बिंदु + त्रुटि का एक उचित उपयोग :

"एक मशीन तरल के साथ कप भरती है, और इसे समायोजित किया जाना चाहिए ताकि कप की सामग्री 250 ग्राम तरल हो। जैसा कि मशीन हर कप को बिल्कुल 250.0 ग्राम के साथ नहीं भर सकती है, व्यक्तिगत कप में जोड़ा गया सामग्री कुछ भिन्नता दिखाती है, और एक यादृच्छिक चर X माना जाता है। इस बदलाव को सामान्य रूप से 250 ग्राम के वांछित औसत के आसपास वितरित किया जाता है, एक मानक विचलन के साथ,।, 2.5 ग्राम का। यह निर्धारित करने के लिए कि मशीन पर्याप्त रूप से कैलिब्रेटेड है, n = 25 का एक नमूना। तरल के कपों को यादृच्छिक रूप से चुना जाता है और कपों को तौला जाता है। तरल के मापा द्रव्यमानों को X1, ..., X25, X से एक यादृच्छिक नमूना बनाया जाता है। "

मुख्य बिंदु: इस उदाहरण में, अनुमानित और मापा के बजाय माध्य और त्रुटि दोनों निर्दिष्ट / मान्य हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.