एक्सकेसीडी के फ्रीक्वेंसी बनाम बायेसियन कॉमिक में क्या गलत है?


113

xkcd कॉमिक नंबर 1132

यह xkcd कॉमिक (फ़्रीवॉन्डर्स बनाम बायेसियन) एक स्पष्टवादी सांख्यिकीविद् का मज़ाक बनाता है जो स्पष्ट रूप से गलत परिणाम प्राप्त करता है।

हालांकि यह मुझे लगता है कि उनका तर्क वास्तव में इस अर्थ में सही है कि यह मानक अक्सरवादी पद्धति का अनुसरण करता है।

तो मेरा सवाल है "क्या वह बार-बार होने वाली कार्यप्रणाली को सही ढंग से लागू करता है?"

  • यदि नहीं: क्या इस परिदृश्य में एक सही लगातार हस्तक्षेप होगा? लगातार कार्यप्रणाली में सूर्य की स्थिरता के बारे में "पूर्व ज्ञान" को कैसे एकीकृत किया जाए?
  • यदि हाँ: wtf? ;-)

17
गेलमैन के ब्लॉग पर चर्चा: andrewgelman.com/2012/11/16808
Glen

5
मुझे लगता है कि बहुत कुछ गलत है, दोनों बार-बार और बायसेशियन दृष्टिकोण से। मेरी सबसे बड़ी आलोचना प्रत्येक: पहले, पी मूल्य अंततः आंकड़े हैं और सांख्यिकीय समस्या, डेटा और प्रयोग सहित कई चीजों के गुण हैं। यहाँ, तीनों को उस विशेष प्रश्न के लिए घोर गलत तरीके से प्रस्तुत किया गया है। दूसरा, "बायेसियन" एक निर्णय सिद्धांत का उपयोग करता है, जिसे बायेसियन की आवश्यकता नहीं है। हालांकि यह मज़ेदार है।
मोमो

5
आँकड़ों के दायरे से बाहर ले जाने के लिए .... सूरज नोवा जाने के लिए पर्याप्त रूप से पर्याप्त नहीं है। QED, बायेसियन सही है। ( सूर्य इसके बजाय एक लाल विशालकाय बन जाएगा )
बेन ब्रोका

3
@ गलेन एट अलि, विशेष रूप से, गेलमैन को रान्डेल मुनरो की प्रतिक्रिया पर ध्यान दें: andrewgelman.com/2012/11/16808/#comment-109366
jthetzel

2
यहाँ अक्सर सांख्यिकीविद् मूर्ख होने का कारण यह नहीं है कि वह एक व्यक्तिवादी है, बल्कि इसलिए कि वह स्पष्ट रूप से जानता है कि मशीन कैसे काम करती है, इसलिए यह जानता है कि यह एक अनुचित माप है - और वैसे भी एक आक्षेप करता है।
19

जवाबों:


44

मुख्य मुद्दा यह है कि पहला प्रयोग (सूर्य चला गया नोवा) दोहराए जाने योग्य नहीं है, जो इसे लगातार होने वाली कार्यप्रणाली के लिए अत्यधिक अनुपयुक्त बनाता है जो इस बात की संभावना के अनुमान के रूप में प्रायिकता की व्याख्या करता है कि कोई घटना कितनी बार दे रही है कि हम प्रयोग को कई बार दोहरा सकते हैं। इसके विपरीत, बायेसियन संभावना को सभी उपलब्ध पूर्व ज्ञान प्रदान करने वाले हमारे विश्वास की डिग्री के रूप में व्याख्या की जाती है, जिससे यह एक समय की घटनाओं के बारे में सामान्य ज्ञान के लिए उपयुक्त है। पासा फेंक प्रयोग दोहराए जाने योग्य है, लेकिन मुझे यह बहुत कम संभावना लगता है कि कोई भी लगातार जानबूझकर पहले प्रयोग के प्रभाव को नजरअंदाज करेगा और प्राप्त परिणामों के महत्व पर इतना विश्वास करेगा।

यद्यपि ऐसा लगता है कि लेखक बार-बार होने वाले प्रयोगों और पुरोहितों के उनके अविश्वास पर बार-बार निर्भरता का मज़ाक उड़ाते हैं, लेकिन मैं लगातार कहता हूँ कि प्रयोगवादी व्यवस्था के अनौपचारिकता को देखते हुए मैं यह कहूँगा कि इस हास्य का वास्तविक विषय बार-बार होने वाली कार्यप्रणाली नहीं बल्कि सामान्य रूप से अनुपयुक्त कार्यप्रणाली का अंधा अनुसरण है। यह आपके लिए मज़ेदार है या नहीं (यह मेरे लिए है) लेकिन मुझे लगता है कि यह दो दृष्टिकोणों के बीच के अंतरों को स्पष्ट करने की तुलना में अधिक गलतफहमी है।


1
(+1) अक्सरवाद में दोहराव की इस मजबूत और महत्वपूर्ण धारणा पर एक अच्छा संदर्भ विज्ञान (2000) , अध्याय 1 में सांख्यिकीय हस्तक्षेप है (हालांकि बहुत सारे मुद्दे हैं जो यह बताना मुश्किल है कि कौन सा मुख्य है)

36
Repeatability तर्क के साथ इतनी जल्दी नहीं ... सबसे पहले, प्रयोग दोहराने योग्य है मशीन नहीं सूरज नोवा जाने की सच्चाई की क्वेरी है कि है अनुमान की तय लेकिन अज्ञात वस्तु। क्वेरी का प्रयोग निश्चित रूप से दोहराया जा सकता है, और यदि यह कुछ और समय के लिए होता है तो लगातार रणनीति आसानी से उचित प्रतीत हो सकती है।
कंजुगेटपायर

6
दूसरा, किसी को भी पुनरावृत्ति व्यवसाय पर बहुत कठोर नहीं होना चाहिए, ऐसा न हो कि आवृत्तियों को गैर-प्रायोगिक स्थितियों में कुछ भी अनुमान लगाने में सक्षम न हो। एक पल के लिए मान लें कि 'सूरज चला जाता है नोवा' उम्मीदवार कार्यक्रम था। मैं कोई भौतिक विज्ञानी नहीं हूं, लेकिन मुझे बताया गया है कि घटना 'सूरज चला जाता है' बल्कि अक्सर होता है (बस इतना इधर-उधर नहीं होता) इसलिए यह मुझे एक दोहराव जैसा लगता है। किसी भी स्थिति में, डेविड कॉक्स ('फाउन्डेशन ऑफ़ स्टैटिस्टिक्स') जैसे लोग ख़ुशी-ख़ुशी ऐसी बातें कहते हैं: "जिन विचारों पर विचार किया गया है, वे लगभग हमेशा काल्पनिक होते हैं । यह अपने आप में कोई कमी नहीं लगती है"।
कंजुगेटपायर

7
हम सूर्य को समानांतर ब्रह्मांडों में सूरज की आबादी से एक यादृच्छिक नमूने के रूप में देख सकते हैं जिसमें हम सिद्धांत में प्रयोग को दोहरा सकते हैं यदि केवल हमारे पास एक क्वांटम दर्पण था! ; ओ)
डिक्रान मार्सुपियल

2
क्यों सूरज के लिए जाँच नहीं है repeatable? मैं हर सुबह की जाँच करता हूँ, और यह अभी तक नहीं उड़ा है।
GKFX

27

जहाँ तक मैं बार-बार देख सकता हूँ कि यह उचित है:

को वह परिकल्पना होने दें जो सूर्य नहीं फट पाया है और वह परिकल्पना है जो उसके पास है। पी_-मूल्य इस प्रकार तहत परिणाम (मशीन "हां") के अवलोकन की संभावना है । यह मानते हुए कि मशीन सही ढंग से न्यूट्रिनों की अनुपस्थिति की उपस्थिति का पता लगाती है, तो यदि मशीन तहत "हाँ" कहती है तो ऐसा इसलिए है क्योंकि मशीन दो छक्के लगाने के परिणामस्वरूप हमारे पास पड़ी है। इस प्रकार पी-मान 1/36 है, इसलिए सामान्य अर्ध-फिशर वैज्ञानिक अभ्यास का पालन करते हुए, एक निरंतरवादी 95% महत्व के स्तर पर शून्य परिकल्पना को अस्वीकार करेगा ।एच एच एच H0H1H0H0

लेकिन अशक्त परिकल्पना को खारिज करने का मतलब यह नहीं है कि आप वैकल्पिक परिकल्पना को स्वीकार करने के हकदार हैं, इसलिए विश्लेषण द्वारा आवृत्तियों का निष्कर्ष उचित नहीं है। बार-बार परिकल्पना परीक्षण मिथ्याकरण के विचार को मूर्त रूप देता है (प्रकार), आप यह साबित नहीं कर सकते कि कुछ भी सच है, केवल अनुचित है। इसलिए यदि आप को करना चाहते हैं , तो आप मानते हैं कि सत्य है और केवल तभी आगे बढ़ें जब आप यह दिखा सकें कि डेटा के साथ असंगत है। हालांकि इसका मतलब यह नहीं है सिर्फ इतना है कि यह परीक्षण बच जाते हैं और एक व्यवहार्य परिकल्पना कम से कम जहाँ तक अगले परीक्षण के रूप में जारी है सच है।एच एच एच H1H0H0H1

बायेसियन भी केवल सामान्य ज्ञान है, यह देखते हुए कि दांव लगाने से कुछ नहीं होता है। मुझे यकीन है कि लगातार दृष्टिकोणवादी होते हैं, जब झूठी-सकारात्मक और झूठी-नकारात्मक लागतों को ध्यान में रखा जाता है (नेमन-पेन्सन।) लंबे समय तक लाभ के मामले में सबसे अच्छी रणनीति के रूप में एक ही निष्कर्ष निकालेंगे।

संक्षेप करने के लिए: दोनों बार-बारवादी और बेयसियन यहां मैला हो रहे हैं: उचित तरीके से महत्व, झूठे-सकारात्मक / झूठे-नकारात्मक लागत या समस्या के भौतिकी (सामान्य ज्ञान का उपयोग नहीं करते हुए) पर विचार किए बिना एक नुस्खा का आंख मूंदकर पालन करने वाला व्यक्ति। । बेयसियन अपने पुरोहितों को स्पष्ट रूप से नहीं बताने के लिए मैला हो रहा है, लेकिन फिर सामान्य ज्ञान का उपयोग करने वाले पादरियों का उपयोग करके स्पष्ट रूप से सही है (यह बहुत अधिक संभावना है कि मशीन वास्तव में सूरज की तुलना में झूठ बोल रही है), ढलान शायद excusable है।


4
अशक्त परिकल्पना को अस्वीकार करने का सीधा सा अर्थ है कि अवलोकन की संभावना नहीं होगी कि IF H0 सच था। आपको इस आधार पर एच 1 को "स्वीकार" नहीं करना चाहिए क्योंकि यह मूल रूप से कह रहा है कि एच 1 को सच होना चाहिए क्योंकि यदि एच 0 सच था तो अवलोकन की संभावना नहीं होगी। हालाँकि H1 (जो कि नल की रस्म को नजरअंदाज करता है) और H1 की तुलना में H1 की प्राथमिकता की तुलना में कम संभावना हो सकती है (जो कि नल की रस्म भी नजरअंदाज करता है)। परिकल्पना को स्वीकार करना एक बेइस्पियन परीक्षण के रूप में बार-बार होने वाले परीक्षण की व्याख्या करने की दिशा में एक फिसलन है, जिसके परिणामस्वरूप आमतौर पर कम प्राथमिक मामलों में गलतफहमी होती है।
डिक्रान मार्सुपियल

4
बस अपनी टिप्पणी पर अड़ गया। और मेरा भी वही सवाल है जो @ ग्लासी का था। मैं आपकी टिप्पणी पर आपत्ति करना चाहूंगा कि यदि आपकी परिकल्पना घटनाओं के पूरे स्थान को कवर करती है, तो यहां {"सूर्य अस्त हो गया है", "सूर्य नहीं गया नोवा"}, मुझे आपकी बात समझने में कठिनाई हो रही है कि कैसे अस्वीकार कर सकते हैं " सूर्य नावा चला गया है "स्वचालित रूप से नेतृत्व नहीं करता है" सूर्य नागा नहीं गया "। एक बयान को गलत घोषित करने से इसका नकारात्मक अर्थ सही होना चाहिए। यदि आप कुछ विश्वसनीय संदर्भ पाठ प्रदान करते हैं तो यह बहुत अच्छा होगा जहाँ इस बिंदु को यदि संभव हो तो स्पष्ट रूप से समझाया गया है। मैं इसके बारे में और अधिक जानकारी प्राप्त करना चाहूंगा।
-टू-अर्थ

3
अशक्त परिकल्पना को अस्वीकार करने का मतलब यह नहीं है कि अशक्त परिकल्पना शायद झूठी है, बस यह वैकल्पिक परिकल्पना के साथ जारी रखना उचित है। यह (भाग में) है क्योंकि लगातार परिकल्पना परीक्षण परिकल्पना की पूर्व संभावनाओं को ध्यान में नहीं रखता है। मौलिक रूप से, किसी विशिष्ट परिकल्पना की सत्यता के लिए प्रायिकता के तरीकों का इस्तेमाल करने के लिए लगातारवादी तरीकों का इस्तेमाल नहीं किया जा सकता है, इसलिए "हम अशक्त परिकल्पना को अस्वीकार कर सकते हैं" और "शून्य परिकल्पना शायद झूठी है" के बीच का लिंक एक पूरी तरह से व्यक्तिपरक है, जहां तक मैं देख सकता हूँ।
डिक्रान मार्सुपियल 10

2
यह मेरी बात का एक प्रकार है, यह निर्णय कि क्या हम H1 को स्वीकार करते हैं व्यक्तिपरक है और परीक्षण के परिणाम का एक आवश्यक परिणाम नहीं है "H0 की अस्वीकृति आमतौर पर H1 को स्वीकार करने के लिए प्रेरित करती है "। समस्या यह है कि आपको निर्णय लेने के लिए आवश्यक जानकारी [P (H0), P (H1), P (Z | H1)] परीक्षण में दिखाई नहीं देती है। अनिवार्य रूप से इस जानकारी में से कुछ को सीमा को स्थापित करने में आंशिक रूप से शामिल किया गया है, लेकिन यह आमतौर पर अधूरा है और अक्सर अस्थिर और अनुचित छोड़ दिया जाता है। पुजारी अभी भी लगातार परीक्षणों में हैं, समान रूप से व्यक्तिपरक, लेकिन निहित प्रभाव - दोनों दुनिया के सबसे खराब! ; ओ)
डिक्रान मार्सुपियल

3
@ डिक्रान, मुझे लगता है कि हम एक-दूसरे को अच्छी तरह से समझ गए हैं और टिप्पणी अनुभाग का दुरुपयोग करना बंद कर देना चाहिए, लेकिन एक अंतिम टिप्पणी: मैं व्यक्तिपरक रूप से एच 1 को स्वीकार करना चुनता हूं यदि मैं विषयगत रूप से अस्वीकार करने का चयन करता हूं [अमीबा-अस्वीकार] एच 0 पर आधारित है जो मेरे द्वारा चुने गए पर आधारित है P (H1) का मेरा व्यक्तिपरक विशेषज्ञ मूल्यांकन। यह कहना कि "मैं H1 को केवल इसलिए स्वीकार करने के लिए मजबूर नहीं हूं क्योंकि मैं अमीबा को अस्वीकार कर सकता हूं H0" कोई भाषाई अर्थ नहीं रखता है। लेकिन मैं इस बात से सहमत हूं कि "मैं H1 को सिर्फ इसलिए स्वीकार करने के लिए मजबूर नहीं हूं क्योंकि मैं H0 को 5% के स्तर पर अस्वीकार कर सकता हूं"। मेरा मुख्य बिंदु: 5% के स्तर पर H0 अस्वीकार करने के लिए सक्षम किया जा रहा खारिजα
अमीबा

25

यह परिणाम "गलत" क्यों लगता है? बायेसियन कहेंगे कि परिणाम प्रति-सहज लगता है क्योंकि हमारे पास "पूर्व" विश्वास है कि जब सूरज फट जाएगा, और इस मशीन द्वारा प्रदान किए गए सबूत उन विश्वासों को धोने के लिए पर्याप्त नहीं हैं (ज्यादातर इसकी वजह से अनिश्चितता है। सिक्का flipping)। लेकिन एक निरंतरवादी ऐसा आकलन करने में सक्षम होता है, उसे केवल आंकड़ों के संदर्भ में ऐसा करना चाहिए, जैसा कि विश्वास के विपरीत।

विरोधाभास का वास्तविक स्रोत तथ्य यह है कि लगातार किए गए सांख्यिकीय परीक्षण में उपलब्ध सभी आंकड़ों को ध्यान में नहीं रखा गया है। कॉमिक में विश्लेषण के साथ कोई समस्या नहीं है, लेकिन परिणाम अजीब लगता है क्योंकि हम जानते हैं कि सूरज सबसे अधिक संभावना लंबे समय तक विस्फोट नहीं करेगा। लेकिन हम यह कैसे जानते हैं? क्योंकि हमने माप, अवलोकन और सिमुलेशन किए हैं जो सूर्य के विस्फोट होने पर बाधा डाल सकते हैं। तो, हमारे पूर्ण ज्ञान को उन मापों और डेटा बिंदुओं को ध्यान में रखना चाहिए।

एक बायेसियन विश्लेषण में, यह उन मापों का उपयोग करके किया जाता है जिनका निर्माण पहले किया गया था (हालांकि, माप को पूर्व में बदलने की प्रक्रिया अच्छी तरह से परिभाषित नहीं है: कुछ बिंदु पर एक प्रारंभिक पूर्व होना चाहिए, या फिर यह "सभी कछुए हैं" नीचे रास्ता ")। इसलिए, जब बायेसियन अपने पूर्व का उपयोग करता है, तो वह वास्तव में बहुत सी अतिरिक्त जानकारी को ध्यान में रख रहा है जो कि लगातारवादी के पी-मूल्य विश्लेषण के लिए निजी नहीं है।

इसलिए, समान स्तर पर बने रहने के लिए, समस्या के पूर्ण बारंबार विश्लेषण में सूरज विस्फोट के बारे में समान अतिरिक्त डेटा शामिल होना चाहिए जो कि बायेसियन के निर्माण से पहले उपयोग किया जाता है। लेकिन, पुजारियों का उपयोग करने के बजाय, एक अतिवादी केवल इस संभावना का विस्तार करेगा कि वह उन अन्य मापों को शामिल करने के लिए उपयोग कर रहा है, और उसके पी-मूल्य की गणना उस पूर्ण संभावना का उपयोग करके की जाएगी।

L=L (मशीन ने कहा हाँ | सूर्य ने विस्फोट किया है) * (सूर्य के बारे में अन्य सभी आंकड़े | सूर्य ने विस्फोट किया है)L

एक पूर्ण निरंतर विश्लेषण सबसे अधिक संभावना दिखाएगा कि संभावना का दूसरा भाग बहुत अधिक विवश होगा और पी-मूल्य गणना में प्रमुख योगदान होगा (क्योंकि हमारे पास सूरज के बारे में जानकारी का खजाना है, और इस जानकारी पर त्रुटियां हैं छोटे हैं (उम्मीद से))।

व्यावहारिक रूप से, किसी को बाहर जाने की जरूरत नहीं है और पिछले 500 वर्षों से प्राप्त सभी डेटा बिंदुओं को एक निरंतरवादी गणना करने के लिए इकट्ठा करना चाहिए, कोई उन्हें कुछ सरल संभावना शब्द के रूप में अनुमानित कर सकता है जो अनिश्चितता को एन्कोड करता है कि क्या सूरज फट गया है या नहीं। यह फिर बायेसियन के पूर्व के समान हो जाएगा, लेकिन यह थोड़ा अलग दार्शनिक है क्योंकि यह एक संभावना है, जिसका अर्थ है कि यह कुछ पिछले माप को एन्कोड करता है (जैसा कि एक पूर्व के विपरीत है, जो कुछ प्राथमिकताओं को मानता है)। यह नया शब्द संभावना का एक हिस्सा बन जाएगा और इसका उपयोग विश्वास अंतराल (या पी-वैल्यू या जो कुछ भी) बनाने के लिए किया जाएगा, जैसा कि पहले बायेसियन के विपरीत है, जो विश्वसनीय अंतराल या पोस्टएयर बनाने के लिए एकीकृत है।


1
यह स्वीकृत या सर्वाधिक मतदान वाला उत्तर होना चाहिए।
एमेलियो वाज़केज़-रीना

11

सबसे बड़ी समस्या जो मुझे दिख रही है, वह यह है कि कोई भी परीक्षा आँकड़ा नहीं है। -value एक मूल्य के लिए (सभी की आलोचनाओं बायेसियन सांख्यिकीविदों इसके खिलाफ माउंट के साथ) एक परीक्षण आंकड़ा की के रूप में परिभाषित किया गया है (यह मानते हुए कि अधिक मूल्यों के लिए नल अस्वीकार कर दिया गया है , जैसा कि आंकड़ों के साथ मामला होगा , कहते हैं)। यदि आपको अधिक महत्व के निर्णय तक पहुंचने की आवश्यकता है, तो आप महत्वपूर्ण मूल्य को बढ़ा सकते हैं और अस्वीकृति क्षेत्र को आगे बढ़ा सकते हैं। प्रभावी रूप से, यही बोनफ्रोनी जैसे कई परीक्षण सुधार करते हैं, आपको लिए बहुत कम सीमा का उपयोग करने का निर्देश देते हैंटी टी पी आर बी [ टी टी | एच 0 ] टी χ 2 पी 0 , 1 / 36 , 2 / 36 , ...ptTProb[Tt|H0]Tχ2p-values। इसके बजाय, अक्सर सांख्यिकीविद् के ग्रिड पर आकारों के परीक्षण के साथ यहां अटक जाता है ।0,1/36,2/36,

बेशक, यह "लगातार" दृष्टिकोण अवैज्ञानिक है, क्योंकि परिणाम शायद ही प्रतिलिपि प्रस्तुत करने योग्य होगा। एक बार जब सूर्य सुपरनोवा चला जाता है, तो वह सुपरनोवा बना रहता है, इसलिए डिटेक्टर को बार-बार "हां" कहते रहना चाहिए। हालांकि, इस मशीन के बार-बार चलने से "हां" परिणाम फिर से प्राप्त करने की संभावना नहीं है। यह उन क्षेत्रों में मान्यता प्राप्त है जो खुद को कठोर के रूप में पेश करना चाहते हैं और अपने प्रयोगात्मक परिणामों को पुन: पेश करने की कोशिश करते हैं ... जो, जहां तक ​​मैं समझता हूं, 5% के बीच कहीं भी संभावना के साथ होता है (मूल पेपर प्रकाशित करना एक शुद्ध प्रकार मैं त्रुटि थी) और कुछ चिकित्सा क्षेत्रों में लगभग 30-40%। मेटा-विश्लेषण के लोग आपको बेहतर संख्याओं से भर सकते हैं, यह सिर्फ बज़ है जो मेरे लिए समय-समय पर सांख्यिकी अंगूर के माध्यम से आता है।

"उचित" अक्सरवादी दृष्टिकोण से एक अन्य समस्या यह है कि मरना रोलिंग एक कम से कम शक्तिशाली परीक्षण है, जिसमें शक्ति = महत्व स्तर (यदि कम नहीं है, तो 5% महत्व स्तर के लिए 2.7% शक्ति के बारे में घमंड करने के लिए कुछ भी नहीं है)। टी-परीक्षणों के लिए नेमन-पियरसन सिद्धांत यह दर्शाता है कि यह एक यूएमपीटी है, और बहुत सारे ब्रो स्टैटिस्टिकल थ्योरी (जो मुझे बमुश्किल समझ में आती है, मुझे स्वीकार करना होगा) शक्ति घटता को प्राप्त करने और किसी दिए जाने पर शर्तों को पूरा करने के लिए समर्पित है। परीक्षण किसी दिए गए वर्ग में सबसे शक्तिशाली है। (साभार: @Dikran Marsupial ने टिप्पणियों में से एक में शक्ति के मुद्दे का उल्लेख किया है।)

मुझे नहीं पता कि यह आपको परेशान करता है, लेकिन बेयसियन सांख्यिकीविद को यहां उस व्यक्ति के रूप में दिखाया गया है, जिसे कोई गणित नहीं पता है और एक जुआ समस्या है। एक उचित बायेसियन सांख्यिकीविद् पूर्व को पोस्ट करता है, निष्पक्षता की अपनी डिग्री पर चर्चा करता है, पोस्टीरियर को प्राप्त करता है, और प्रदर्शित करता है कि उन्होंने डेटा से कितना सीखा। इनमें से कोई भी काम नहीं किया गया था, इसलिए बायेसियन प्रक्रिया की देखरेख सिर्फ उतनी ही की गई है, जितनी बार की गई है।

यह स्थिति कैंसर की समस्या के लिए शास्त्रीय स्क्रीनिंग को प्रदर्शित करती है (और मुझे यकीन है कि बायोस्टैटिस्ट इसका बेहतर वर्णन कर सकते हैं जितना मैं कर सकता था)। जब एक अपूर्ण साधन के साथ एक दुर्लभ बीमारी की जांच की जाती है, तो अधिकांश सकारात्मक गलत धारणाएं बन जाते हैं। स्मार्ट सांख्यिकीविद् जानते हैं कि, और अधिक महंगे और अधिक सटीक बायोप्सी के साथ सस्ते और गंदे स्क्रीनर्स का पालन करना बेहतर जानते हैं।


2
अगर मैं आपके पहले पैराग्राफ को सही ढंग से समझ पा रहा हूं, तो आप कह रहे हैं कि थ्रेशोल्ड (कॉमिक में 0.05) बहुत अधिक है। यदि कॉमिक में दो के बजाय पांच पासे होते हैं, तो क्या आप दहलीज को काफी कम मानेंगे? वैसे भी आप दहलीज कैसे तय करते हैं?
श्रीवत्सआर

9
मैंने सोचा कि बायेसियन स्टेटिस्टिशियन ने बस इस बात को ध्यान में रखा कि सूरज के फटने की संभावना बहुत ज्यादा है, मशीन के खराब होने की संभावना की तुलना में बहुत कम है (इसलिए, जरूरी नहीं कि एक क्लूलेस जुआरी)।
josh

8
इस बिंदु पर अधिक: अगर सूरज नोवा चला जाता है, तो दांव का विजेता अपने 50 डॉलर नकद नहीं दे पाएगा ...
kjetil b halvorsen

6
मुझे लगता है कि विश्लेषण के वास्तविक उद्देश्य के बारे में बिना सोचे-समझे एक बिंदु का अनुसरण करने वाला एक बिंदु है। तथाकथित "बायेसियन" वास्तव में बायसेनियन नहीं है, बस कोई अपने सामान्य ज्ञान का उपयोग कर रहा है। विज्ञान की पत्रिकाओं में ब्लाइंड रेसिपी के बहुत से उदाहरण हैं, यही वजह है कि कार्टून मनोरंजक है।
डिक्रान मार्सुपियल

3
टेस्ट स्टैटिस्टिक की कमी काफी समस्या है जो मुझे नहीं लगता। एक परीक्षण आँकड़ा डेटा के कुछ कार्य है। तो पहचान समारोह, यानी यहाँ डेटा ही, कम से कम सिद्धांत रूप में काम करने के लिए प्रकट होगा।
कंजुगेटपाइयर

6

इस कॉमिक में कुछ भी गलत नहीं है, और इसका कारण आँकड़ों से कोई लेना-देना नहीं है। यह अर्थशास्त्र है। यदि लगातार सही होता है, तो पृथ्वी 48 घंटे के भीतर निर्जन में तन्मय हो जाएगी। $ 50 का मूल्य प्रभावी रूप से शून्य होगा। इसे पहचानने वाले बेयसियन, शर्त को यह जानकर कर सकते हैं कि उसका लाभ सामान्य मामले में $ 50 है, और सूर्य-विस्फोट मामले में मामूली कुछ भी नहीं है।


बायेसियन सांख्यिकी स्पष्ट रूप से इसे "हानि समारोह को कम करने" के रूप में मॉडल के बाद से "आंकड़ों के साथ कुछ करना है" यह करता है;)
Fabio Beltramini

5

अब जब सर्न ने फैसला किया है कि न्यूट्रिनो प्रकाश से तेज नहीं हैं - न्यूट्रिनो परिवर्तन पर ध्यान देने से पहले विद्युत चुम्बकीय विकिरण का झटका पृथ्वी से टकराएगा। यह कम से कम (बहुत अल्पावधि में) शानदार अरोनल प्रभाव होगा। इस प्रकार यह तथ्य कि यह अंधेरा है, आसमान को जलने से नहीं रोकेगा; चन्द्रमा अत्यधिक चमक से चमकता है (cf लैरी निवेन की "असुविधाजनक चंद्रमा") और शानदार चमकती है क्योंकि कृत्रिम उपग्रहों को वाष्पीकृत किया गया था और आत्म दहन किया गया था।

सब सब में - शायद गलत परीक्षा? (और इससे पहले कि वहाँ हो सकता है - पीछे के एक यथार्थवादी निर्धारण के लिए अपर्याप्त समय होगा।


1
सभी और परिकल्पना को खारिज करने का कारण है कि सूरज फट गया है, फिर। :-)
श्रीवत्सआर

तो यह वही है जो लेख के अंत में होता है जब लेखक कहते हैं: "पुष्टिकरण अध्ययन की आवश्यकता है"?
डीडिन नोव

दरअसल, लापरवाही से यह स्पष्ट निष्कर्ष शीर्षक में है। मशीन पता लगाती है कि क्या सूरज नोवा हो गया है। पता लगाने में त्रुटि का कोई मौका नहीं है। न्यूट्रिनो बिट अप्रासंगिक है। यह देखते हुए, फिर आंकड़े ऐसे हैं कि मशीन "नहीं", "नहीं", "नहीं" का जवाब देगी ... एक झूठी बयान (हाँ) होने के 1/36 मौका के साथ जब तक कि एक बंद घटना जो सांख्यिकीय को समाप्त नहीं करती है प्रक्रिया होती है - यह भी गलत तरीके से रिपोर्ट किए जाने (नहीं) होने का 1/36 मौका होगा, यदि मशीन 8 मिनट के अंतराल के दौरान पृथ्वी पर स्पष्ट होने के लिए बुझती है।
सिमोन

4

मैं @GeorgeLewis से सहमत हूं कि फ़्रीक्वेंटिस्ट दृष्टिकोण को समाप्त करने के लिए समय से पहले गलत हो सकता है - चलो अधिक डेटा एकत्र करने के लिए न्यूट्रिनो डिटेक्टर को कई बार पुन: चलाएँ। पुजारियों के साथ गड़बड़ करने की कोई जरूरत नहीं है।


2

एक सरल बिंदु जो यहां सभी क्रियाओं के जवाबों के बीच खो सकता है, वह यह है कि अक्सर एक एकल नमूने के आधार पर अपने निष्कर्ष को चित्रित किया जाता है। व्यवहार में आप ऐसा कभी नहीं करेंगे।

वैध निष्कर्ष पर पहुंचने के लिए सांख्यिकीय रूप से महत्वपूर्ण नमूना आकार की आवश्यकता होती है (या दूसरे शब्दों में, विज्ञान को दोहराने योग्य होने की आवश्यकता होती है)। इसलिए व्यवहारिक व्यक्ति मशीन को कई बार चलाएगा और फिर परिणामी डेटा के बारे में निष्कर्ष पर आएगा।

संभवत: यह मशीन को एक ही सवाल को कई बार पूछेगा। और संभवत: अगर मशीन गलत है तो हर 36 में से 1 बार एक स्पष्ट पैटर्न सामने आएगा। और उस पैटर्न से (बल्कि तब एक ही रीडिंग से) लगातार एक (काफी सटीक, मैं कहूँगा) निष्कर्ष निकाला जाएगा कि क्या सूरज फट गया है या नहीं।


4
"सांख्यिकीय महत्वपूर्ण नमूना आकार" से आपका क्या अभिप्राय है?
मोमो

@ मोमो - एक से अधिक नमूने, यह सुनिश्चित करने के लिए है। यह एक असंभव परिणाम का निरीक्षण करने और फिर निष्कर्ष निकालने के लिए मान्य नहीं है कि यह पहली बार अवलोकन को दोहराए बिना यह सुनिश्चित किया गया है कि यह एक अस्थायी नहीं था। यदि आप एक सटीक संख्या चाहते हैं जो एक सांख्यिकीय महत्वपूर्ण नमूना आकार या एक सटीक संख्या निर्धारित करने के लिए एक एल्गोरिथ्म का प्रतिनिधित्व करता है, तो शायद एक सांख्यिकीविद् एक प्रदान कर सकता है; लेकिन मैं सांख्यिकीविद् नहीं हूं।
7

3
मुझे नहीं लगता कि 1 का एक नमूना आकार होने के साथ एक विशेष समस्या है, समस्या यह है कि परीक्षण में कोई सांख्यिकीय शक्ति नहीं है (यानी जब यह झूठा है तो परीक्षण शून्य परिकल्पना को अस्वीकार नहीं करेगा)। हालाँकि, यह "अशक्त अनुष्ठान" के साथ एक समस्या को प्रकट करता है, जिसे लेख में लिखा गया है, जो सांख्यिकीय शक्ति (और वास्तव में एच 1 या समस्या से संबंधित पूर्व सूचना क्या है) के मुद्दे की अनदेखी करता है।
डिक्रान मार्सुपियल

1
@Dikran यह सबसे अच्छा संभव जवाबों में से एक है! कार्टून में "लगातार" के साथ समस्या यह है कि परीक्षण के गुणों के आवश्यक मूल्यांकन का संचालन किए बिना एक विशेष सांख्यिकीय अनुष्ठान का पालन किया गया है। (कोई व्यक्ति इस निर्णय के लिए प्रासंगिक हानि कार्य क्या है, इस पर विचार करके अपने विश्लेषण का विस्तार भी कर सकता है।) जैसे कि कार्टून सभी लोगों को बड़े करीने से तिरस्कृत करता है, जो बिना समझे या उनकी मान्यताओं की जांच किए, सांख्यिकीय प्रक्रियाओं को नियोजित करते हैं।
whuber

2

आपके प्रश्न का उत्तर: "क्या वह बार-बार होने वाली कार्यप्रणाली को सही ढंग से लागू करता है?" नहीं, वह लगातार दृष्टिकोणवादी दृष्टिकोण को लागू नहीं करता है। इस समस्या का p- मान 1/36 नहीं है।

हमें पहले ध्यान देना चाहिए कि इसमें शामिल परिकल्पनाएँ हैं

H0: सूर्य का विस्फोट नहीं हुआ है,

H1: सूर्य फट गया है।

फिर,

p-value = P ("मशीन हाँ देता है" | सूर्य विस्फोट नहीं हुआ है)।

इस संभाव्यता की गणना करने के लिए, हमें ध्यान देना चाहिए कि "मशीन हाँ में हाँफती है" न्युट्रीनो डिटेक्टर के समान है जो सूर्य के विस्फोट को मापता है और सही परिणाम बताता है या न्यूट्रिनो डिटेक्टर सूर्य के विस्फोट को मापता नहीं है और हमसे झूठ बोलता है "।

यह मानते हुए कि पासा फेंकना न्यूट्रिनो डिटेक्टर माप से स्वतंत्र है, हम परिभाषित करके पी-मान की गणना कर सकते हैं:

p0 = P ("न्यूट्रिनो डिटेक्टर सूर्य विस्फोट का उपाय करता है" | सूर्य विस्फोट नहीं हुआ है);

फिर, पी-मूल्य है

p-value = p0 x 35/36 + (1-p0) x 1/36 = (1/36) x (1+ 34 x p0)।

इस समस्या के लिए, p- मान 1/36 और 35/36 के बीच की एक संख्या है। पी-वैल्यू बराबर १/३६ है और यदि केवल पी ० = ० है। यही है, इस कार्टून में एक छिपी हुई धारणा यह है कि अगर सूरज नहीं फट रहा हो तो डिटेक्टर मशीन कभी भी सूर्य विस्फोट का माप नहीं लेगी।

इसके अलावा, एनोवा विस्फोट के बाहरी साक्ष्य के बारे में अधिक जानकारी डाली जानी चाहिए।

शुभकामनाएं।


1

मुझे बार-बार आने वाले दृष्टिकोण के साथ कोई समस्या नहीं दिखती है। यदि शून्य परिकल्पना को अस्वीकार कर दिया जाता है, तो पी-मान टाइप 1 त्रुटि की संभावना है। टाइप 1 त्रुटि एक सच्चे अशक्त परिकल्पना को खारिज कर रही है। इस मामले में हमारे पास पी-वैल्यू 0.028 है। इसका मतलब यह है कि इस पी-मूल्य के साथ किए गए सभी परिकल्पना परीक्षणों के बीच, सौ में से लगभग 3 एक सच्चे शून्य परिकल्पना को खारिज कर देंगे। निर्माण से, यह उन मामलों में से एक होगा। फ्रिक्वेंटर्स स्वीकार करते हैं कि कभी-कभी वे सच्चे अशक्त परिकल्पना को खारिज कर देते हैं या झूठी अशांति परिकल्पना (टाइप 2 त्रुटियों) को बनाए रखेंगे, उन्होंने कभी भी अन्यथा दावा नहीं किया है। इसके अलावा, वे लंबे समय में उनके गलत अनुमानों की आवृत्ति को ठीक करते हैं।

शायद, इस परिणाम को देखने का एक कम भ्रमित तरीका परिकल्पना की भूमिकाओं का आदान-प्रदान करना है। चूंकि दो परिकल्पनाएं सरल हैं, ऐसा करना आसान है। यदि अशक्त है कि सूर्य नोवा गया, तो पी-मान 35/36 = 0.972 है। इसका मतलब यह है कि यह इस परिकल्पना के खिलाफ कोई सबूत नहीं है कि सूरज नोवा गया था, इसलिए हम इसे इस परिणाम के आधार पर अस्वीकार नहीं कर सकते। यह अधिक उचित लगता है। अगर आप सोच रहे हैं कोई यह क्यों मान लेगा कि सूरज नोवा हो गया। मैं तुमसे पूछूंगा। अगर कोई सूरज के विस्फोट के बारे में बहुत हास्यास्पद लगता है तो कोई ऐसा प्रयोग क्यों करेगा?

मुझे लगता है कि यह सिर्फ दिखाता है कि किसी को पहले से एक प्रयोग की उपयोगिता का आकलन करना होगा। यह प्रयोग, उदाहरण के लिए, पूरी तरह से बेकार होगा क्योंकि यह कुछ ऐसा परीक्षण करता है जिसे हम पहले से ही आसमान से देख रहे हैं (जो मुझे यकीन है कि एक पी-मूल्य है जो प्रभावी रूप से शून्य है)। एक अच्छा प्रयोग तैयार करना अच्छे विज्ञान का निर्माण करने की आवश्यकता है। यदि आपका प्रयोग खराब तरीके से डिजाइन किया गया है, तो कोई फर्क नहीं पड़ता है कि आप किस सांख्यिकीय साधन का उपयोग करते हैं, आपके परिणाम उपयोगी होने की संभावना नहीं है।


निश्चित रूप से, लेकिन बायेसियन अभी भी दिए गए डेटा / प्रयोग के परिणाम के साथ एक उचित निष्कर्ष निकाल सकता है । कभी-कभी आप एक प्रयोग को दोहरा नहीं सकते हैं या इसे जिस तरह से आप चाहते हैं, डिजाइन कर सकते हैं।
अमेलियो वाज़केज़-रीना

यह एक उचित बिंदु है, बेयसियन इंट्रेंस आसानी से पिछले अनुभव को शामिल कर सकता है जो असाधारण परिणामों के लिए सांख्यिकीय वजन होना मुश्किल बनाता है (यह हमें सांख्यिकीय flukes से बचाता है)। हालाँकि, यह बायेसियन ढांचे में एक बेकार प्रयोग भी है। पूर्व एक निष्कर्ष के पक्ष में इतनी दृढ़ता से है कि इस प्रयोग का कोई भी परिणाम इसे बदल नहीं सकता है। यदि पूर्व इतना मजबूत है। इसे संशोधित करने का कोई मौका क्यों नहीं दिया गया? जब कमजोर याजकों पर विचार किया जाता है (संभवतः डेटा द्वारा बदला जाना है), मुझे लगता है कि बायेसियन और फ़्रीक्वेंटिस्ट तरीके आमतौर पर "तुलनीय" परिणाम देते हैं।
जोस गार्मिला

0

लगातार कार्यप्रणाली में सूर्य की स्थिरता के बारे में "पूर्व ज्ञान" को कैसे एकीकृत किया जाए?

बहुत ही रोचक विषय।

यहाँ सिर्फ कुछ विचार हैं, एक सही विश्लेषण नहीं ...

एक noninformative पूर्व के साथ बायेसियन दृष्टिकोण का उपयोग करना आमतौर पर एक निरंतरता के लिए तुलनीय सांख्यिकीय अनुमान प्रदान करता है।

बेइज़ियन के पास एक मजबूत पूर्व धारणा क्यों है कि सूर्य का विस्फोट नहीं हुआ है? क्योंकि वह सभी को जानता है कि सूरज शुरू से ही कभी नहीं फूटता।

हम संयुग्म महंतों के साथ कुछ सरल सांख्यिकीय मॉडल पर देख सकते हैं कि एक पूर्व वितरण का उपयोग कर एक noninfomative पूर्व और प्रारंभिक प्रयोगों से प्राप्त पिछला वितरण उपयोग करने के लिए बराबर है।

ऊपर दिए गए वाक्य से पता चलता है कि फ़्रीक्वेंटिस्ट को अपने मॉडल में प्रारंभिक प्रयोगों के परिणामों को शामिल करके बायेसियन के रूप में निष्कर्ष निकालना चाहिए। और यह वही है जो बायेसियन वास्तव में करता है : उसका पूर्व प्रारंभिक प्रयोगों के अपने ज्ञान से आता है!

Nxiixiθxixi=1i=1,,N

N+1xiy={Yes}θ θ एक्स 1 , ... , एक्स एन y 1 एन y = { हाँ } θ θPr(xN+1=0)θθx1,,xNy1Ny={Yes}θ। और बायेसियन के बारे में अपने पूर्व वितरण के माध्यम से इस जानकारी को उजागर करने का इरादा रखता ।θ

इस दृष्टिकोण से मैं यह नहीं देखता कि परिकल्पना परीक्षण के संदर्भ में प्रश्न को कैसे फिर से समझना है। लेना इसका कोई मतलब नहीं है क्योंकि यह मेरी व्याख्या में प्रयोग का एक संभावित मुद्दा है, न कि एक सच्ची / झूठी परिकल्पना। शायद यह फ़्रीक्वेंटिस्ट की त्रुटि है?H0={the sun has not exploded}


मार्ग "... वह हर किसी के रूप में जानता है कि सूरज अपनी शुरुआत के बाद से कभी नहीं फट गया है" हाल ही में एक अमेरिकी छुट्टी के बारे में एक कहानी मन में लाता है जिसमें लाखों टर्की ( मेलिएग्रिस गैलोपावो ) का सेवन किया जाता है। जैसे ही समय बीतता है, प्रत्येक दिन कोई भी बुद्धिमान टर्की "हर किसी के रूप में" जानता है कि उसे खिलाया जाएगा और उसकी देखभाल की जाएगी, ठीक है जब तक कि नवंबर के मध्य में उस भाग्यवादी (और पूरी तरह से अप्रत्याशित - उसके) दिन तक नहीं! इसी तरह, सूरज की स्थिरता में हमारा विश्वास कम होना चाहिए, अगर हम सभी को इस पर भरोसा करना था, तो यह मानव अवलोकन का अपेक्षाकृत कम इतिहास था।
व्हिबर

@ जब भी मैं निजी तौर पर आपको यह संदेश भेजना चाहूंगा। क्या आपकी टिप्पणी और चर्चा के विषय के बीच कोई संबंध है? मुझे नहीं पता कि यह वह है जो मुझे विचार बनाता है, लेकिन यह कई बार हुआ है कि मुझे लगता है कि आप मेरे उत्तरों पर टिप्पणी करते हैं मुख्य रूप से मेरे उत्तरों के खिलाफ कुछ कहते हैं। ओपी द्वारा पेश किया गया व्यायाम एक कार्टून की व्याख्या है, और मुझे लगता है कि आप मेरे जवाब की आलोचना करते हैं जैसे कि मैं एक वास्तविक मुद्दे के बारे में बात कर रहा था। हाल ही में मैंने सराहना नहीं की और मुझे अभी तक समझ नहीं आया है कि आपने मेरे उत्तरों के पीछे एक संभावित "मंशा" क्यों पैदा की।
स्टीफन लॉरेंट

कोई आलोचना, निहित या इरादा नहीं था: कभी-कभी एक टिप्पणी वास्तव में सिर्फ एक टिप्पणी होती है। इसने (एक तरह से विनोदी होने का इरादा) हाइलाइट करने की कोशिश की, लेकिन महत्वपूर्ण सवालों के जवाब दिए गए, लेकिन आपके जवाब में नहीं दिए गए। मुझे खेद है कि आप इसे व्यक्तिगत या हमला मानते हैं। BTW, यह है एक असली सवाल: यह पूछता है "पूर्व ज्ञान के" ... एकीकृत करने के लिए कैसे frequentist पद्धति में? यह सवाल ह्यूम की प्रेरक प्रवृति की आलोचना को दर्शाता है और विज्ञान के दर्शन में मुद्दों के साथ-साथ आंकड़ों की बहुत नींव रखता है। यह अच्छी तरह से कुछ सावधान सोचा लायक है!
whuber

यह इंगित करने के लायक हो सकता है, भी, कि आपकी प्रतिष्ठा का एक बड़ा अनुपात आपके उत्तरों के लिए मेरे वोटों के कारण है - जो मैं भौतिक साक्ष्य के रूप में प्रस्तुत करता हूं कि आपके खिलाफ मेरी ओर से कोई व्यवस्थित व्यवहार नहीं है।
whuber

2
नहीं, मैं आपकी टिप्पणी को समझ गया हूं। आपकी टिप्पणी का फ्रेंच Google अनुवाद पहले से ही अजीब है, लेकिन अंग्रेजी में मेरे कौशल और अजीब Google अनुवादों को मिलाकर, मैं एक सही अनुवाद प्राप्त करने में सक्षम हूं। मैं अगले महीने अधिक आराम करूंगा, संभावना है।
स्टीफन लॉरेंट

0

यह निश्चित रूप से एक लगातार 0.05 स्तर का परीक्षण है - अशक्त परिकल्पना को शून्य परिकल्पना के तहत 5% से कम समय में खारिज कर दिया जाता है और यहां तक ​​कि विकल्प के तहत शक्ति महान है।

दूसरी ओर पूर्व सूचना हमें बताती है कि समय में एक विशेष बिंदु पर सुपरनोवा जा रहा सूरज काफी संभावना नहीं है, लेकिन मौका से झूठ होने की अधिक संभावना है।

निचला रेखा: कॉमिक के साथ वास्तव में कुछ भी गलत नहीं है और यह दर्शाता है कि अंतर्निहित परिकल्पना का परीक्षण एक उच्च झूठी खोज दर की ओर जाता है। इसके अतिरिक्त, आप संभवतः अपने प्रस्तावित दांवों के आकलन में पूर्व जानकारी को ध्यान में रखना चाहते हैं - यही कारण है कि निर्णय विश्लेषण के साथ संयोजन में एक बायेसियन इतना लोकप्रिय है।


-2

मेरे विचार में, एक अधिक सही लगातार विश्लेषण इस प्रकार होगा: H0: सूरज फट गया है और मशीन सच कह रही है। H1: सूरज फट नहीं गया है और मशीन झूठ बोल रही है।

यहाँ p मान = P (सूरज विस्फोट) है। p (मशीन सच कह रही है) = 0.97। पी (सूरज विस्फोट)

दूसरी संभावना की प्रकृति को जाने बिना सांख्यिकीविद कुछ भी निष्कर्ष नहीं निकाल सकते हैं।

यद्यपि हम जानते हैं कि P (सूरज में विस्फोट) 0 है, क्योंकि सूरज जैसे तारे सुपरनोवा में नहीं फटते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.