जवाबों:
यह प्रति विरोधाभास नहीं है , लेकिन कम से कम पहली बार में यह एक अजीब टिप्पणी है।
द्वितीय विश्व युद्ध के दौरान, अब्राहम वाल्ड अमेरिकी सरकार के लिए एक सांख्यिकीविद थे। उसने उन बमवर्षकों को देखा जो मिशन से लौटे थे और विमानों पर गोली के "घाव" के पैटर्न का विश्लेषण किया था। उन्होंने सिफारिश की कि नौसेना उन क्षेत्रों को सुदृढ़ करती है जहां विमानों को कोई नुकसान नहीं हुआ।
क्यों? हमारे पास काम पर चयन प्रभाव है । इस नमूने से पता चलता है कि देखे गए क्षेत्रों में सूजन को नुकसान पहुंचाया जा सकता है। या तो विमानों को कभी भी अछूते क्षेत्रों में नहीं मारा गया था, एक असंभावित प्रस्ताव, या उन हिस्सों पर हमले घातक थे। हम उन विमानों की परवाह करते हैं जो नीचे गए, न कि केवल वे जो वापस आए। जिन लोगों के गिरने की संभावना थी, वे ऐसे स्थान पर हमला करते थे जो जीवित रहने वालों से अछूता था।
उनके मूल ज्ञापन की प्रतियों के लिए, यहाँ देखें । अधिक आधुनिक अनुप्रयोग के लिए, यह वैज्ञानिक अमेरिकी ब्लॉग पोस्ट देखें ।
एक विषय पर विस्तार, इस ब्लॉग पोस्ट के अनुसार , प्रथम विश्व युद्ध के दौरान, एक टिन हेलमेट की शुरूआत ने एक मानक कपड़ा टोपी की तुलना में अधिक सिर के घावों को जन्म दिया । क्या सैनिकों के लिए नया हेलमेट खराब था? नहीं; हालांकि चोटें अधिक थीं, घातक परिणाम कम थे।
एक अन्य उदाहरण पारिस्थितिक पतन है ।
उदाहरण
मान लीजिए कि हम एक राज्य की औसत आय (हजारों में) पर तत्कालीन-सीनेटर ओबामा के लिए वोट शेयर हासिल करके मतदान और आय के बीच संबंध की तलाश करते हैं। हमें लगभग 20 का अवरोधन और 0.61 का ढलान गुणांक प्राप्त होता है।
कई लोग इस परिणाम की व्याख्या करते हुए कहेंगे कि उच्च आय वाले लोगों को डेमोक्रेट के लिए वोट करने की अधिक संभावना है; वास्तव में, लोकप्रिय प्रेस पुस्तकों ने यह तर्क दिया है।
लेकिन रुकिए, मैंने सोचा कि अमीर लोगों के रिपब्लिकन होने की संभावना अधिक थी? वो हैं।
यह प्रतिगमन वास्तव में हमें बता रहा है कि अमीर राज्यों में एक डेमोक्रेट के लिए वोट करने की अधिक संभावना है और गरीब राज्यों में एक रिपब्लिकन के लिए वोट करने की अधिक संभावना है। किसी दिए गए राज्य के भीतर , अमीर लोगों को रिपब्लिकन वोट करने की अधिक संभावना है और गरीब लोगों को डेमोक्रेट वोट करने की अधिक संभावना है। एंड्रयू जेलमैन और उनके सहयोगियों का काम देखें ।
आगे की मान्यताओं के बिना, हम व्यक्तिगत-स्तर के व्यवहार के बारे में निष्कर्ष बनाने के लिए समूह-स्तरीय (कुल) डेटा का उपयोग नहीं कर सकते हैं। यह पारिस्थितिक पतन है। समूह-स्तरीय डेटा ही हमें समूह-स्तरीय व्यवहार के बारे में बता सकता है।
व्यक्तिगत-स्तरीय निष्कर्षों के लिए छलांग लगाने के लिए, हमें कब्ज धारणा की आवश्यकता है । यहां, व्यक्तियों की मतदान पसंद किसी राज्य की औसत आय के साथ व्यवस्थित रूप से भिन्न नहीं होती है; एक व्यक्ति जो अमीर राज्य में $ X कमाता है , उसे डेमोक्रेट के लिए वोट करने की संभावना होनी चाहिए क्योंकि कोई व्यक्ति जो गरीब राज्य में $ X कमाता है । लेकिन कनेक्टिकट के लोग, सभी आय स्तरों पर, उन्हीं आय स्तरों पर मिसिसिपी के लोगों की तुलना में डेमोक्रेट के लिए वोट करने की अधिक संभावना है । इसलिए, संगतता धारणा का उल्लंघन किया जाता है और हम गलत निष्कर्ष ( एकत्रीकरण पूर्वाग्रह से मूर्ख ) के लिए नेतृत्व कर रहे हैं ।
यह विषय दिवंगत डेविड फ्रीडमैन का लगातार शौक था ; उदाहरण के लिए इस पेपर को देखें । उस पत्र में, फ्रीडमैन समूह डेटा का उपयोग करके व्यक्तिगत-स्तर की संभावनाओं को बाध्य करने के लिए एक साधन प्रदान करता है।
सिम्पसन के विरोधाभास की तुलना
इस सीडब्ल्यू में कहीं और की गई, @ मिचेल ने सिम्पसन के विरोधाभास को एक अच्छे उदाहरण के रूप में प्रस्तावित किया, जैसा कि वास्तव में है। सिम्पसन की विडंबना और पारिस्थितिक पतन निकटता से संबंधित हैं, फिर भी अलग हैं। दो उदाहरण दिए गए डेटा के विश्लेषण और उपयोग किए गए विश्लेषणों में भिन्न होते हैं।
सिम्पसन के विरोधाभास का मानक सूत्रीकरण दो-तरफ़ा तालिका है। हमारे उदाहरण में, मान लें कि हमारे पास व्यक्तिगत डेटा है और हम प्रत्येक व्यक्ति को उच्च या निम्न आय के रूप में वर्गीकृत करते हैं। हमें कुल योगों की आय-दर-वोट 2x2 आकस्मिक तालिका मिलेगी। हम देखेंगे कि कम आय वाले लोगों के हिस्से के सापेक्ष उच्च आय वाले लोगों के एक उच्च हिस्से ने डेमोक्रेट के लिए मतदान किया। हम प्रत्येक राज्य के लिए एक आकस्मिक तालिका बनाने के लिए थे, हालांकि, हम विपरीत पैटर्न देखेंगे।
पारिस्थितिक पतन में, हम आय को एक द्विध्रुवीय (या शायद बहुभिन्नरूपी) चर में नहीं ढोते हैं। राज्य-स्तर प्राप्त करने के लिए, हमें औसत (या मध्य) राज्य की आय और राज्य के वोट शेयर मिलते हैं और एक प्रतिगमन चलाते हैं और पाते हैं कि उच्च आय वाले राज्यों में डेमोक्रेट के लिए वोट करने की अधिक संभावना है। यदि हमने व्यक्तिगत स्तर के डेटा को रखा और राज्य द्वारा अलग से प्रतिगमन को चलाया, तो हमें इसका विपरीत प्रभाव मिलेगा।
सारांश में, अंतर हैं:
सामान्य अवलोकन
@NeilG टिप्पणी करता है कि यह सिर्फ यह कह रहा है कि आपके प्रतिगमन में अप्राप्य / अस्तव्यस्त चर पूर्वाग्रह मुद्दों पर आपका कोई चयन नहीं हो सकता है। ये सही है! कम से कम प्रतिगमन संदर्भ में, मुझे लगता है कि लगभग किसी भी "विरोधाभास" केवल छोड़े गए चर पूर्वाग्रह का एक विशेष मामला है।
चयन पूर्वाग्रह (इस सीडब्ल्यू पर मेरी अन्य प्रतिक्रिया देखें) चयन को चलाने वाले चर को शामिल करके नियंत्रित किया जा सकता है। बेशक, ये चर आम तौर पर अप्रमाणित होते हैं, समस्या / विरोधाभास को बढ़ाते हैं। एक समय की प्रवृत्ति को जोड़कर स्थानिक प्रतिगमन (मेरी अन्य प्रतिक्रिया) को दूर किया जा सकता है। ये मामले कहते हैं, अनिवार्य रूप से, आपके पास पर्याप्त डेटा है, लेकिन अधिक भविष्यवक्ताओं की आवश्यकता है।
पारिस्थितिक गिरावट के मामले में, यह सच है, आपको अधिक भविष्यवक्ताओं (यहां, राज्य-विशिष्ट ढलान और अंतःक्षेपण) की आवश्यकता है। लेकिन आपको इन संबंधों का अनुमान लगाने के लिए समूह-स्तर, टिप्पणियों के साथ -साथ व्यक्तिगत टिप्पणियों की भी अधिक आवश्यकता है ।
(संयोग से, यदि आपके पास चरम चयन है जहां चयन चर पूरी तरह से उपचार और नियंत्रण को विभाजित करता है, जैसा कि WWII उदाहरण में मैंने दिया है, तो आपको प्रतिगमन का अनुमान लगाने के लिए और अधिक डेटा की आवश्यकता हो सकती है; वहां, नीचे के विमान।)
मेरा योगदान सिम्पसन की विडंबना है क्योंकि:
यह स्पष्ट रूप से समझाना कठिन हो सकता है कि निष्कर्ष सादे अंग्रेजी में लोगों को बिछाने के तरीके क्यों हैं।
विरोधाभास का tl; dr संस्करण: किसी परिणाम का सांख्यिकीय महत्व इस बात पर निर्भर करता है कि डेटा का विभाजन कैसे किया जाता है। कारण अक्सर एक चर चर के कारण प्रतीत होता है।
विरोधाभास की एक और अच्छी रूपरेखा यहाँ है ।
आंकड़ों में कोई विरोधाभास नहीं है, केवल पहेली को हल करने की प्रतीक्षा है।
फिर भी, मेरा पसंदीदा दो लिफाफा "विरोधाभास" है । मान लीजिए कि मैंने आपके सामने दो लिफाफे रखे और आपको बताऊं कि एक में दूसरे के मुकाबले दोगुना पैसा होता है (लेकिन जो नहीं है)। आप निम्नानुसार कारण। मान लें कि बाएं लिफ़ाफ़े में , तो 50% प्रायिकता के साथ दायें लिफ़ाफ़े में होता है और 50% प्रायिकता के साथ इसमें होता है , जिसका अपेक्षित मान । लेकिन निश्चित रूप से आप केवल लिफाफे को उलट सकते हैं और समाप्त कर सकते हैं इसके बजाय बाएं लिफाफे में दाएं लिफाफे का मूल्य गुना है। क्या हुआ?2 x 0.5 x 1.25 x 1.25
यह एक हालिया आविष्कार है; पिछले दशक में दर्शन पत्रिकाओं के एक छोटे समूह के भीतर इसकी बहुत चर्चा हुई। दो अलग-अलग उत्तरों ("हेलर्स" और "थर्डर्स") के लिए कट्टर वकील हैं। यह विश्वास, संभावना और कंडीशनिंग की प्रकृति के बारे में सवाल उठाता है, और लोगों को क्वांटम-मैकेनिकल "कई दुनिया" व्याख्या (अन्य विचित्र चीजों के बीच) को लागू करने का कारण बना है।
यहाँ विकिपीडिया का कथन है:
स्लीपिंग ब्यूटी स्वयंसेवकों को निम्नलिखित प्रयोग से गुजरना पड़ता है और निम्नलिखित सभी विवरणों के बारे में बताया जाता है। रविवार को उसे सोने के लिए रखा जाता है। एक प्रायोगिक प्रक्रिया निर्धारित करने के लिए एक उचित सिक्का फिर उछाला जाता है। यदि सिक्का सिर के ऊपर आता है, तो सौंदर्य जागृत होता है और सोमवार को उसका साक्षात्कार होता है, और फिर प्रयोग समाप्त हो जाता है। अगर सिक्का टिक जाता है, तो उसे सोमवार और मंगलवार को जगाया जाता है। लेकिन जब उसे सोमवार को फिर से सोने के लिए रखा जाता है, तो उसे एक भूलने की बीमारी की दवा दी जाती है जो यह सुनिश्चित करती है कि वह अपने पिछले जागरण को याद न कर सके। इस मामले में, मंगलवार को साक्षात्कार के बाद प्रयोग समाप्त हो गया।
किसी भी समय स्लीपिंग ब्यूटी को जागृत किया जाता है और उसका साक्षात्कार किया जाता है, उससे पूछा जाता है, "इस प्रस्ताव के लिए अब आपकी विश्वसनीयता क्या है कि सिक्का सिर पर उतरा?"
थिरडर स्थिति यह है कि एसबी को "1/3" का जवाब देना चाहिए (यह एक सरल बेस 'प्रमेय गणना) है और हैल्फर स्थिति यह है कि उसे "1/2" कहना चाहिए (क्योंकि यह एक उचित सिक्के के लिए सही संभावना है, जाहिर है! )। IMHO, पूरी बहस संभावना की सीमित समझ पर टिकी हुई है, लेकिन क्या यह स्पष्ट विरोधाभासों की खोज करने की पूरी बात नहीं है?
( प्रोजेक्ट गुटेनबर्ग से चित्रण ।)
यद्यपि यह विरोधाभासों को हल करने की कोशिश करने का स्थान नहीं है - केवल उन्हें बताने के लिए - मैं लोगों को फांसी पर नहीं छोड़ना चाहता हूं और मुझे यकीन है कि इस पृष्ठ के अधिकांश पाठक दार्शनिक स्पष्टीकरण के माध्यम से नहीं मिटना चाहते हैं। हम ईटी जेन्स से एक टिप ले सकते हैं , जो इस सवाल को बदल देता है कि "हम मानव सामान्य ज्ञान का गणितीय मॉडल कैसे बना सकते हैं" -जिसके बारे में हमें स्लीपिंग ब्यूटी समस्या के माध्यम से सोचने की ज़रूरत है - "हम एक मशीन कैसे बना सकते हैं जो एक आदर्श सामान्य ज्ञान को व्यक्त करते हुए स्पष्ट रूप से परिभाषित सिद्धांतों का पालन करते हुए उपयोगी प्रशंसनीय तर्क को आगे बढ़ाएगा? ”इस प्रकार, यदि आप चाहें, तो जेबी की सोच रोबोट द्वारा एसबी को प्रतिस्थापित करें। आप क्लोन कर सकते हैंइस रोबोट (प्रयोग करने के लिए मंगलवार के लिए एक काल्पनिक नशीली दवाओं के प्रशासन के बजाय), जिससे एसबी सेटअप का एक स्पष्ट मॉडल तैयार किया जा सके जिसका अनायास विश्लेषण किया जा सके। सांख्यिकीय निर्णय सिद्धांत का उपयोग करते हुए इसे एक मानक तरीके से मॉडलिंग करना, पता चलता है कि वास्तव में यहां दो प्रश्न पूछे जा रहे हैं ( क्या मौका है एक निष्पक्ष सिक्का भूमि का सिर? और क्या मौका है कि सिक्का उतरा है सिर, इस तथ्य पर सशर्त है कि आप थे? क्लोन जो जाग गया था? )। इसका उत्तर या तो 1/2 (पहले मामले में) या 1/3 (दूसरे में, बेयस प्रमेय का उपयोग करके) है। कोई क्वांटम यांत्रिक सिद्धांत इस समाधान में शामिल नहीं थे :-)।
अर्न्तेज़ेनियस, फ्रैंक (2002)। स्लीपिंग ब्यूटी पर विचार । विश्लेषण 62.1 पीपी 53-62। एल्गा, एडम (2000)। आत्म-विश्वास और स्लीपिंग ब्यूटी प्रॉब्लम। विश्लेषण 60 पीपी 143-7।
फ्रांसेची, पॉल (2005)। स्लीपिंग ब्यूटी एंड द प्रॉब्लम ऑफ वर्ल्ड रिडक्शन । प्रीप्रिंट।
ग्रिसमैन, बेरी (2007)। स्लीपिंग ब्यूटी का बुरा सपना ।
लुईस, डी (2001)। स्लीपिंग ब्यूटी: एल्गा का जवाब । विश्लेषण 61.3 पीपी 171-6।
पापिन्यू, डेविड और विक्टर ड्यूरा-विला (2008)। एक तिहाई और एक एवरेटियन: लुईस की 'क्वांटम स्लीपिंग ब्यूटी' का जवाब ।
पुस्ट, जोएल (2008)। स्लीपिंग ब्यूटी पर होरगन । सिंथेस 160 पीपी 97-101।
विनबर्ग, सुसान (शायद, 2003)। सौंदर्य की सावधानी कथा ।
सभी वेब पर पाए जा सकते हैं (या कम से कम कई साल पहले पाए गए थे)।
सेंट पीटर्सबर्ग विरोधाभास , बनाता है जो आप अवधारणा और के अर्थ पर अलग तरह से सोचने उम्मीद मूल्य । अंतर्ज्ञान (मुख्य रूप से लोगों के लिए के साथ और गणना सांख्यिकी में पृष्ठ भूमि) अलग परिणाम दे रहे हैं।
जेफ्रेय्स-लिंडले विरोधाभास है, जो पता चलता है कि कुछ परिस्थितियों में परिकल्पना परीक्षण के frequentist और बायेसियन तरीकों डिफ़ॉल्ट पूरी तरह से विरोधाभासी जवाब दे सकते हैं। यह वास्तव में उपयोगकर्ताओं को सोचने के लिए मजबूर करता है कि परीक्षण के इन रूपों का क्या मतलब है, और यह विचार करने के लिए कि वास्तव में क्या चाहते हैं। एक हालिया उदाहरण के लिए इस चर्चा को देखें ।
वहाँ प्रसिद्ध दो-लड़कियों की परम्परा है:
दो बच्चों वाले परिवार में, अगर कोई एक बच्चा एक लड़की है , तो दोनों बच्चे क्या हैं?
ज्यादातर लोग सहज रूप से कहते हैं 1/2
, लेकिन जवाब है 1/3
। मुद्दा, मौलिक रूप से, यह है कि एक समान रूप से "एक लड़की, सभी लड़कियों में से एक के साथ एक बहन" यादृच्छिक रूप से समान रूप से समान नहीं है " समान रूप से " एक परिवार, दो बच्चों वाले सभी परिवारों और कम से कम एक लड़की को चुनने के समान नहीं है । "
यह एक अंतर्ज्ञान के साथ मेष करने के लिए काफी सरल है, एक बार जब आप इसे समझते हैं, लेकिन अधिक जटिल संस्करण हैं जिन्हें समझना मुश्किल है:
दो बच्चों वाले परिवार में, क्या संभावनाएं हैं, अगर बच्चों में से एक मंगलवार को पैदा हुआ लड़का है , कि दोनों बच्चे लड़के हैं? (उत्तर: 13/27)
दो बच्चों वाले परिवार में, क्या संभावनाएं हैं, अगर बच्चों में से एक फ्लोरिडा नाम की लड़की है , कि दोनों बच्चे लड़कियां हैं? (उत्तर: 1/2 के बहुत करीब, "फ्लोरिडा" एक अत्यंत दुर्लभ नाम है)
इन सभी पहेलियों के बारे में अधिक जानकारी इस उत्तर में मिल सकती है ।
(यह भी: मंगलवार को पैदा हुए लड़के के बारे में अधिक जानकारी, फ्लोरिडा नाम की लड़की पर अधिक जानकारी )
1/3
नहीं है 2/3
? केवल एक आउटGB, BG, GG
क्षमा करें, लेकिन मैं खुद की मदद नहीं कर सकता (मैं भी, सांख्यिकीय विरोधाभास प्यार करता हूँ!)।
फिर, शायद प्रति विरोधाभास नहीं है और छोड़े गए चर पूर्वाग्रह का एक और उदाहरण है।
सहज कार्य-कारण / प्रतिगमन
एक समय की प्रवृत्ति वाला कोई भी चर दूसरे चर के साथ सहसंबद्ध होने वाला है जिसमें एक समय प्रवृत्ति भी है। उदाहरण के लिए, जन्म से 27 वर्ष की आयु तक मेरा वजन आपके जन्म से लेकर 27 वर्ष की आयु तक अत्यधिक सहसंबद्ध होने वाला है। जाहिर है, मेरा वजन आपके वजन के कारण नहीं है । अगर ऐसा होता, तो मैं पूछता था कि आप अधिक बार जिम जाते हैं, कृपया।
जब आप समय श्रृंखला विश्लेषण कर रहे होते हैं, तो आपको यह सुनिश्चित करने की आवश्यकता होती है कि आपके चर स्थिर हैं या आपको ये शानदार कार्य परिणाम मिलेंगे।
(मैं पूरी तरह से स्वीकार करता हूं कि मैंने यहां दिए गए अपने स्वयं के जवाब की सराहना की है ।)
मेरे पसंदीदा में से एक मोंटी हॉल समस्या है। मुझे याद है कि मैं इसके बारे में प्राथमिक सांख्यिकी वर्ग में सीख रहा था, अपने पिताजी को बता रहा था, क्योंकि हम दोनों अविश्वास में थे और मैंने यादृच्छिक संख्याओं का अनुकरण किया और हमने समस्या की कोशिश की। हमारे विस्मय के लिए यह सच था।
मूल रूप से यह समस्या बताती है कि यदि आपके पास गेम शो पर तीन दरवाजे हैं, जिसके पीछे एक पुरस्कार है और दूसरा दो कुछ भी नहीं है, यदि आपने एक दरवाजा चुना है और फिर शेष दो दरवाजों के बारे में बताया गया है तो दोनों में से एक पुरस्कार दरवाजा नहीं है और अपनी पसंद को स्विच करने की अनुमति दी यदि आपने चुना तो आपको वर्तमान दरवाजे को शेष दरवाजे पर स्विच करना चाहिए।
यहाँ एक आर सिमुलेशन के लिए लिंक है: लिंक
Parrondo का विरोधाभास:
से wikipdedia : "Parrondo विरोधाभास, गेम थ्योरी में एक विरोधाभास, के रूप में वर्णित किया गया है:। खोने रणनीति का एक संयोजन एक जीतने की रणनीति बन जाता है यह इसके निर्माता, जुआन Parrondo, जो 1996 ए में विरोधाभास की खोज के नाम पर है और अधिक व्याख्यात्मक विवरण है :
गेम के जोड़े मौजूद हैं, जिनमें से प्रत्येक जीतने की तुलना में खोने की अधिक संभावना है, जिसके लिए वैकल्पिक रूप से गेम खेलकर जीतने की रणनीति बनाना संभव है।
Parrondo ने ब्राउनियन शाफ़्ट के अपने विश्लेषण के संबंध में विरोधाभास को तैयार किया, एक मशीन के बारे में एक सोचा प्रयोग जो भौतिकविद् रिचर्ड फेनमैन द्वारा लोकप्रिय यादृच्छिक गर्मी गतियों से ऊर्जा निकाल सकता है। हालांकि, विरोधाभास गायब हो जाता है जब कड़ाई से विश्लेषण किया जाता है। "
एक और हालिया संबंधित विरोधाभास है जिसे " एलिसन मिश्रण " कहा जाता है , जिससे पता चलता है कि हम दो आईआईडी और गैर-सहसंबद्ध श्रृंखला ले सकते हैं, और बेतरतीब ढंग से उन्हें ऐसे हाथापाई कर सकते हैं कि कुछ मिश्रण गैर-शून्य ऑटोकैरेलेशन के साथ एक परिणामी श्रृंखला बना सकते हैं।
यह दिलचस्प है कि दो बाल समस्या और मोंटी हॉल समस्या अक्सर विरोधाभास के संदर्भ में एक साथ उल्लेख किया जाता है। दोनों 1889 में पहली बार एक स्पष्ट विरोधाभास का वर्णन करते हैं, जिसे बर्ट्रेंड का बॉक्स पैराडॉक्स कहा जाता है, जिसे या तो प्रतिनिधित्व करने के लिए सामान्यीकृत किया जा सकता है। मुझे यह एक सबसे दिलचस्प "विरोधाभास" लगता है क्योंकि एक ही अति-शिक्षित, बहुत-बुद्धिमान लोग इस विरोधाभास के संबंध में विपरीत तरीके से उन दो समस्याओं का जवाब देते हैं। यह ब्रिज जैसे कार्ड गेम में उपयोग किए जाने वाले सिद्धांत की तुलना करता है, जिसे प्रतिबंधित विकल्प के सिद्धांत के रूप में जाना जाता है, जहां यह संकल्प समय-परीक्षण किया जाता है।
कहो कि आपके पास एक यादृच्छिक रूप से चयनित आइटम है जिसे मैं "बॉक्स" कहूंगा। हर संभव बॉक्स में कम से कम दो सममित गुण होते हैं, लेकिन कुछ में दोनों होते हैं। मैं गुणों को "सोना" और "चांदी" कहूंगा। संभावना है कि एक बॉक्स सिर्फ सोना है पी; और चूंकि गुण सममित हैं, पी भी संभावना है कि एक बॉक्स सिर्फ चांदी है। यह संभावना बनाता है कि एक बॉक्स में सिर्फ एक संपत्ति 2P है, और संभावना है कि यह दोनों 1-2P है।
यदि आपको बताया जाए कि एक बॉक्स सोना है, लेकिन यह नहीं है कि यह चांदी है, तो आपको यह कहने के लिए लुभाया जा सकता है कि यह सिर्फ सोना है P / (P + (1-2P)) = P / (1-P)। लेकिन तब आपको एक-रंग के बॉक्स के लिए उसी संभावना को बताना होगा यदि आपको बताया गया था कि यह चांदी था। और अगर यह प्रायिकता P / (1-P) है, जब भी आपको सिर्फ एक रंग बताया जाता है, तो आपको P / (1-P) होना चाहिए, भले ही आपको रंग न बताया गया हो। फिर भी हम जानते हैं कि यह पिछले पैराग्राफ से 2 पी है।
इस स्पष्ट विरोधाभास को यह देखते हुए हल किया जाता है कि यदि एक बॉक्स में केवल एक ही रंग है, तो आपको किस रंग के बारे में नहीं बताया जाएगा। लेकिन अगर यह दो है, एक निहित विकल्प है। आपको यह जानना होगा कि प्रश्न का उत्तर देने के लिए वह विकल्प कैसे बनाया गया था, और यह स्पष्ट विरोधाभास की जड़ है। यदि आपको नहीं बताया गया है, तो आप केवल अनुमान लगा सकते हैं कि रंग यादृच्छिक रूप से चुना गया था, जिससे उत्तर P / (P + (1-2P) / 2) = 2P हो गया। यदि आप जोर देते हैं कि पी / (1-पी) उत्तर है, तो आप स्पष्ट रूप से मान रहे हैं कि कोई संभावना नहीं थी कि अन्य रंग का उल्लेख किया जा सकता था जब तक कि यह एकमात्र रंग नहीं था।
मोंटी हॉल समस्या में, रंगों के लिए सादृश्य बहुत सहज नहीं है, लेकिन पी = 1/3। दो बंद दरवाजे मूल रूप से समान रूप से होने की संभावना जा रहा है के आधार पर जवाब है पुरस्कार मानते हैं मोंटी हॉल दरवाजा उसने किया खोलने के लिए आवश्यक था, भले ही वह एक विकल्प नहीं था। वह उत्तर P / (1-P) = 1/2 है। जवाब उसे यादृच्छिक पर चुनने के लिए 2P = 2/3 संभावना है कि स्विचिंग जीत जाएगा के लिए अनुमति देता है।
टू चाइल्ड प्रॉब्लम में, मेरे सादृश्य में रंग काफी अच्छी तरह से लिंग की तुलना करते हैं। चार मामलों के साथ, पी = 1/4। प्रश्न का उत्तर देने के लिए, हमें यह जानना होगा कि यह कैसे निर्धारित किया गया था कि परिवार में एक लड़की थी। यदि उस विधि से परिवार के किसी लड़के के बारे में सीखना संभव था, तो उत्तर 2 पी = 1/2 है, न कि पी / (1-पी) = 1/3। यदि आप फ्लोरिडा नाम पर विचार करते हैं या "मंगलवार को पैदा हुए," तो यह थोड़ा अधिक जटिल है, लेकिन परिणाम समान हैं। यदि कोई विकल्प था, तो उत्तर बिल्कुल 1/2 है, और समस्या के अधिकांश कथन इस तरह के विकल्प का अर्थ लगाते हैं। और कारण "बदलते" 1/3 से 13/27 तक, या 1/3 से "लगभग 1/2", विरोधाभास और अचिंत्य लगता है, ऐसा इसलिए है क्योंकि कोई विकल्प नहीं है।
प्रतिबंधित विकल्प के सिद्धांत में, कहते हैं कि आप समान कार्ड के कुछ सेट को याद कर रहे हैं - जैसे कि जैक, क्वीन, और एक ही सूट के राजा। संभावना यह भी शुरू होती है कि कोई विशेष कार्ड किसी विशिष्ट प्रतिद्वंद्वी का है। लेकिन एक प्रतिद्वंद्वी के खेलने के बाद, दूसरों में से किसी एक के होने की उसकी संभावना कम हो जाती है क्योंकि अगर वह होता तो वह उस कार्ड को खेल सकता था।
मुझे पारिस्थितिक पतन का एक सरल चित्रमय चित्रण मिला है (यहाँ समृद्ध राज्य / गरीब राज्य मतदान विरोधाभास) मुझे सहज ज्ञान युक्त स्तर पर समझने में मदद करता है कि जब हम राज्य की आबादी को जोड़ते हैं तो हम मतदान पैटर्न का उलटा क्यों देखते हैं:
मान लीजिए कि आपने किसी राज्य के शाही परिवार में जन्म पर एक डेटा प्राप्त किया है। परिवार के पेड़ में प्रत्येक जन्म नोट किया गया था। इस परिवार के बारे में अजीब बात यह है कि माता-पिता केवल एक बच्चा पैदा करने की कोशिश कर रहे थे, जब पहला लड़का पैदा हुआ था और उसके बाद और बच्चे नहीं थे।
तो आपका डेटा संभावित रूप से इसी तरह दिखता है:
G G B
B
G G B
G B
G G G G G G G G G B
etc.
क्या इस नमूने में लड़कों और लड़कियों का अनुपात लड़के को जन्म देने की सामान्य संभावना को दर्शाता है (0.5 का कहना है)? उत्तर और स्पष्टीकरण इस सूत्र में पाया जा सकता है ।
यह सिम्पसन का विरोधाभास है लेकिन 'बैकवर्ड' के साथ-साथ आगे की ओर, यहूदिया पर्ल की नई किताब कॉसल इनविटेशन इन स्टैटिस्टिक्स: ए प्राइमर [^ 1] से आया है।
क्लासिक सिम्पोन का विरोधाभास निम्नानुसार काम करता है: दो डॉक्टरों के बीच चयन करने की कोशिश पर विचार करें। आप स्वचालित रूप से सर्वश्रेष्ठ परिणामों के साथ एक का चयन करते हैं। लेकिन लगता है कि सबसे अच्छे परिणामों के साथ एक सबसे आसान मामलों को चुनता है। दूसरे के घटिया रिकॉर्ड चालबाज काम का परिणाम है।
अब आप किसे चुनते हैं? कठिनाई से स्तरीकृत परिणामों को देखने के लिए बेहतर है और फिर निर्णय लें।
सिक्के का एक और पक्ष (एक और विरोधाभास) है जो कहता है कि स्तरीकृत परिणाम आपको गलत विकल्प पर भी ले जा सकते हैं।
इस बार एक दवा का उपयोग करने या नहीं चुनने पर विचार करें। दवा का एक विषैला दुष्प्रभाव होता है, लेकिन इसकी चिकित्सीय क्रिया रक्तचाप को कम करने के माध्यम से होती है। कुल मिलाकर, दवा आबादी में परिणामों में सुधार करती है, लेकिन जब उपचार के बाद रक्तचाप पर स्तरीकरण होता है, तो निम्न और उच्च रक्तचाप दोनों समूहों में परिणाम बदतर होते हैं। यह सच कैसे हो सकता है? क्योंकि हम अनजाने में परिणाम पर स्तरीकृत हो गए हैं, और प्रत्येक परिणाम के भीतर जो सभी निरीक्षण करना बाकी है, वह विषाक्त दुष्प्रभाव है।
स्पष्ट करने के लिए, कल्पना करें कि दवा टूटे हुए दिलों को ठीक करने के लिए डिज़ाइन की गई है, और यह रक्तचाप को कम करके करता है, और रक्तचाप को कम करने के बजाय हम निश्चित दिलों पर स्तरीकरण करते हैं। जब दवा काम करती है, तो दिल तय हो जाता है (और रक्तचाप कम होगा), लेकिन कुछ रोगियों को विषाक्त दुष्प्रभाव भी मिलेगा। क्योंकि दवा काम करती है, 'निश्चित हृदय' समूह में अधिक मरीज होंगे जिन्होंने दवा ली होगी, क्योंकि मरीज 'टूटे हुए' हृदय समूह में दवा ले रहे हैं। दवा लेने वाले अधिक रोगियों का मतलब है कि अधिक रोगियों को साइड इफेक्ट हो रहा है, और स्पष्ट रूप से (लेकिन झूठा) उन रोगियों के लिए बेहतर परिणाम है जो दवा नहीं लेते थे।
जिन रोगियों को दवा लेने के बिना बेहतर हो जाता है वे सिर्फ भाग्यशाली हैं। जिन रोगियों ने दवा ली और वे बेहतर हुए, उन लोगों का एक मिश्रण है जिन्हें बेहतर होने के लिए दवा की आवश्यकता थी, और जो वैसे भी भाग्यशाली होंगे। केवल 'निश्चित दिल' वाले रोगियों की जांच करने का मतलब है कि जिन रोगियों को ठीक किया गया था, उन्हें छोड़कर उन्होंने दवा ली थी। ऐसे रोगियों को बाहर करने का मतलब है कि दवा न लेने से होने वाले नुकसान को छोड़कर, जिसका अर्थ है कि हम केवल दवा लेने से होने वाले नुकसान को देखते हैं ।
सिम्पसन का विरोधाभास तब उत्पन्न होता है जब उपचार के अलावा किसी अन्य परिणाम का कारण होता है जैसे कि तथ्य यह है कि आपका डॉक्टर केवल मुश्किल मामलों को करता है। सामान्य कारण (मुश्किल बनाम आसान मामलों) के लिए नियंत्रित करना हमें सही प्रभाव देखने की अनुमति देता है। बाद के उदाहरण में, हमने अनजाने में एक परिणाम पर स्तरीकृत किया है न कि एक ऐसे कारण पर जिसका सही उत्तर समुच्चय में है न कि स्तरीकृत डेटा।
[^ 1]: सांख्यिकी में पर्ल जे। जॉन विले एंड संस; 2016
मेरे "पसंदीदा" में से एक, जिसका अर्थ है कि यह वही है जो मुझे कई अध्ययनों की व्याख्या के बारे में पागल करता है (और अक्सर लेखकों द्वारा खुद को, न कि केवल मीडिया) सर्वाइवरशिप बायस का ।
यह कल्पना करने का एक तरीका यह है कि कुछ प्रभाव है जो विषयों के लिए बहुत हानिकारक है, इतना है कि यह उन्हें मारने का एक बहुत अच्छा मौका है। यदि अध्ययन से पहले विषयों को इस आशय से अवगत कराया जाता है , तो समय के अध्ययन के शुरू होने से, जो विषय अभी भी जीवित हैं, उनके असामान्य रूप से लचीला होने की बहुत अधिक संभावना है। काम पर सचमुच प्राकृतिक चयन। जब ऐसा होता है, तो अध्ययन से पता चलता है कि उजागर किए गए विषय असामान्य रूप से स्वस्थ हैं (चूंकि सभी अस्वास्थ्यकर पहले से ही मर चुके हैं या प्रभाव के संपर्क में आने से रोकना सुनिश्चित करते हैं)। यह अक्सर गलत समझा जाता है क्योंकि यह समझा जाता है कि एक्सपोज़र वास्तव में विषयों के लिए अच्छा है । यह छंटनी की अनदेखी का परिणाम है (अर्थात उन विषयों को अनदेखा करना जो मर गए और अध्ययन के लिए नहीं बने)।
इसी तरह, जो विषय अध्ययन के दौरान प्रभाव के संपर्क में आ रहे हैं, वे अक्सर अविश्वसनीय रूप से अस्वस्थ होते हैं: ऐसा इसलिए है क्योंकि उन्होंने महसूस किया है कि निरंतर संपर्क संभवतः उन्हें मार देगा। लेकिन अध्ययन केवल यह देखता है कि जो लोग छोड़ते हैं वे बहुत अस्वस्थ हैं!
@ WWII बमवर्षकों के बारे में चार्ली के जवाब को इसके उदाहरण के रूप में सोचा जा सकता है, लेकिन आधुनिक उदाहरण भी बहुत हैं। एक हालिया उदाहरण अध्ययन की रिपोर्ट है कि एक दिन में 8+ कप कॉफी पीना है(!!) 55 वर्ष से अधिक उम्र के विषयों में बहुत अधिक हृदय स्वास्थ्य से जुड़ा हुआ है। अध्ययन के लेखकों सहित पीएचडी वाले बहुत से लोगों ने इसे "कॉफी पीना आपके दिल के लिए अच्छा है!" के रूप में व्याख्या की है। मैंने इसे पढ़ा क्योंकि आपके पास 55 साल की उम्र के एक दिन बाद भी 8 कप कॉफी पीने के लिए एक अविश्वसनीय रूप से स्वस्थ हृदय होना चाहिए और दिल का दौरा नहीं होना चाहिए। यहां तक कि अगर यह आपको नहीं मारता है, तब भी जब कुछ आपके स्वास्थ्य के बारे में चिंताजनक लगता है, तो हर कोई जो आपसे प्यार करता है (साथ ही आपका डॉक्टर) आपको तुरंत कॉफी पीने के लिए प्रोत्साहित करेगा। आगे के अध्ययन में पाया गया कि इतनी अधिक मात्रा में कॉफी पीने से युवा समूहों में कोई लाभकारी प्रभाव नहीं पड़ा, जो मुझे लगता है कि अधिक प्रमाण है कि हम सकारात्मक प्रभाव के बजाय एक जीवित प्रभाव देख रहे हैं। फिर भी पीएचडी के बारे में बहुत कुछ कह रहा है "
मुझे आश्चर्य है कि किसी ने भी न्यूकॉम्ब के विरोधाभास का उल्लेख नहीं किया है, हालांकि यह निर्णय सिद्धांत में अधिक चर्चा है। यह निश्चित रूप से मेरे पसंदीदा में से एक है।
चलो x, y और z असंबंधित वैक्टर हैं। फिर भी x / z और y / z सहसंबद्ध होंगे।