सबसे दिलचस्प सांख्यिकीय विरोधाभास

112

क्योंकि मैं उन्हें आकर्षक लगता हूं, मैं यह सुनना चाहता हूं कि इस समुदाय के लोग सबसे दिलचस्प सांख्यिकीय विरोधाभास और क्यों पाते हैं।

paradox

— निक
स्रोत

1

कुछ छोटे उदाहरण, विशेष रूप से सर्वेक्षण के संदर्भ में, यहाँ: filipspagnoli.wordpress.com/category/statistics/…

— चार्ली

100

यह प्रति विरोधाभास नहीं है , लेकिन कम से कम पहली बार में यह एक अजीब टिप्पणी है।

द्वितीय विश्व युद्ध के दौरान, अब्राहम वाल्ड अमेरिकी सरकार के लिए एक सांख्यिकीविद थे। उसने उन बमवर्षकों को देखा जो मिशन से लौटे थे और विमानों पर गोली के "घाव" के पैटर्न का विश्लेषण किया था। उन्होंने सिफारिश की कि नौसेना उन क्षेत्रों को सुदृढ़ करती है जहां विमानों को कोई नुकसान नहीं हुआ।

क्यों? हमारे पास काम पर चयन प्रभाव है । इस नमूने से पता चलता है कि देखे गए क्षेत्रों में सूजन को नुकसान पहुंचाया जा सकता है। या तो विमानों को कभी भी अछूते क्षेत्रों में नहीं मारा गया था, एक असंभावित प्रस्ताव, या उन हिस्सों पर हमले घातक थे। हम उन विमानों की परवाह करते हैं जो नीचे गए, न कि केवल वे जो वापस आए। जिन लोगों के गिरने की संभावना थी, वे ऐसे स्थान पर हमला करते थे जो जीवित रहने वालों से अछूता था।

उनके मूल ज्ञापन की प्रतियों के लिए, यहाँ देखें । अधिक आधुनिक अनुप्रयोग के लिए, यह वैज्ञानिक अमेरिकी ब्लॉग पोस्ट देखें ।

एक विषय पर विस्तार, इस ब्लॉग पोस्ट के अनुसार , प्रथम विश्व युद्ध के दौरान, एक टिन हेलमेट की शुरूआत ने एक मानक कपड़ा टोपी की तुलना में अधिक सिर के घावों को जन्म दिया । क्या सैनिकों के लिए नया हेलमेट खराब था? नहीं; हालांकि चोटें अधिक थीं, घातक परिणाम कम थे।

— चार्ली
स्रोत

3

मुझे याद है कि यह पहले कुछ स्थानों में पढ़ा है, लेकिन मेरे पास कोई संदर्भ नहीं है। क्या कोई ऐसा है जिसे आप जोड़ सकते हैं?

— कार्डिनल

1

@ कार्डिनल, मुझे आपके लिए कुछ मेमो मिले। लगता है कि अनुसंधान वास्तव में अमेरिका के लिए था

— चार्ली

कहीं न कहीं, इस उदाहरण के लिए एक काल्पनिक हवाई जहाज का विस्तार है, लेकिन मुझे यह नहीं मिल रहा है।

— फोमाइट

+1। यह सर्वाइवरशिप बायस का उदाहरण है , शायद पक्षपात का सबसे हानिकारक है। मैंने एक उत्तर में उस पर विस्तार किया।

— क्लिफ एबी

47

एक अन्य उदाहरण पारिस्थितिक पतन है ।

उदाहरण
मान लीजिए कि हम एक राज्य की औसत आय (हजारों में) पर तत्कालीन-सीनेटर ओबामा के लिए वोट शेयर हासिल करके मतदान और आय के बीच संबंध की तलाश करते हैं। हमें लगभग 20 का अवरोधन और 0.61 का ढलान गुणांक प्राप्त होता है।

कई लोग इस परिणाम की व्याख्या करते हुए कहेंगे कि उच्च आय वाले लोगों को डेमोक्रेट के लिए वोट करने की अधिक संभावना है; वास्तव में, लोकप्रिय प्रेस पुस्तकों ने यह तर्क दिया है।

लेकिन रुकिए, मैंने सोचा कि अमीर लोगों के रिपब्लिकन होने की संभावना अधिक थी? वो हैं।

यह प्रतिगमन वास्तव में हमें बता रहा है कि अमीर राज्यों में एक डेमोक्रेट के लिए वोट करने की अधिक संभावना है और गरीब राज्यों में एक रिपब्लिकन के लिए वोट करने की अधिक संभावना है। किसी दिए गए राज्य के भीतर , अमीर लोगों को रिपब्लिकन वोट करने की अधिक संभावना है और गरीब लोगों को डेमोक्रेट वोट करने की अधिक संभावना है। एंड्रयू जेलमैन और उनके सहयोगियों का काम देखें ।

आगे की मान्यताओं के बिना, हम व्यक्तिगत-स्तर के व्यवहार के बारे में निष्कर्ष बनाने के लिए समूह-स्तरीय (कुल) डेटा का उपयोग नहीं कर सकते हैं। यह पारिस्थितिक पतन है। समूह-स्तरीय डेटा ही हमें समूह-स्तरीय व्यवहार के बारे में बता सकता है।

व्यक्तिगत-स्तरीय निष्कर्षों के लिए छलांग लगाने के लिए, हमें कब्ज धारणा की आवश्यकता है । यहां, व्यक्तियों की मतदान पसंद किसी राज्य की औसत आय के साथ व्यवस्थित रूप से भिन्न नहीं होती है; एक व्यक्ति जो अमीर राज्य में $ X कमाता है , उसे डेमोक्रेट के लिए वोट करने की संभावना होनी चाहिए क्योंकि कोई व्यक्ति जो गरीब राज्य में $ X कमाता है । लेकिन कनेक्टिकट के लोग, सभी आय स्तरों पर, उन्हीं आय स्तरों पर मिसिसिपी के लोगों की तुलना में डेमोक्रेट के लिए वोट करने की अधिक संभावना है । इसलिए, संगतता धारणा का उल्लंघन किया जाता है और हम गलत निष्कर्ष ( एकत्रीकरण पूर्वाग्रह से मूर्ख ) के लिए नेतृत्व कर रहे हैं ।

यह विषय दिवंगत डेविड फ्रीडमैन का लगातार शौक था ; उदाहरण के लिए इस पेपर को देखें । उस पत्र में, फ्रीडमैन समूह डेटा का उपयोग करके व्यक्तिगत-स्तर की संभावनाओं को बाध्य करने के लिए एक साधन प्रदान करता है।

सिम्पसन के विरोधाभास की तुलना
इस सीडब्ल्यू में कहीं और की गई, @ मिचेल ने सिम्पसन के विरोधाभास को एक अच्छे उदाहरण के रूप में प्रस्तावित किया, जैसा कि वास्तव में है। सिम्पसन की विडंबना और पारिस्थितिक पतन निकटता से संबंधित हैं, फिर भी अलग हैं। दो उदाहरण दिए गए डेटा के विश्लेषण और उपयोग किए गए विश्लेषणों में भिन्न होते हैं।

सिम्पसन के विरोधाभास का मानक सूत्रीकरण दो-तरफ़ा तालिका है। हमारे उदाहरण में, मान लें कि हमारे पास व्यक्तिगत डेटा है और हम प्रत्येक व्यक्ति को उच्च या निम्न आय के रूप में वर्गीकृत करते हैं। हमें कुल योगों की आय-दर-वोट 2x2 आकस्मिक तालिका मिलेगी। हम देखेंगे कि कम आय वाले लोगों के हिस्से के सापेक्ष उच्च आय वाले लोगों के एक उच्च हिस्से ने डेमोक्रेट के लिए मतदान किया। हम प्रत्येक राज्य के लिए एक आकस्मिक तालिका बनाने के लिए थे, हालांकि, हम विपरीत पैटर्न देखेंगे।

पारिस्थितिक पतन में, हम आय को एक द्विध्रुवीय (या शायद बहुभिन्नरूपी) चर में नहीं ढोते हैं। राज्य-स्तर प्राप्त करने के लिए, हमें औसत (या मध्य) राज्य की आय और राज्य के वोट शेयर मिलते हैं और एक प्रतिगमन चलाते हैं और पाते हैं कि उच्च आय वाले राज्यों में डेमोक्रेट के लिए वोट करने की अधिक संभावना है। यदि हमने व्यक्तिगत स्तर के डेटा को रखा और राज्य द्वारा अलग से प्रतिगमन को चलाया, तो हमें इसका विपरीत प्रभाव मिलेगा।

सारांश में, अंतर हैं:

विश्लेषण का तरीका : हम कह सकते हैं कि हमारे एसएटी प्रीप कौशल के बाद, सिम्पसन की विडंबना आकस्मिक तालिकाओं के रूप में है, क्योंकि पारिस्थितिक पतनशीलता सहसंबंधों और प्रतिगमन को मान्यता देती है।
आंकड़ों के एकत्रीकरण / प्रकृति की डिग्री : सिम्पसन की विरोधाभास उदाहरण जबकि (बनाम कम आय वाले व्यक्तियों के लिए एक ही उच्च आय वाले व्यक्तियों के बीच डेमोक्रेट वोट शेयर) दो नंबर तुलना, पारिस्थितिक भ्रम 50 डेटा बिंदुओं (का उपयोग करता है यानी , प्रत्येक राज्य) एक सहसंबंध गुणांक की गणना करने के । सिम्पसन के विरोधाभास उदाहरण से पूरी कहानी प्राप्त करने के लिए, हमें केवल पचास राज्यों (100 नंबर) में से प्रत्येक से दो नंबरों की आवश्यकता होगी, जबकि पारिस्थितिक पतन मामले में, हमें व्यक्तिगत स्तर के डेटा की आवश्यकता है (या फिर दिया जाना चाहिए) राज्य-स्तरीय सहसंबंध / प्रतिगमन ढलान)।

सामान्य अवलोकन
@NeilG टिप्पणी करता है कि यह सिर्फ यह कह रहा है कि आपके प्रतिगमन में अप्राप्य / अस्तव्यस्त चर पूर्वाग्रह मुद्दों पर आपका कोई चयन नहीं हो सकता है। ये सही है! कम से कम प्रतिगमन संदर्भ में, मुझे लगता है कि लगभग किसी भी "विरोधाभास" केवल छोड़े गए चर पूर्वाग्रह का एक विशेष मामला है।

चयन पूर्वाग्रह (इस सीडब्ल्यू पर मेरी अन्य प्रतिक्रिया देखें) चयन को चलाने वाले चर को शामिल करके नियंत्रित किया जा सकता है। बेशक, ये चर आम तौर पर अप्रमाणित होते हैं, समस्या / विरोधाभास को बढ़ाते हैं। एक समय की प्रवृत्ति को जोड़कर स्थानिक प्रतिगमन (मेरी अन्य प्रतिक्रिया) को दूर किया जा सकता है। ये मामले कहते हैं, अनिवार्य रूप से, आपके पास पर्याप्त डेटा है, लेकिन अधिक भविष्यवक्ताओं की आवश्यकता है।

पारिस्थितिक गिरावट के मामले में, यह सच है, आपको अधिक भविष्यवक्ताओं (यहां, राज्य-विशिष्ट ढलान और अंतःक्षेपण) की आवश्यकता है। लेकिन आपको इन संबंधों का अनुमान लगाने के लिए समूह-स्तर, टिप्पणियों के साथ -साथ व्यक्तिगत टिप्पणियों की भी अधिक आवश्यकता है ।

(संयोग से, यदि आपके पास चरम चयन है जहां चयन चर पूरी तरह से उपचार और नियंत्रण को विभाजित करता है, जैसा कि WWII उदाहरण में मैंने दिया है, तो आपको प्रतिगमन का अनुमान लगाने के लिए और अधिक डेटा की आवश्यकता हो सकती है; वहां, नीचे के विमान।)

— चलता है
स्रोत

स्थिरता धारणा को औपचारिक रूप देना कैसे संभव है ? ऐसा लगता है कि किसी के मॉडल से कोई भी (कारण) भ्रमित नहीं हैं।

— नील जी

2

इसके अलावा, प्रदान किया गया उदाहरण सिम्पसन के विरोधाभास का एक उदाहरण भी है क्योंकि राज्य पर कंडीशनिंग आय और पार्टी के बीच संबंध को उलट देती है। सिम्पसन के विरोधाभास से अलग पारिस्थितिक पतन कब होता है?

— नील जी

मैं यह भी इंगित करूंगा कि समूह-स्तरीय संघों या व्यक्तिगत स्तर के संघों या कारण संबंधों के आधार पर कार्यवाहियों के बारे में अनुमान लगाना भी एक बुरा है: परमाणु-पतन, अच्छी तरह से यहाँ स्पष्ट: [डायज़-रौक्स, 1998: डायज़-रौक्स, एवी बिंदु (1998)। महामारी विज्ञान में संदर्भ वापस लाना: बहुस्तरीय विश्लेषण में चर और पतन। अमेरिकन जर्नल ऑफ पब्लिक हेल्थ , 88 (2): 216–222।

— एलेक्सिस

43

मेरा योगदान सिम्पसन की विडंबना है क्योंकि:

विरोधाभास के कारण कई लोगों के लिए सहज नहीं हैं, इसलिए
यह स्पष्ट रूप से समझाना कठिन हो सकता है कि निष्कर्ष सादे अंग्रेजी में लोगों को बिछाने के तरीके क्यों हैं।

विरोधाभास का tl; dr संस्करण: किसी परिणाम का सांख्यिकीय महत्व इस बात पर निर्भर करता है कि डेटा का विभाजन कैसे किया जाता है। कारण अक्सर एक चर चर के कारण प्रतीत होता है।

विरोधाभास की एक और अच्छी रूपरेखा यहाँ है ।

— मिशेल
स्रोत

4

+1, मैंने सोचा कि मैं खुद इसे डालूं। : जो रुचि रखते हैं के लिए, सिम्पसन की विरोधाभास भी यहाँ सीवी पर चर्चा की है stats.stackexchange.com/questions/21896

— गुंग

3

इस गणित में उल्लेखित सिम्पसन के विरोधाभास के कुछ उदाहरण हैं ।

— माइक स्पाइवे

32

आंकड़ों में कोई विरोधाभास नहीं है, केवल पहेली को हल करने की प्रतीक्षा है।

फिर भी, मेरा पसंदीदा दो लिफाफा "विरोधाभास" है । मान लीजिए कि मैंने आपके सामने दो लिफाफे रखे और आपको बताऊं कि एक में दूसरे के मुकाबले दोगुना पैसा होता है (लेकिन जो नहीं है)। आप निम्नानुसार कारण। मान लें कि बाएं लिफ़ाफ़े में , तो 50% प्रायिकता के साथ दायें लिफ़ाफ़े में होता है और 50% प्रायिकता के साथ इसमें होता है , जिसका अपेक्षित मान । लेकिन निश्चित रूप से आप केवल लिफाफे को उलट सकते हैं और समाप्त कर सकते हैं इसके बजाय बाएं लिफाफे में दाएं लिफाफे का मूल्य गुना है। क्या हुआ? $x$ $2x$ $0.5x$ $1.25x$ $1.25$

— एलेक्स फ्लिंट
स्रोत

शानदार विरोधाभास - दिलचस्प रूप से अगर हम विकिपीडिया पर "दूसरी" व्याख्या के साथ जाते हैं और गणना करने की कोशिश करते हैं, तो हम पाते हैं कि स्विच करने के लिए वरीयता को रोकने के लिए हमें जहाँ | लिए हल करने का अर्थ है कि हमें । इसी तरह हम जहाँ गणना कर सकते हैं और .... बिज़ारे!

E [B | A = a]

$E[B|A=a]$

E [B | A = a] = a = 2 a p + \frac{a}{2} (1 - p)

$E[B|A=a]=a=2ap+\frac{a}{2}(1-p)$

p = P r (A < B | A = a)

$p=Pr(A<B|A=a)$

p

$p$

p = \frac{1}{3}

$p=\frac{1}{3}$

E [A | B = b] = b = 2 b q + \frac{b}{2} (1 - q)

$E[A|B=b]=b=2bq+\frac{b}{2}(1-q)$

q = P r (B < A | B = b)

$q=Pr(B<A|B=b)$

q = \frac{1}{3}

$q=\frac{1}{3}$

— संभाव्यताविषयक

6

मैंने इस विरोधाभास पर प्रस्तुतियाँ दी हैं जिसमें खेल वास्तव में दर्शकों के साथ खेला जाता है, जिसमें वास्तविक धनराशि होती है (आमतौर पर मेजबान संस्था को एक चेक)। यह उनका ध्यान जाता है ...

— whuber

सोचें कि मैंने इसे हल किया है ... विरोधाभास तब हल किया जाता है जब हम दो लिफाफे को पहचानते हैं कि विरोधाभास गलत तरीके से 1 का प्रस्ताव करता है) तीन संभव मात्राएं हैं: 0.5x, x और 2x, जब लिफाफे में केवल दो मात्राएं होती हैं (जैसे x) 2x), और 2) कि हम एक प्राथमिकता जानते हैं कि बाएं लिफाफे में x होता है (जिस स्थिति में दाहिने लिफाफे में 2x होता है उसमें 100% निश्चितता होती है!)। X और 2x के संभावित मानों को दो लिफाफों को बेतरतीब ढंग से सौंपा गया है, सही उत्तर 1.5x का एक अपेक्षित मूल्य है चाहे मैं बाएं लिफाफा या दायां लिफाफा चुनूं।

— राबर्टएफ

3

@RobertF स्थिति अधिक जटिल है। मान लीजिए कि यह ज्ञात है कि पैसा दो लिफाफे में निम्नानुसार वितरित किया गया है। एक उचित सिक्के को तब तक उछालें जब तक कि वह सिर को न गिन ले और उस संख्या को गिन लें जब सिक्का उछाला गया था। एक लिफाफे में 2 ^ n डॉलर और दूसरे में 2 ^ (n + 1) रखें। अब आप बहुत सटीक उम्मीद की गणना कर सकते हैं और अभी भी विरोधाभास को बनाए रख सकते हैं।

— इत्तय वीस

31

द स्लीपिंग ब्यूटी प्रॉब्लम ।

यह एक हालिया आविष्कार है; पिछले दशक में दर्शन पत्रिकाओं के एक छोटे समूह के भीतर इसकी बहुत चर्चा हुई। दो अलग-अलग उत्तरों ("हेलर्स" और "थर्डर्स") के लिए कट्टर वकील हैं। यह विश्वास, संभावना और कंडीशनिंग की प्रकृति के बारे में सवाल उठाता है, और लोगों को क्वांटम-मैकेनिकल "कई दुनिया" व्याख्या (अन्य विचित्र चीजों के बीच) को लागू करने का कारण बना है।

यहाँ विकिपीडिया का कथन है:

स्लीपिंग ब्यूटी स्वयंसेवकों को निम्नलिखित प्रयोग से गुजरना पड़ता है और निम्नलिखित सभी विवरणों के बारे में बताया जाता है। रविवार को उसे सोने के लिए रखा जाता है। एक प्रायोगिक प्रक्रिया निर्धारित करने के लिए एक उचित सिक्का फिर उछाला जाता है। यदि सिक्का सिर के ऊपर आता है, तो सौंदर्य जागृत होता है और सोमवार को उसका साक्षात्कार होता है, और फिर प्रयोग समाप्त हो जाता है। अगर सिक्का टिक जाता है, तो उसे सोमवार और मंगलवार को जगाया जाता है। लेकिन जब उसे सोमवार को फिर से सोने के लिए रखा जाता है, तो उसे एक भूलने की बीमारी की दवा दी जाती है जो यह सुनिश्चित करती है कि वह अपने पिछले जागरण को याद न कर सके। इस मामले में, मंगलवार को साक्षात्कार के बाद प्रयोग समाप्त हो गया।

किसी भी समय स्लीपिंग ब्यूटी को जागृत किया जाता है और उसका साक्षात्कार किया जाता है, उससे पूछा जाता है, "इस प्रस्ताव के लिए अब आपकी विश्वसनीयता क्या है कि सिक्का सिर पर उतरा?"

थिरडर स्थिति यह है कि एसबी को "1/3" का जवाब देना चाहिए (यह एक सरल बेस 'प्रमेय गणना) है और हैल्फर स्थिति यह है कि उसे "1/2" कहना चाहिए (क्योंकि यह एक उचित सिक्के के लिए सही संभावना है, जाहिर है! )। IMHO, पूरी बहस संभावना की सीमित समझ पर टिकी हुई है, लेकिन क्या यह स्पष्ट विरोधाभासों की खोज करने की पूरी बात नहीं है?

प्रिंस फ्लोरिमोंड द स्लीपिंग ब्यूटी

( प्रोजेक्ट गुटेनबर्ग से चित्रण ।)

यद्यपि यह विरोधाभासों को हल करने की कोशिश करने का स्थान नहीं है - केवल उन्हें बताने के लिए - मैं लोगों को फांसी पर नहीं छोड़ना चाहता हूं और मुझे यकीन है कि इस पृष्ठ के अधिकांश पाठक दार्शनिक स्पष्टीकरण के माध्यम से नहीं मिटना चाहते हैं। हम ईटी जेन्स से एक टिप ले सकते हैं , जो इस सवाल को बदल देता है कि "हम मानव सामान्य ज्ञान का गणितीय मॉडल कैसे बना सकते हैं" -जिसके बारे में हमें स्लीपिंग ब्यूटी समस्या के माध्यम से सोचने की ज़रूरत है - "हम एक मशीन कैसे बना सकते हैं जो एक आदर्श सामान्य ज्ञान को व्यक्त करते हुए स्पष्ट रूप से परिभाषित सिद्धांतों का पालन करते हुए उपयोगी प्रशंसनीय तर्क को आगे बढ़ाएगा? ”इस प्रकार, यदि आप चाहें, तो जेबी की सोच रोबोट द्वारा एसबी को प्रतिस्थापित करें। आप क्लोन कर सकते हैंइस रोबोट (प्रयोग करने के लिए मंगलवार के लिए एक काल्पनिक नशीली दवाओं के प्रशासन के बजाय), जिससे एसबी सेटअप का एक स्पष्ट मॉडल तैयार किया जा सके जिसका अनायास विश्लेषण किया जा सके। सांख्यिकीय निर्णय सिद्धांत का उपयोग करते हुए इसे एक मानक तरीके से मॉडलिंग करना, पता चलता है कि वास्तव में यहां दो प्रश्न पूछे जा रहे हैं ( क्या मौका है एक निष्पक्ष सिक्का भूमि का सिर? और क्या मौका है कि सिक्का उतरा है सिर, इस तथ्य पर सशर्त है कि आप थे? क्लोन जो जाग गया था? )। इसका उत्तर या तो 1/2 (पहले मामले में) या 1/3 (दूसरे में, बेयस प्रमेय का उपयोग करके) है। कोई क्वांटम यांत्रिक सिद्धांत इस समाधान में शामिल नहीं थे :-)।

संदर्भ

अर्न्तेज़ेनियस, फ्रैंक (2002)। स्लीपिंग ब्यूटी पर विचार । विश्लेषण 62.1 पीपी 53-62। एल्गा, एडम (2000)। आत्म-विश्वास और स्लीपिंग ब्यूटी प्रॉब्लम। विश्लेषण 60 पीपी 143-7।

फ्रांसेची, पॉल (2005)। स्लीपिंग ब्यूटी एंड द प्रॉब्लम ऑफ वर्ल्ड रिडक्शन । प्रीप्रिंट।

ग्रिसमैन, बेरी (2007)। स्लीपिंग ब्यूटी का बुरा सपना ।

लुईस, डी (2001)। स्लीपिंग ब्यूटी: एल्गा का जवाब । विश्लेषण 61.3 पीपी 171-6।

पापिन्यू, डेविड और विक्टर ड्यूरा-विला (2008)। एक तिहाई और एक एवरेटियन: लुईस की 'क्वांटम स्लीपिंग ब्यूटी' का जवाब ।

पुस्ट, जोएल (2008)। स्लीपिंग ब्यूटी पर होरगन । सिंथेस 160 पीपी 97-101।

विनबर्ग, सुसान (शायद, 2003)। सौंदर्य की सावधानी कथा ।

सभी वेब पर पाए जा सकते हैं (या कम से कम कई साल पहले पाए गए थे)।

— whuber
स्रोत

1

क्या आपको लगता है कि "आधार इकाइयों" के संदर्भ में समाधान तैयार करना समान रूप से प्रभावी है? मेरा मतलब है कि, आपको यह विचार करना होगा कि आधार इकाई व्यक्ति है, या साक्षात्कार। 1/2 व्यक्तियों का एक सिर होगा, लेकिन 1/3 साक्षात्कार होंगे। फिर अपनी आधार इकाई को चुनने के लिए, हम इस प्रश्न और वाक्यांश को फिर से बता सकते हैं कि "क्या मौका है कि यह साक्षात्कार एक 'प्रमुख' परिणाम से जुड़ा है?"

— जोनाथन

1

एसबी को यह नहीं पता है कि उसके कितने इंटरव्यू हुए हैं और सवाल उसके प्रायिकता के आकलन का है, एक्सपेरिमेंट के आकलन का नहीं। उसके दृष्टिकोण से, साक्षात्कार की संख्या निर्धारित नहीं की जा सकती है।

— whuber

2

मुझे लगता है कि आपको पहले साहित्य में, हारून के तर्कों को पढ़ना चाहिए। (मैं कबूल है कि मैं एक thirder हूँ, लेकिन मुझे लगता है कि halfers समझाने कम से कम, आप उन्हें दिखाने के लिए क्यों उनके तर्क से दोषपूर्ण है की जरूरत है अपने तर्क नहीं मिलेगा।।)

— whuber

1

फेयर पॉइंट, @whuber, मैंने अब साहित्य पर एक और नज़र डाली है। मैं एलिस की स्लीपिंग ब्यूटी पढ़ रहा हूं : एल्गा का जवाब । यह वह वाक्य है जो मुझे चिंतित करता है, खंड '4 की शुरुआत में। मेरा तर्क ’। "केवल नए प्रासंगिक साक्ष्य, केंद्रित या अप्रमाणित, विश्वसनीयता में परिवर्तन पैदा करते हैं"। मैं आगे सोचूंगा और शायद इसके बारे में फिर से ब्लॉग करूं। इस बारे में सात अन्य पीएचडी छात्रों के साथ मेरी लंबी चर्चा हुई!

— हारून मैकडैड

1

क्या स्लीपिंग ब्यूटी को जागृत होने पर कैलेंडर देखने की अनुमति है? यदि सोमवार है, तो उसे पी (एक्स = सिर) = 0.5 का जवाब देना चाहिए। यदि मंगलवार है, तो पी (एक्स = सिर) = 0।

— राबर्ट एफएफ

25

सेंट पीटर्सबर्ग विरोधाभास , बनाता है जो आप अवधारणा और के अर्थ पर अलग तरह से सोचने उम्मीद मूल्य । अंतर्ज्ञान (मुख्य रूप से लोगों के लिए के साथ और गणना सांख्यिकी में पृष्ठ भूमि) अलग परिणाम दे रहे हैं।

— गय
स्रोत

5

यहाँ एक और ऐसा है जो मुझे लगता है कि इतना अपर्याप्त रूप से ज्ञात है कि इसका कोई नाम जुड़ा नहीं है, लेकिन इसमें एक समान स्वाद और एक दिलचस्प सांख्यिकीय सबक है: इसमें स्वतंत्र यादृच्छिक चर साथ शून्य और समान रूप से मौजूद है। विचरण जैसे कि एक मानक सामान्य वितरण में होता है (CLT की तरह)। हालाँकि, (या आपका पसंदीदा पॉजिटिव नंबर)।

X_{1}, X_{2}, \dots

$X_1,X_2,\ldots$

\sqrt{n} {\bar{X}}_{n}

$\sqrt{n} \bar X_n$

N (0, 1)

$\mathcal N(0,1)$

V a r (\sqrt{n} {\bar{X}}_{n}) \to 17

$\mathrm{Var}(\sqrt{n} \bar X_n) \to 17$

— कार्डिनल

@कार्डिनल कोई भी मौका आप इस के कुछ विवरणों को एक अलग उत्तर के रूप में पोस्ट कर सकते हैं?

— सिल्वरफिश

@Silver प्रत्येक का मतलब शून्य और भिन्नता साथ एक सामान्य वितरण है । क्या होगा asymptotically के लिए की तरह लग रहे करने के लिए है अभिसरण के लिए?

X_{i}

$X_i$

f (n)

$f(n)$

f

$f$

Var (\sqrt{n} {\bar{X}}_{n})

$\text{Var}(\sqrt{n}\bar X_n)$

— whuber

मुझे पढ़ना चाहिए कि रूप में विचरण ; किस स्थिति में ( की स्वतंत्रता का उपयोग करके ) हमारे पास तो हम हैं अनुक्रम की आवश्यकता होने के लिए है अगर अभिसरण करना है?

X_{i}

$X_i$

f (i)

$f(i)$

X_{i}

$X_i$

V a r (\sqrt{n} {\bar{X}}_{n}) = \frac{1}{n} \sum_{i = 1}^{n} f (i)

$\mathrm{Var}(\sqrt{n}\bar X_n) = \frac{1}{n}\sum_{i=1}^n f(i)$

f (i)

$f(i)$

V a r (\sqrt{n} {\bar{X}}_{n})

$\mathrm{Var}(\sqrt{n}\bar X_n)$

— सिल्वरफिश

22

जेफ्रेय्स-लिंडले विरोधाभास है, जो पता चलता है कि कुछ परिस्थितियों में परिकल्पना परीक्षण के frequentist और बायेसियन तरीकों डिफ़ॉल्ट पूरी तरह से विरोधाभासी जवाब दे सकते हैं। यह वास्तव में उपयोगकर्ताओं को सोचने के लिए मजबूर करता है कि परीक्षण के इन रूपों का क्या मतलब है, और यह विचार करने के लिए कि वास्तव में क्या चाहते हैं। एक हालिया उदाहरण के लिए इस चर्चा को देखें ।

— अतिथि
स्रोत

20

वहाँ प्रसिद्ध दो-लड़कियों की परम्परा है:

दो बच्चों वाले परिवार में, अगर कोई एक बच्चा एक लड़की है , तो दोनों बच्चे क्या हैं?

ज्यादातर लोग सहज रूप से कहते हैं 1/2, लेकिन जवाब है 1/3। मुद्दा, मौलिक रूप से, यह है कि एक समान रूप से "एक लड़की, सभी लड़कियों में से एक के साथ एक बहन" यादृच्छिक रूप से समान रूप से समान नहीं है " समान रूप से " एक परिवार, दो बच्चों वाले सभी परिवारों और कम से कम एक लड़की को चुनने के समान नहीं है । "

यह एक अंतर्ज्ञान के साथ मेष करने के लिए काफी सरल है, एक बार जब आप इसे समझते हैं, लेकिन अधिक जटिल संस्करण हैं जिन्हें समझना मुश्किल है:

दो बच्चों वाले परिवार में, क्या संभावनाएं हैं, अगर बच्चों में से एक मंगलवार को पैदा हुआ लड़का है , कि दोनों बच्चे लड़के हैं? (उत्तर: 13/27)

दो बच्चों वाले परिवार में, क्या संभावनाएं हैं, अगर बच्चों में से एक फ्लोरिडा नाम की लड़की है , कि दोनों बच्चे लड़कियां हैं? (उत्तर: 1/2 के बहुत करीब, "फ्लोरिडा" एक अत्यंत दुर्लभ नाम है)

इन सभी पहेलियों के बारे में अधिक जानकारी इस उत्तर में मिल सकती है ।
(यह भी: मंगलवार को पैदा हुए लड़के के बारे में अधिक जानकारी, फ्लोरिडा नाम की लड़की पर अधिक जानकारी )

— रेवरा ब्लूराजा - डैनी पफ्लुघोफ़्ट
स्रोत

3

उत्तर निश्चित रूप से 1/3नहीं है 2/3? केवल एक आउटGB, BG, GG

— मार्टिन स्मिथ

3

"मंगलवार को पैदा हुआ लड़का" लेख अच्छा है। इसका मुख्य बिंदु, जिसे बहुत स्पष्ट रूप से बनाया गया है ("समस्या को परिभाषित किया गया है"), यह है कि उत्तर संभावना मॉडल को अपनाने पर निर्भर करता है। यह कहते हुए कि "" उत्तर 13/27 भ्रामक है (सबसे अच्छा है)।

— whuber

@ मर्टिन: हीहे हूप्स :)

— ब्लूराजा - डैनी पीफ्लूघोफ्ट

2

इन समस्याओं के कारण इतने भ्रामक हैं कि प्रश्न को शब्दबद्ध किया जाता है ताकि इसकी परिकल्पना की जा सके कि परिकल्पना का स्थान क्या है। यह बदले में यह भ्रमित करता है कि वास्तव में "समान रूप से" मामले क्या हैं (और इसलिए क्या गिना जाना चाहिए)।

— प्रोबेबिलिसलॉजिक

1

p (B_{1} G_{2}) = p (G_{1} B_{2})

$p(B_1G_2)=p(G_1B_2)$

\frac{p (G_{1} G_{2})}{2 p (B_{1} G_{2}) + p (G_{1} G_{2})}

$\frac{p(G_1G_2)}{2p(B_1G_2)+p(G_1G_2)}$

12

क्षमा करें, लेकिन मैं खुद की मदद नहीं कर सकता (मैं भी, सांख्यिकीय विरोधाभास प्यार करता हूँ!)।

फिर, शायद प्रति विरोधाभास नहीं है और छोड़े गए चर पूर्वाग्रह का एक और उदाहरण है।

सहज कार्य-कारण / प्रतिगमन
एक समय की प्रवृत्ति वाला कोई भी चर दूसरे चर के साथ सहसंबद्ध होने वाला है जिसमें एक समय प्रवृत्ति भी है। उदाहरण के लिए, जन्म से 27 वर्ष की आयु तक मेरा वजन आपके जन्म से लेकर 27 वर्ष की आयु तक अत्यधिक सहसंबद्ध होने वाला है। जाहिर है, मेरा वजन आपके वजन के कारण नहीं है । अगर ऐसा होता, तो मैं पूछता था कि आप अधिक बार जिम जाते हैं, कृपया।

$x_t$ $y_t$

\begin{aligned} x_{t} & = α_{0} + α_{1} t + ϵ_{t} and \\ y_{t} & = β_{0} + β_{1} t + η_{t} . \end{aligned}

$\begin{align*}x_t &= \alpha_0 + \alpha_1 t + \epsilon_t \text{ and} \\ y_t &= \beta_0 + \beta_1 t + \eta_t.\end{align*}$

y_{t} = γ_{0} + γ_{1} x_{t} + ν_{t}

$\begin{equation*}y_t = \gamma_0 + \gamma_1 x_t + \nu_t\end{equation*}$

x_{t}

$x_t$

γ_{1}

$\gamma_1$

जब आप समय श्रृंखला विश्लेषण कर रहे होते हैं, तो आपको यह सुनिश्चित करने की आवश्यकता होती है कि आपके चर स्थिर हैं या आपको ये शानदार कार्य परिणाम मिलेंगे।

(मैं पूरी तरह से स्वीकार करता हूं कि मैंने यहां दिए गए अपने स्वयं के जवाब की सराहना की है ।)

— दर्शाता है
स्रोत

11

मेरे पसंदीदा में से एक मोंटी हॉल समस्या है। मुझे याद है कि मैं इसके बारे में प्राथमिक सांख्यिकी वर्ग में सीख रहा था, अपने पिताजी को बता रहा था, क्योंकि हम दोनों अविश्वास में थे और मैंने यादृच्छिक संख्याओं का अनुकरण किया और हमने समस्या की कोशिश की। हमारे विस्मय के लिए यह सच था।

मूल रूप से यह समस्या बताती है कि यदि आपके पास गेम शो पर तीन दरवाजे हैं, जिसके पीछे एक पुरस्कार है और दूसरा दो कुछ भी नहीं है, यदि आपने एक दरवाजा चुना है और फिर शेष दो दरवाजों के बारे में बताया गया है तो दोनों में से एक पुरस्कार दरवाजा नहीं है और अपनी पसंद को स्विच करने की अनुमति दी यदि आपने चुना तो आपको वर्तमान दरवाजे को शेष दरवाजे पर स्विच करना चाहिए।

यहाँ एक आर सिमुलेशन के लिए लिंक है: लिंक

— टायलर रिंकर को पुनर्जीवित करता है
स्रोत

7

Parrondo का विरोधाभास:

से wikipdedia : "Parrondo विरोधाभास, गेम थ्योरी में एक विरोधाभास, के रूप में वर्णित किया गया है:। खोने रणनीति का एक संयोजन एक जीतने की रणनीति बन जाता है यह इसके निर्माता, जुआन Parrondo, जो 1996 ए में विरोधाभास की खोज के नाम पर है और अधिक व्याख्यात्मक विवरण है :

गेम के जोड़े मौजूद हैं, जिनमें से प्रत्येक जीतने की तुलना में खोने की अधिक संभावना है, जिसके लिए वैकल्पिक रूप से गेम खेलकर जीतने की रणनीति बनाना संभव है।

Parrondo ने ब्राउनियन शाफ़्ट के अपने विश्लेषण के संबंध में विरोधाभास को तैयार किया, एक मशीन के बारे में एक सोचा प्रयोग जो भौतिकविद् रिचर्ड फेनमैन द्वारा लोकप्रिय यादृच्छिक गर्मी गतियों से ऊर्जा निकाल सकता है। हालांकि, विरोधाभास गायब हो जाता है जब कड़ाई से विश्लेषण किया जाता है। "

$P_B(W)=3/4+\epsilon$ $P_A(W)=1/10 + \epsilon$

एक और हालिया संबंधित विरोधाभास है जिसे " एलिसन मिश्रण " कहा जाता है , जिससे पता चलता है कि हम दो आईआईडी और गैर-सहसंबद्ध श्रृंखला ले सकते हैं, और बेतरतीब ढंग से उन्हें ऐसे हाथापाई कर सकते हैं कि कुछ मिश्रण गैर-शून्य ऑटोकैरेलेशन के साथ एक परिणामी श्रृंखला बना सकते हैं।

— पैट
स्रोत

6

यह दिलचस्प है कि दो बाल समस्या और मोंटी हॉल समस्या अक्सर विरोधाभास के संदर्भ में एक साथ उल्लेख किया जाता है। दोनों 1889 में पहली बार एक स्पष्ट विरोधाभास का वर्णन करते हैं, जिसे बर्ट्रेंड का बॉक्स पैराडॉक्स कहा जाता है, जिसे या तो प्रतिनिधित्व करने के लिए सामान्यीकृत किया जा सकता है। मुझे यह एक सबसे दिलचस्प "विरोधाभास" लगता है क्योंकि एक ही अति-शिक्षित, बहुत-बुद्धिमान लोग इस विरोधाभास के संबंध में विपरीत तरीके से उन दो समस्याओं का जवाब देते हैं। यह ब्रिज जैसे कार्ड गेम में उपयोग किए जाने वाले सिद्धांत की तुलना करता है, जिसे प्रतिबंधित विकल्प के सिद्धांत के रूप में जाना जाता है, जहां यह संकल्प समय-परीक्षण किया जाता है।

कहो कि आपके पास एक यादृच्छिक रूप से चयनित आइटम है जिसे मैं "बॉक्स" कहूंगा। हर संभव बॉक्स में कम से कम दो सममित गुण होते हैं, लेकिन कुछ में दोनों होते हैं। मैं गुणों को "सोना" और "चांदी" कहूंगा। संभावना है कि एक बॉक्स सिर्फ सोना है पी; और चूंकि गुण सममित हैं, पी भी संभावना है कि एक बॉक्स सिर्फ चांदी है। यह संभावना बनाता है कि एक बॉक्स में सिर्फ एक संपत्ति 2P है, और संभावना है कि यह दोनों 1-2P है।

यदि आपको बताया जाए कि एक बॉक्स सोना है, लेकिन यह नहीं है कि यह चांदी है, तो आपको यह कहने के लिए लुभाया जा सकता है कि यह सिर्फ सोना है P / (P + (1-2P)) = P / (1-P)। लेकिन तब आपको एक-रंग के बॉक्स के लिए उसी संभावना को बताना होगा यदि आपको बताया गया था कि यह चांदी था। और अगर यह प्रायिकता P / (1-P) है, जब भी आपको सिर्फ एक रंग बताया जाता है, तो आपको P / (1-P) होना चाहिए, भले ही आपको रंग न बताया गया हो। फिर भी हम जानते हैं कि यह पिछले पैराग्राफ से 2 पी है।

इस स्पष्ट विरोधाभास को यह देखते हुए हल किया जाता है कि यदि एक बॉक्स में केवल एक ही रंग है, तो आपको किस रंग के बारे में नहीं बताया जाएगा। लेकिन अगर यह दो है, एक निहित विकल्प है। आपको यह जानना होगा कि प्रश्न का उत्तर देने के लिए वह विकल्प कैसे बनाया गया था, और यह स्पष्ट विरोधाभास की जड़ है। यदि आपको नहीं बताया गया है, तो आप केवल अनुमान लगा सकते हैं कि रंग यादृच्छिक रूप से चुना गया था, जिससे उत्तर P / (P + (1-2P) / 2) = 2P हो गया। यदि आप जोर देते हैं कि पी / (1-पी) उत्तर है, तो आप स्पष्ट रूप से मान रहे हैं कि कोई संभावना नहीं थी कि अन्य रंग का उल्लेख किया जा सकता था जब तक कि यह एकमात्र रंग नहीं था।

मोंटी हॉल समस्या में, रंगों के लिए सादृश्य बहुत सहज नहीं है, लेकिन पी = 1/3। दो बंद दरवाजे मूल रूप से समान रूप से होने की संभावना जा रहा है के आधार पर जवाब है पुरस्कार मानते हैं मोंटी हॉल दरवाजा उसने किया खोलने के लिए आवश्यक था, भले ही वह एक विकल्प नहीं था। वह उत्तर P / (1-P) = 1/2 है। जवाब उसे यादृच्छिक पर चुनने के लिए 2P = 2/3 संभावना है कि स्विचिंग जीत जाएगा के लिए अनुमति देता है।

टू चाइल्ड प्रॉब्लम में, मेरे सादृश्य में रंग काफी अच्छी तरह से लिंग की तुलना करते हैं। चार मामलों के साथ, पी = 1/4। प्रश्न का उत्तर देने के लिए, हमें यह जानना होगा कि यह कैसे निर्धारित किया गया था कि परिवार में एक लड़की थी। यदि उस विधि से परिवार के किसी लड़के के बारे में सीखना संभव था, तो उत्तर 2 पी = 1/2 है, न कि पी / (1-पी) = 1/3। यदि आप फ्लोरिडा नाम पर विचार करते हैं या "मंगलवार को पैदा हुए," तो यह थोड़ा अधिक जटिल है, लेकिन परिणाम समान हैं। यदि कोई विकल्प था, तो उत्तर बिल्कुल 1/2 है, और समस्या के अधिकांश कथन इस तरह के विकल्प का अर्थ लगाते हैं। और कारण "बदलते" 1/3 से 13/27 तक, या 1/3 से "लगभग 1/2", विरोधाभास और अचिंत्य लगता है, ऐसा इसलिए है क्योंकि कोई विकल्प नहीं है।

प्रतिबंधित विकल्प के सिद्धांत में, कहते हैं कि आप समान कार्ड के कुछ सेट को याद कर रहे हैं - जैसे कि जैक, क्वीन, और एक ही सूट के राजा। संभावना यह भी शुरू होती है कि कोई विशेष कार्ड किसी विशिष्ट प्रतिद्वंद्वी का है। लेकिन एक प्रतिद्वंद्वी के खेलने के बाद, दूसरों में से किसी एक के होने की उसकी संभावना कम हो जाती है क्योंकि अगर वह होता तो वह उस कार्ड को खेल सकता था।

— जेफजेओ को दर्शाता है
स्रोत

P_{G} = P_{S}

$P_G=P_S$

P^{2}

$P^2$

2 P

$2P$

(1 - P)^{2}

$(1-P)^2$

1 - 2 P

$1-2P$

P_{G} = P_{S} = .8

$P_G=P_S=.8$

P_{G S} = 1.6

$P_{GS}=1.6$

P_{- G - S} = - .6

$P_{-G-S}=-.6$

P = .5

$P=.5$

क्षमा करें, हो सकता है कि मैंने इसे अच्छी तरह से समझाने की कोशिश नहीं की। मेरा पी संभाव्यता नहीं था एक बॉक्स का रंग सोना है, यह संभावना थी कि यह केवल सोना था । इसकी संभावना सोने का रंग 1-P है। और जब दो गुण समरूप होते हैं, तो उन्हें स्वतंत्र होने की आवश्यकता नहीं होती है, इसलिए आप केवल संभावनाओं को गुणा नहीं कर सकते। इसके अलावा, कोई भी बॉक्स "न तो" नहीं है। बर्ट्रेंड ने प्रत्येक में दो सिक्कों के साथ तीन बॉक्स का उपयोग किया: सोना + सोना, सोना + चांदी, और चांदी + चांदी। किसी भी संख्या में सोने के सिक्कों वाला एक बॉक्स मेरे सामान्यीकरण में "सोना" है।

— जेफजो

+1, इससे मदद मिलती है। अब मुझे वाक्यांश "कम से कम दो में से एक" और शब्द "बस" दिखाई दे रहा है, जिसे मैंने स्किम किया होगा।

— गंग

6

$[0,1]$ $x,y\in [0,1]$ $P(x=y)=0$ $x$ $y>x$ $y<x$ $y>x$ $0.5$

— इत्ते वायस
स्रोत

2

[0, 1]

$[0,1]$

y

$y$

x

$x$

2

मुझे पारिस्थितिक पतन का एक सरल चित्रमय चित्रण मिला है (यहाँ समृद्ध राज्य / गरीब राज्य मतदान विरोधाभास) मुझे सहज ज्ञान युक्त स्तर पर समझने में मदद करता है कि जब हम राज्य की आबादी को जोड़ते हैं तो हम मतदान पैटर्न का उलटा क्यों देखते हैं:

यहाँ छवि विवरण दर्ज करें

— RobertF
स्रोत

3

यह एक अच्छा उदाहरण है, लेकिन मुझे लगता है कि यह सिम्पसन का विरोधाभास है: en.wikipedia.org/wiki/Simpson%27s_paradox

— Nick

1

@ निक: यह विशेष उदाहरण वास्तव में सिम्पसन के विरोधाभास से अलग है, लेकिन यह जानना मुश्किल हो सकता है कि कौन सी गिरावट / विरोधाभास किसी विशेष स्थिति में लागू होती है क्योंकि वे एक ही सांख्यिकीय रूप से देखते हैं। अंतर यह है कि एसपी एक "गलत प्रभाव" है जो केवल उपसमूहों का विश्लेषण करते समय प्रकट होता है। हालांकि दिखाया गया यह ट्रेंड एक "सच्चा प्रभाव" है जो उपसमूहों का विश्लेषण करते समय ही दिखाई देता है। इस मामले में, यह सुझाव देता है कि जबकि एक कच्ची संख्या के रूप में आय कुल मिलाकर वोटिंग पैटर्न को प्रभावित नहीं करती है, आपके पड़ोसियों (आपके राज्य) से संबंधित आय मतदान के पैटर्न को प्रभावित करती है।

— जोनाथन

यह पारिस्थितिक पतन है, नीचे चर्चा की गई है।

— चार्ली

3

@Charlie 'नीचे' और 'ऊपर' पृष्ठ के पाठक जिस भी तरह से छंटनी (सक्रिय / सबसे पुराना / वोट) कर रहे हैं, और किसी भी स्थिति में क्रमबद्ध मानदंड के तहत आदेश समय के साथ बदल सकते हैं (डिफ़ॉल्ट सहित) । जैसे, शायद उस व्यक्ति का उल्लेख करना बेहतर है जो आपके द्वारा संदर्भित चर्चा को पोस्ट करता है, या यहां तक कि उससे लिंक भी करता है।

— ग्लेन_ बी

2

मान लीजिए कि आपने किसी राज्य के शाही परिवार में जन्म पर एक डेटा प्राप्त किया है। परिवार के पेड़ में प्रत्येक जन्म नोट किया गया था। इस परिवार के बारे में अजीब बात यह है कि माता-पिता केवल एक बच्चा पैदा करने की कोशिश कर रहे थे, जब पहला लड़का पैदा हुआ था और उसके बाद और बच्चे नहीं थे।

तो आपका डेटा संभावित रूप से इसी तरह दिखता है:

G G B
B
G G B
G B
G G G G G G G G G B
etc.

क्या इस नमूने में लड़कों और लड़कियों का अनुपात लड़के को जन्म देने की सामान्य संभावना को दर्शाता है (0.5 का कहना है)? उत्तर और स्पष्टीकरण इस सूत्र में पाया जा सकता है ।

— टिम
स्रोत

2

यह उत्तर पहेली की तरह पढ़ता है, विरोधाभास की तरह नहीं। मैं कल्पना कर सकता हूं कि आप इसे इस तरह क्यों पोस्ट करना चाहते थे, लेकिन मुझे लगता है कि इस जवाब के लिए विरोधाभास के रूप में अर्हता प्राप्त करने और इस धागे को फिट करने के लिए, आपको अधिक स्पष्ट होने की आवश्यकता है।

— अमीबा

2

यह सवाल (लड़कों और लड़कियों के बीच में) को आँकड़े.स्टैकएक्सचेंज . com / questions / 93830 पर पूछा गया था , जिसे बड़ी संख्या में जवाब मिला - पूरी तरह से समझौते में नहीं! (मैं इस समस्या को गंभीरता से ले रही है और तेजी से यथार्थवादी तरीके से इस बारे में सोच, मान्यताओं ऐसा करने की जरूरत की खोज से कुछ सीखा है।)

— whuber

लिंक के लिए @whuber धन्यवाद! मैंने इसे विवरण में जोड़ा।

— टिम

2

यह सिम्पसन का विरोधाभास है लेकिन 'बैकवर्ड' के साथ-साथ आगे की ओर, यहूदिया पर्ल की नई किताब कॉसल इनविटेशन इन स्टैटिस्टिक्स: ए प्राइमर [^ 1] से आया है।

क्लासिक सिम्पोन का विरोधाभास निम्नानुसार काम करता है: दो डॉक्टरों के बीच चयन करने की कोशिश पर विचार करें। आप स्वचालित रूप से सर्वश्रेष्ठ परिणामों के साथ एक का चयन करते हैं। लेकिन लगता है कि सबसे अच्छे परिणामों के साथ एक सबसे आसान मामलों को चुनता है। दूसरे के घटिया रिकॉर्ड चालबाज काम का परिणाम है।

अब आप किसे चुनते हैं? कठिनाई से स्तरीकृत परिणामों को देखने के लिए बेहतर है और फिर निर्णय लें।

सिक्के का एक और पक्ष (एक और विरोधाभास) है जो कहता है कि स्तरीकृत परिणाम आपको गलत विकल्प पर भी ले जा सकते हैं।

इस बार एक दवा का उपयोग करने या नहीं चुनने पर विचार करें। दवा का एक विषैला दुष्प्रभाव होता है, लेकिन इसकी चिकित्सीय क्रिया रक्तचाप को कम करने के माध्यम से होती है। कुल मिलाकर, दवा आबादी में परिणामों में सुधार करती है, लेकिन जब उपचार के बाद रक्तचाप पर स्तरीकरण होता है, तो निम्न और उच्च रक्तचाप दोनों समूहों में परिणाम बदतर होते हैं। यह सच कैसे हो सकता है? क्योंकि हम अनजाने में परिणाम पर स्तरीकृत हो गए हैं, और प्रत्येक परिणाम के भीतर जो सभी निरीक्षण करना बाकी है, वह विषाक्त दुष्प्रभाव है।

स्पष्ट करने के लिए, कल्पना करें कि दवा टूटे हुए दिलों को ठीक करने के लिए डिज़ाइन की गई है, और यह रक्तचाप को कम करके करता है, और रक्तचाप को कम करने के बजाय हम निश्चित दिलों पर स्तरीकरण करते हैं। जब दवा काम करती है, तो दिल तय हो जाता है (और रक्तचाप कम होगा), लेकिन कुछ रोगियों को विषाक्त दुष्प्रभाव भी मिलेगा। क्योंकि दवा काम करती है, 'निश्चित हृदय' समूह में अधिक मरीज होंगे जिन्होंने दवा ली होगी, क्योंकि मरीज 'टूटे हुए' हृदय समूह में दवा ले रहे हैं। दवा लेने वाले अधिक रोगियों का मतलब है कि अधिक रोगियों को साइड इफेक्ट हो रहा है, और स्पष्ट रूप से (लेकिन झूठा) उन रोगियों के लिए बेहतर परिणाम है जो दवा नहीं लेते थे।

जिन रोगियों को दवा लेने के बिना बेहतर हो जाता है वे सिर्फ भाग्यशाली हैं। जिन रोगियों ने दवा ली और वे बेहतर हुए, उन लोगों का एक मिश्रण है जिन्हें बेहतर होने के लिए दवा की आवश्यकता थी, और जो वैसे भी भाग्यशाली होंगे। केवल 'निश्चित दिल' वाले रोगियों की जांच करने का मतलब है कि जिन रोगियों को ठीक किया गया था, उन्हें छोड़कर उन्होंने दवा ली थी। ऐसे रोगियों को बाहर करने का मतलब है कि दवा न लेने से होने वाले नुकसान को छोड़कर, जिसका अर्थ है कि हम केवल दवा लेने से होने वाले नुकसान को देखते हैं ।

सिम्पसन का विरोधाभास तब उत्पन्न होता है जब उपचार के अलावा किसी अन्य परिणाम का कारण होता है जैसे कि तथ्य यह है कि आपका डॉक्टर केवल मुश्किल मामलों को करता है। सामान्य कारण (मुश्किल बनाम आसान मामलों) के लिए नियंत्रित करना हमें सही प्रभाव देखने की अनुमति देता है। बाद के उदाहरण में, हमने अनजाने में एक परिणाम पर स्तरीकृत किया है न कि एक ऐसे कारण पर जिसका सही उत्तर समुच्चय में है न कि स्तरीकृत डेटा।

[^ 1]: सांख्यिकी में पर्ल जे। जॉन विले एंड संस; 2016

— drstevok
स्रोत

2

मेरे "पसंदीदा" में से एक, जिसका अर्थ है कि यह वही है जो मुझे कई अध्ययनों की व्याख्या के बारे में पागल करता है (और अक्सर लेखकों द्वारा खुद को, न कि केवल मीडिया) सर्वाइवरशिप बायस का ।

यह कल्पना करने का एक तरीका यह है कि कुछ प्रभाव है जो विषयों के लिए बहुत हानिकारक है, इतना है कि यह उन्हें मारने का एक बहुत अच्छा मौका है। यदि अध्ययन से पहले विषयों को इस आशय से अवगत कराया जाता है , तो समय के अध्ययन के शुरू होने से, जो विषय अभी भी जीवित हैं, उनके असामान्य रूप से लचीला होने की बहुत अधिक संभावना है। काम पर सचमुच प्राकृतिक चयन। जब ऐसा होता है, तो अध्ययन से पता चलता है कि उजागर किए गए विषय असामान्य रूप से स्वस्थ हैं (चूंकि सभी अस्वास्थ्यकर पहले से ही मर चुके हैं या प्रभाव के संपर्क में आने से रोकना सुनिश्चित करते हैं)। यह अक्सर गलत समझा जाता है क्योंकि यह समझा जाता है कि एक्सपोज़र वास्तव में विषयों के लिए अच्छा है । यह छंटनी की अनदेखी का परिणाम है (अर्थात उन विषयों को अनदेखा करना जो मर गए और अध्ययन के लिए नहीं बने)।

इसी तरह, जो विषय अध्ययन के दौरान प्रभाव के संपर्क में आ रहे हैं, वे अक्सर अविश्वसनीय रूप से अस्वस्थ होते हैं: ऐसा इसलिए है क्योंकि उन्होंने महसूस किया है कि निरंतर संपर्क संभवतः उन्हें मार देगा। लेकिन अध्ययन केवल यह देखता है कि जो लोग छोड़ते हैं वे बहुत अस्वस्थ हैं!

@ WWII बमवर्षकों के बारे में चार्ली के जवाब को इसके उदाहरण के रूप में सोचा जा सकता है, लेकिन आधुनिक उदाहरण भी बहुत हैं। एक हालिया उदाहरण अध्ययन की रिपोर्ट है कि एक दिन में 8+ कप कॉफी पीना है(!!) 55 वर्ष से अधिक उम्र के विषयों में बहुत अधिक हृदय स्वास्थ्य से जुड़ा हुआ है। अध्ययन के लेखकों सहित पीएचडी वाले बहुत से लोगों ने इसे "कॉफी पीना आपके दिल के लिए अच्छा है!" के रूप में व्याख्या की है। मैंने इसे पढ़ा क्योंकि आपके पास 55 साल की उम्र के एक दिन बाद भी 8 कप कॉफी पीने के लिए एक अविश्वसनीय रूप से स्वस्थ हृदय होना चाहिए और दिल का दौरा नहीं होना चाहिए। यहां तक कि अगर यह आपको नहीं मारता है, तब भी जब कुछ आपके स्वास्थ्य के बारे में चिंताजनक लगता है, तो हर कोई जो आपसे प्यार करता है (साथ ही आपका डॉक्टर) आपको तुरंत कॉफी पीने के लिए प्रोत्साहित करेगा। आगे के अध्ययन में पाया गया कि इतनी अधिक मात्रा में कॉफी पीने से युवा समूहों में कोई लाभकारी प्रभाव नहीं पड़ा, जो मुझे लगता है कि अधिक प्रमाण है कि हम सकारात्मक प्रभाव के बजाय एक जीवित प्रभाव देख रहे हैं। फिर भी पीएचडी के बारे में बहुत कुछ कह रहा है "

— दर्शाता है
स्रोत

Im आपकी व्याख्या के बारे में सुनिश्चित नहीं है। नॉर्वे में एक दिन में 8 कप कॉफी पीना अशुभ है, औसत मूल्य (बच्चों और अन्य nondrinkers सहित) एक दिन में लगभग दो कप है। फिनलैंड में माध्य प्रतिदिन लगभग 2.5 कप होता है। मैं दिन में दस मिनट तक मॉर्न ईथन पीता था, लेकिन अब और नहीं।

— kjetil b halvorsen

1

मुझे आश्चर्य है कि किसी ने भी न्यूकॉम्ब के विरोधाभास का उल्लेख नहीं किया है, हालांकि यह निर्णय सिद्धांत में अधिक चर्चा है। यह निश्चित रूप से मेरे पसंदीदा में से एक है।

— Ely
स्रोत

-2

चलो x, y और z असंबंधित वैक्टर हैं। फिर भी x / z और y / z सहसंबद्ध होंगे।

— zbicyclist
स्रोत

2

यह विरोधाभास क्यों है? यह सहज लगता है।

— lcrmorin 15

2

अगर यह आमतौर पर ऐसा नहीं होता तो मुझे आश्चर्य होता।

— ग्लेन_ बी

1

x / z

$x/z$

x / z

$x/z$

z

$z$

X, Y,

$X,Y,$

Z

$Z$