आत्मविश्वास अंतराल और संभावना - इस कथन में त्रुटि कहां है?


12

अगर कोई नीचे जैसा बयान देता है:

"कुल मिलाकर, पर्यावरण के धुएं के संपर्क में आने वाले नॉनस्मोकर्स को धुएं के संपर्क में नहीं आने के कारण 1.25 (95 प्रतिशत आत्मविश्वास अंतराल, 1.17 से 1.32) के कोरोनरी हृदय रोग का जोखिम था।"

समग्र रूप से जनसंख्या के लिए सापेक्ष जोखिम क्या है? कोरोनरी हृदय रोग के साथ कितनी चीजें जुड़ी हैं? जिन चीज़ों का परीक्षण किया जा सकता है, उनमें से बहुत कम लोग वास्तव में कोरोनरी हृदय रोग से जुड़े हैं, इसलिए मौका है कि किसी भी विशेष चीज़ को यादृच्छिक रूप से चुना जाता है, गायब हो जाती है। इस प्रकार हम कह सकते हैं कि जनसंख्या के लिए सापेक्ष जोखिम 1 है। लेकिन उद्धृत अंतराल में मूल्य शामिल नहीं है। 1. इसलिए या तो वास्तव में दो चीजों के बीच एक संबंध है, जिसकी संभावना गायब है, या यह एक है 5% अंतराल जिसमें पैरामीटर शामिल नहीं है। जैसा कि बाद में पूर्व की तुलना में कहीं अधिक संभावना है कि हमें यह मान लेना चाहिए। इसलिए, उपयुक्त निष्कर्ष यह है कि डेटा सेट लगभग निश्चित रूप से आबादी का असामान्य था,

बेशक, अगर यह मानने का कोई आधार है कि 5% से अधिक चीजें कोरोनरी हृदय रोग से जुड़ी हैं, तो इस सुझाव का समर्थन करने के लिए सांख्यिकीय में कुछ सबूत हो सकते हैं कि पर्यावरणीय धुआं उनमें से एक है। सामान्य ज्ञान बताता है कि यह संभावना नहीं है।

उनके तर्क में क्या त्रुटि है (जैसा कि सभी स्वास्थ्य संगठन इस बात से सहमत हैं कि सेकेंड-हैंड स्मोकिंग के हानिकारक प्रभावों के बारे में महत्वपूर्ण साहित्य है)? क्या यह उनके आधार के कारण है कि "जिन चीजों का परीक्षण किया जा सकता है, उनमें से बहुत कम वास्तव में कोरोनरी हृदय रोग से जुड़ी हैं"? यह वाक्य किसी भी बेतरतीब ढंग से चुने गए कारक के लिए सही हो सकता है (अर्थात, कितने कुत्ते एक व्यक्ति कोरोनरी धमनी रोग के जोखिम के साथ हैं) लेकिन दूसरे हाथ धूम्रपान और कोरोनरी हृदय रोग के लिए एक प्राथमिक संभावना केवल 'किसी भी यादृच्छिक कारक' की तुलना में बहुत अधिक है। ।

क्या यह सही तर्क है? या कुछ और है?


उद्धृत पाठ ऐसा लगता है ... जैसे, एक उद्धरण की तरह। ये कहां से है? :)
मैन्सटी

हाहा यह एक उद्धरण है, विकिपीडिया से ... किसी ने इसे "आत्मविश्वास अंतराल" के लिए लेख में जोड़ा। मैं इसे हटाने की कोशिश कर रहा हूं क्योंकि यह स्पष्ट रूप से गलत है, लेकिन आदमी मना कर देता है, इसलिए मुझे सिर्फ "यह स्पष्ट रूप से गलत है" के बजाय एक गणितीय ध्वनि कारण की आवश्यकता है .. हालांकि मेरे पास कुछ विचार हैं, मैं जानना चाहता था कि क्या कोई समझा सकता है वास्तव में यहाँ क्या त्रुटियाँ हो रही हैं। क्योंकि यदि यह सही होता तो कई अध्ययनों को इसी आधार पर नकारा जा सकता है
BYS2

3
यदि यह थोड़ा सा भी सूख जाता है, तो मैं आगे बढ़ूँगा और मदद करने की कोशिश करूँगा। उनका तर्क स्पष्ट रूप से निराशाजनक है और एक एजेंडा होने पर दृढ़ता से इंगित करता है।
एरिक

3
एक भौतिक विज्ञानी के रूप में, जो बहुत सारे आँकड़ों का उपयोग करता है, लेकिन एक ऐसा सांख्यिकीविद् नहीं है जो मुझे लगता है कि पैराग्राफ वास्तव में अप्रभावी है, इस तथ्य को कभी भी गलत मत समझिए कि यह बिल्कुल गलत लगता है। मैंने हमेशा सोचा है, संभवतः गलत तरीके से, कि एक 95% सीएल का मतलब है कि यदि शून्य परिकल्पना सच थी, तो 20 में 1 बार अगर मैंने अपना प्रयोग दोहराया तो मुझे 95% स्तर पर महत्वपूर्ण परिणाम मिलेगा (मेरी राय में एक अच्छा कारण 99.9 से कम का उपयोग न करें, लेकिन एक और चर्चा)। यह पोस्ट सहसंबद्ध कारकों के बारे में एक बिंदु है और वास्तव में गैर-विशेषज्ञों (या किसी को भी) की मदद नहीं करता है।
गेंदबाज

@Erik। उपयोगकर्ता के पास जुर्राब कठपुतली का एक बहुत ही डरावना इतिहास है (कुछ खाते और आईपी संपादन का उपयोग करता है) और इससे पहले अवरुद्ध हो गया है ... निश्चित नहीं कि उसका सौदा क्या है। लेकिन एक
संकटमोचक की

जवाबों:


10

यहां कई चीजें गलत हैं। जैसा कि @ नेस्टर बताते हैं, उन्होंने स्पष्ट रूप से (कोई लिंक नहीं) और (लिंक) पर पूर्व संभाव्यता को ।एच H0H1

वह पर बहुत अधिक वजन (1 के करीब) और पर बहुत कम वजन । यह पहली संदिग्ध बात है जो वह करता है, क्योंकि धुएं और हृदय रोग (सक्रिय धूम्रपान करने वालों पर विचार) के बीच एक यंत्रवत लिंक है, सवाल वास्तव में है अगर एक्सपोज़र पर्याप्त है। यह पिछले अध्ययनों पर भी विचार नहीं करता है। इसलिए यह वास्तव में "विशाल संख्या में" में से एक नहीं है, उदाहरण के लिए लाल मोजे पहनने के रूप में परीक्षण किया जाएगा। इसका मतलब है कि वह पहले से ही बहुत पक्षपाती है और वास्तव में उचित नहीं है।एच H0H1

उसके बाद वह अपने पूर्व अद्यतन को यह बताते हुए कहता है कि 95%-कॉन्फिडेंस अंतराल प्राप्त करने की संभावना है जिसमें सही मूल्य नहीं होने की संभावना 5% है। हालांकि यह सच है, यह अशक्त परिकल्पना की धारणा के तहत उस विशेष अंतराल को प्राप्त करने का मौका नहीं है । ध्यान दें कि उन्होंने [१.१ 1., १.३२] के एक विश्वास अंतराल का इलाज किया होगा [१००, २००] के आत्मविश्वास अंतराल के समान ही जो स्पष्ट रूप से समस्याग्रस्त है।

बायेसियन दृष्टिकोण के लिए यह वास्तव में महत्वपूर्ण है: जबकि आपके पास 5% की कुल संभावना है कि 1 के अंतराल के साथ एक अंतराल प्राप्त नहीं होता है कि 1 शून्य है, उस विशेष अंतराल को प्राप्त करने की संभावना घनत्व अलग है (और छोटा)।

तीसरे गलती वह निर्दिष्ट कभी नहीं है कि उसके पहले और न ही राज्यों की कितनी संभावना है बनाम हो गया है उसे कि परिणाम प्राप्त करने के लिए। यह सिर्फ "गायब हो गया छोटा" है।एच H0H1

चौथी गलती यह है कि डेटा को खारिज करने के लिए उचित कार्रवाई की जाएगी। ध्यान दें कि उसका परिणाम भी डेटा पर निर्भर नहीं करता है, उसका तर्क बिल्कुल वैसा ही है जैसा कि किसी भी डेटा के लिए किया गया है। यदि आपको एक दिलचस्प लिंक मिल जाता है, लेकिन संदेह है कि यह सिर्फ एक अस्थायी हो सकता है, तो आपके परिणाम को दोहराने की कोशिश करने के लिए उचित वैज्ञानिक बात है!


नेस्टर के जवाब पर विस्तार के लिए धन्यवाद! एक त्वरित प्रश्न हालांकि, आपने कहा कि "... यह उस परिकल्पना की धारणा के तहत उस विशेष अंतराल को प्राप्त करने का मौका नहीं है।" यदि हम अशक्त परिकल्पना की धारणा के तहत एक विशेष अंतराल प्राप्त करने का मौका ढूंढना चाहते हैं, तो हमें बायेसियन इंट्रेंस और एक विश्वसनीय अंतराल का उपयोग करना होगा? बार-बार विश्वास अंतराल केवल आपको "मौका है कि अंतराल सही मूल्य शामिल होगा" बताता है। धन्यवाद फिर से
BYS2

95% के लगातार विश्वास अंतराल का निर्माण किया जाता है ताकि अंतराल के कम से कम 95% का सही मूल्य हो। अब तक सब ठीक है। यह कहा जा रहा है कि आप एक विशेष विश्वास अंतराल प्राप्त करने की संभावना (या घनत्व का मूल्य) की गणना भी कर सकते हैं यदि अशक्त परिकल्पना सच है। सटीक स्थान में अधिक "जानकारी" शामिल है, चाहे वह शून्य परिकल्पना शामिल हो। उस जानकारी को फेंकना जब बायेसियन इंट्रेंस का उपयोग करना बुरा है, क्योंकि यह अशक्त होने की संभावना के लिए प्रासंगिक है।
एरिक

एक खिलौना उदाहरण यह होगा: बायेसियन इंसट्रक्शन, आप वितरण के रूप की ओर आक्षेप बनाना चाहते हैं। पहले दो possibilites की अनुमति देता है: H1: वितरण सामान्य मानक है। H2: वितरण सामान्य, माध्य = sd = 1. वितरण के मूल्यों का एक नमूना आपको अपने पूर्व अद्यतन करने की अनुमति देता है। जब आपको आपके मूल्यों के संकेत दिए जाते हैं, तो आप अपने पूर्व को भी अपडेट कर सकते हैं, लेकिन जब आप प्रासंगिक जानकारी को फेंक देते हैं, तो अपडेट कम जानकारीपूर्ण होगा।
एरिक

7

यह परिकल्पना परीक्षण से संबंधित एक बहुत ही रोचक दार्शनिक मुद्दा है (और इस तरह अक्सर सेटिंग में भी अंतराल अंतराल होता है, जैसा कि मैं यहां बताता हूं )।

बेशक, बहुत सारी परिकल्पनाएं हैं, जिनकी जांच की जा सकती है - निष्क्रिय धूम्रपान से कोरोनरी हृदय रोग होता है, शराब पीने से chd होता है, कुत्तों के चीड का कारण बनता है, मकर राशि होने के कारण chd ...

यदि हम इन सभी परिकल्पनाओं में से किसी एक को यादृच्छिक रूप से चुनते हैं, तो हमारे लिए एक परिकल्पना को चुनने की संभावना जो सत्य होती है, वस्तुतः शून्य है। यह उद्धृत पाठ में तर्क लगता है - कि यह बहुत कम संभावना नहीं है कि हम एक वास्तविक परिकल्पना का परीक्षण करने के लिए हुआ।

लेकिन परिकल्पना को यादृच्छिक पर नहीं चुना गया था। यह कोरोनरी हृदय रोग के बारे में पिछले महामारी विज्ञान और चिकित्सा ज्ञान से प्रेरित था। सैद्धांतिक तंत्र हैं जो बताते हैं कि धूम्रपान कैसे कोरोनरी हृदय रोग का कारण बन सकता है, इसलिए यह सोचना दूर की कौड़ी नहीं लगता कि वे निष्क्रिय धूम्रपान के लिए भी काम करेंगे।

उद्धरण में आलोचना खोजपूर्ण अध्ययन के लिए मान्य हो सकती है जहां एक डेटा सेट परिकल्पना के लिए खनन किया जाता है। यही कारण है कि हम इस तरह की "खोजों" को तथ्यों के रूप में स्वीकार नहीं करते हैं - इसके बजाय हमें आवश्यकता है कि नए अध्ययनों में परिणामों को दोहराया जा सके। किसी भी तरह से, उद्धरण में उद्धृत कागज एक मेटा अध्ययन है और इसलिए इस समस्या से प्रभावित नहीं है।

हमने पिछली शताब्दियों में अनुभवजन्य रूप से देखा है कि परिकल्पना का परीक्षण सिद्धांत द्वारा प्रेरित परिणामों की भविष्यवाणी की गई परिणामों की तुलना करके किया जाता है। इस प्रक्रिया में हम जिस तथ्य पर विश्वास करते हैं, वह कारण है कि हमने चिकित्सा, इंजीनियरिंग और विज्ञान में इतनी प्रगति की है। यही कारण है कि मैं इसे अपने कंप्यूटर पर लिख सकता हूं और आप इसे अपने पर पढ़ सकते हैं। यह तर्क देने के लिए कि यह प्रक्रिया गलत है तर्क है कि वैज्ञानिक पद्धति मौलिक रूप से दोषपूर्ण है - और हमारे पास बहुत सारे सबूत हैं जो अन्यथा कहते हैं।

मुझे संदेह है कि ऐसा कुछ भी है जो इस तरह के साक्ष्य को स्वीकार करने के लिए तैयार नहीं है जो वास्तव में स्वीकार करेगा ...


मुझे वास्तव में अंतिम से पहले आपका पैराग्राफ नहीं मिला था; क्या आप "महत्व परीक्षण" (उदाहरण के लिए, कम से कम अधिक चरम डेटा की संभावना की गणना) या वास्तव में "परिकल्पना परीक्षण" (बायेसियन सेटिंग) का उल्लेख कर रहे हैं? अगर आपने सही सवाल पूछा है तो उनमें से कौन काम नहीं करता है?
Néstor

@ नेस्टर: मुझे शायद अलग तरह से लिखना चाहिए था। मैं वास्तव में सांख्यिकीय परिकल्पना परीक्षण के बारे में एक बयान नहीं दे रहा था , बल्कि इस तथ्य के बारे में अवलोकन कर रहा था कि वास्तविक दुनिया डेटा (यानी "परिकल्पना सही है" के साथ मॉडल भविष्यवाणियों की तुलना करने का एक बहुत ही कुशल तरीका लगता है) विज्ञान। सीआई की इस आलोचना के दिल में, मेरा मानना ​​है, इस पद्धति को स्वीकार करने की अनिच्छा है। उद्धरण में दिए गए तर्क किसी भी सांख्यिकीय पद्धति पर लागू होंगे - सभी शून्य परिकल्पनाओं के लिए शून्य पूर्व संभावनाओं के साथ, हम कभी भी किसी भी चीज पर विश्वास नहीं करेंगे।
मॉन्सट

6

मुझे वास्तव में ऐसा नहीं लगता कि लेखक यह क्यों कहता है कि कोरोनरी हृदय रोग के सापेक्ष जोखिम की संभावना 1 है, गायब हो सकता है केवल एक कॉन्फिडेंस इंटरवल पर अपने विश्लेषण को आधार बनाकर; यह स्पष्ट गलत है। मेरे लिए, ऐसा लगता है कि वह एक लगातार सेटिंग का उपयोग कर रहा है, लेकिन वह बायेसियनली (जो बहुत आम है) तर्क कर रहा है।

केवल CI से जुड़ी एक ही चीज़ शास्त्रीय महत्व परीक्षण है लेकिन, जैसा कि हम सभी जानते हैं, अगर { सेकंड हैंड स्मोकिंग और कोरोनरी हार्ट डिसीज़ के बीच कोई लिंक नहीं है }, तो वे आपको ( अर्थ है) कम से कम चरम पर डेटा जो हमने देखा "", नहीं (जहां डेटा है), जो वह दावा करता है, और जो आप इंगित करते हैं उससे बिल्कुल जुड़ा हुआ है; आपको उस विशेष लिंक के बारे में पूर्व ज्ञान को शामिल करना होगा! यह इस तथ्य से आता है कि: बायस प्रमेय द्वारा, जहां पर पूर्व संभाव्यता है ।पी ( डी | एच 0 ) डी पी ( एच 0 | डी ) डी पी ( एच 0 | डी ) α पी ( डी | एच 0 ) पी ( एच 0 ) , पी ( एच 0 ) एच 0H0:p(De|H0)Dep(H0|D)D

p(H0|D)p(D|H0)p(H0),
p(H0)H0

H0 नहीं होगा: निष्क्रिय धूम्रपान और सीएचडी के बीच कोई संबंध नहीं है? चूंकि अशक्त परिकल्पना आमतौर पर परिकल्पना है कि कोई प्रभाव नहीं है। हालांकि इसके अलावा, इस उत्तर के लिए धन्यवाद!
BYS2

हां आप सही हैं! मैंने तब तक इस पर ध्यान नहीं दिया जब तक कि आपने इशारा नहीं किया :-)। मैं अपना उत्तर संपादित करूँगा।
नेस्टर

3

जबकि तर्क की इस बायेसियन लाइन के लिए कुछ है (एरिक द्वारा बहुत अच्छी तरह से डिकॉन्स्ट्रक्ट किया गया!), और वास्तव में विचार की यह पंक्ति बताएगी कि कई चिकित्सा निष्कर्षों को फिर से क्यों नहीं बनाया जा सकता है, यह विशेष तर्क उस सोच को लागू करता है जैसे एक स्लेजहेमर।

लेखक सबूत उपलब्ध कराए बिना दो चीजों को निर्धारित करता है: धुएं के संपर्क को यादृच्छिक रूप से चुना गया था, और यह कि दुनिया में लगभग कुछ भी हृदय रोग का कारण नहीं बनता है। तर्क के इन ढीला मानकों के तहत, लेखक किसी भी निष्कर्ष को अस्वीकार कर सकता है कि कुछ हृदय रोग का कारण बनता है। आपको बस इतना करना होगा:

  1. यह परिकल्पना यादृच्छिक पर चुना गया था, और
  2. वह हृदय रोग शून्य कारणों के बहुत करीब है।

ये दोनों दावे विवादास्पद हैं (और, मेरे सामान्य ज्ञान के आधार पर, बहुत अधिक झूठे हैं)। लेकिन, इन मान्यताओं के साथ, यहां तक ​​कि यह भी कि सेकेंड हैंड धुएं के संपर्क में आने वाले 100% लोग एक साल के भीतर दिल का दौरा पड़ने से मर गए, आप यह दावा कर सकते हैं कि कनेक्शन केवल छिपे हुए, एकवचन के साथ एक संयोगिक संबंध है, "सही" कारण ।


आपके विचारों के लिए ठीक है धन्यवाद! हां, लेखक ने निश्चित रूप से मान लिया था कि परिकल्पना को 'यादृच्छिक पर चुना गया' जो सही नहीं है।
BYS2

-1

मुझे उद्धरणों में पैराग्राफ के साथ स्पष्ट रूप से कुछ भी गलत नहीं दिखता है, लेकिन मैंने डेटा नहीं देखा है और जाँच नहीं कर सकता है कि संख्या है। हालाँकि, दो अनुच्छेद जो इसका पालन करते हैं, वे बहुत अस्पष्ट हैं।

मान लीजिए कि उन्होंने कहा था, "कुल मिलाकर, निरंकुश मोटापे के शिकार हुए निरंकुश व्यक्तियों में 1.25 (95 प्रतिशत आत्मविश्वास अंतराल, 1.17 से 1.32) के कोरोनरी हृदय रोग का एक सापेक्ष जोखिम था क्योंकि नॉनमोकर्स का शरीर का वजन सामान्य था।" क्या किसी को उस पर संदेह करने का कारण होगा?


वैसे उद्धरणों में पहला पैराग्राफ सिर्फ एक महामारी विज्ञान के अध्ययन के निष्कर्ष को उद्धृत करने वाला लेखक था, इसलिए इसमें कुछ भी गलत नहीं है .. अगले कुछ पैराग्राफ में अध्ययन को बदनाम करने की कोशिश की जा रही है, जहां वह कुछ संदिग्ध बयान देता है।
BYS2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.