NYTimes में सांख्यिकीय पद्धति के दुरुपयोग के बारे में लेख


20

मैं इस लेख का जिक्र कर रहा हूं: http://www.nytimes.com/2011/01/11/science/11esp.html

निम्नलिखित प्रयोग पर विचार करें। मान लीजिए कि विश्वास करने का कारण था कि एक सिक्का सिर की ओर थोड़ा भारित था। एक परीक्षण में, सिक्का 1,000 में से 527 बार सिर के ऊपर आता है।

क्या यह महत्वपूर्ण सबूत है कि सिक्का भारित है?

शास्त्रीय विश्लेषण हाँ कहता है। एक निष्पक्ष सिक्के के साथ, 1,000 फ्लैप में 527 या अधिक सिर प्राप्त करने की संभावना 20 में 1 से कम है, या 5 प्रतिशत, पारंपरिक कटऑफ। इसे दूसरे तरीके से रखने के लिए: प्रयोग में एक भारित सिक्के के प्रमाण मिलते हैं "95 प्रतिशत आत्मविश्वास के साथ।"

फिर भी कई सांख्यिकीविद इसे नहीं खरीदते हैं। 20 में से एक, 1,000 फेंकी में 526 से ऊपर किसी भी संख्या में प्रमुख होने की संभावना है। यही है, यह 527 flipping की संभावना का योग है, 528, 529 flipping की संभावना और इसी तरह।

लेकिन प्रयोग को उस श्रेणी के सभी नंबर नहीं मिले; यह सिर्फ एक पाया - 527. यह अधिक सटीक है, इन विशेषज्ञों का कहना है, कि एक नंबर पाने की संभावना की गणना करने के लिए - 527 - यदि सिक्का का वजन है, और इसकी तुलना उसी नंबर से होने की संभावना से करें यदि सिक्का है निष्पक्ष।

सांख्यिकीविद् दिखा सकते हैं कि पॉल स्पेकमैन के अनुसार, यह अनुपात लगभग 4 से 1 से अधिक नहीं हो सकता है, एक सांख्यिकीविद्, जो कि जेफ राइडर के साथ एक मनोवैज्ञानिक है, ने उदाहरण दिया।

पहला प्रश्न: यह मेरे लिए नया है। क्या किसी के पास कोई संदर्भ है जहां मैं सटीक गणना पा सकता हूं और / या क्या आप मुझे स्वयं सटीक गणना देकर मेरी सहायता कर सकते हैं और / या क्या आप मुझे कुछ सामग्री की ओर संकेत कर सकते हैं, जहां मुझे समान उदाहरण मिल सकते हैं?

नए साक्ष्य सामने आते ही बेयस ने एक परिकल्पना के लिए संभाव्यता को अद्यतन करने का एक तरीका तैयार किया।

इसलिए किसी दिए गए खोजने की ताकत का मूल्यांकन करने में, बायेसियन (स्पष्ट BAYZ-ee-un) विश्लेषण अध्ययन से बाहर से, उपलब्ध होने पर ज्ञात संभावनाओं को शामिल करता है।

इसे "हाँ, सही" प्रभाव कहा जा सकता है। यदि एक अध्ययन में पाया गया है कि kumquats हृदय रोग के जोखिम को 90 प्रतिशत तक कम कर देता है, जो कि एक सप्ताह में एक शराब की लत को ठीक करता है, तो संवेदनशील माता-पिता एक लड़के के रूप में एक लड़की को जन्म देने की संभावना से दोगुना हैं, बेयसियन की प्रतिक्रिया मेल खाती है देशी संदेह: हाँ, सही है। अध्ययन के निष्कर्षों को दुनिया में क्या देखने योग्य है के खिलाफ तौला जाता है।

चिकित्सा के कम से कम एक क्षेत्र में - नैदानिक ​​जांच परीक्षण - शोधकर्ता पहले से ही नए निष्कर्षों का मूल्यांकन करने के लिए ज्ञात संभावनाओं का उपयोग करते हैं। उदाहरण के लिए, एक नया झूठ-पता लगाने का परीक्षण 90 प्रतिशत सटीक हो सकता है, 10 में से 9 को सही ढंग से चिह्नित कर सकता है। लेकिन अगर यह 10 झूठे लोगों को शामिल करने के लिए पहले से ज्ञात 100 लोगों की आबादी को दिया जाता है, तो परीक्षण बहुत कम प्रभावशाली है।

यह 10 में से 9 झूठों की सही पहचान करता है और एक को याद करता है; लेकिन यह झूठ के रूप में अन्य 90 में से 9 की गलत पहचान करता है। तथाकथित सच्चे सकारात्मक (9) को विभाजित करके लोगों द्वारा परीक्षण किए गए (18) की कुल संख्या 50 प्रतिशत की सटीकता दर देती है। "झूठी सकारात्मक" और "गलत नकारात्मक" जनसंख्या में ज्ञात दरों पर निर्भर करती हैं।

दूसरा प्रश्न: यदि आप इस पद्धति के साथ एक नई खोज "वास्तविक" हैं या नहीं, तो आप वास्तव में कैसे आंकते हैं? और: कुछ पूर्व निर्धारित पूर्व संभाव्यता के उपयोग के कारण यह 5% -रियर के रूप में मनमाना नहीं है?


3
उचित और अनुचित सिक्कों के लिए यह एक उपयोगी रीड है: stat.columbia.edu/~gelman/research/published/diceRev2.pdf
एमपीआईसीटीज

जवाबों:


31

मैं पहले प्रश्न का उत्तर विस्तार से दूंगा।

एक निष्पक्ष सिक्के के साथ, 1,000 फ्लैप में 527 या अधिक सिर प्राप्त करने की संभावना 20 में 1 से कम है, या 5 प्रतिशत, पारंपरिक कटऑफ।

n=1000p=1/2

P(B(1000,1/2)>=527)

इसकी गणना किसी भी सांख्यिकीय सॉफ्टवेयर पैकेज के साथ की जा सकती है। आर हमें देता है

> pbinom(526,1000,1/2,lower.tail=FALSE)
   0.04684365

तो संभावना है कि निष्पक्ष सिक्के के साथ हमें 526 से अधिक सिर मिलेंगे, लगभग 0.047 है, जो कि लेख में उल्लिखित 5% कटऑफ के करीब है।

निम्नलिखित कथन

इसे दूसरे तरीके से रखने के लिए: प्रयोग में एक भारित सिक्के के प्रमाण मिलते हैं "95 प्रतिशत आत्मविश्वास के साथ।"

बहस का मुद्दा है। मैं इसे कहने में संकोच करूंगा, क्योंकि ९ ५% आत्मविश्वास की व्याख्या कई तरीकों से की जा सकती है।

आगे हम मुड़ते हैं

लेकिन प्रयोग को उस श्रेणी के सभी नंबर नहीं मिले; यह सिर्फ एक पाया - 527. यह अधिक सटीक है, इन विशेषज्ञों का कहना है, कि एक नंबर पाने की संभावना की गणना करने के लिए - 527 - यदि सिक्का का वजन है, और इसकी तुलना उसी नंबर से होने की संभावना से करें यदि सिक्का है निष्पक्ष।

B(1000,1/2)=527B(1000,p)=527

P(B(1000,p)=527)P(B(1000,1/2)=527)=p527(1p)473(1/2)1000.

p

सांख्यिकीविद् दिखा सकते हैं कि पॉल स्पेकमैन के अनुसार, यह अनुपात लगभग 4 से 1 से अधिक नहीं हो सकता है, एक सांख्यिकीविद्, जो कि जेफ राइडर के साथ एक मनोवैज्ञानिक है, ने उदाहरण दिया।

p

p=5271000.

हम जांच कर सकते हैं कि यह वास्तव में उदाहरण के लिए दूसरे व्युत्पन्न परीक्षण का उपयोग करके अधिकतम है । इसे हमें मिलने वाले फॉर्मूले के अनुरूप बनाना

(527/1000)527(473/1000)473(1/2)10004.3

तो अनुपात 4.3 से 1 है, जो लेख से सहमत है।


"अब पी के संबंध में इस मात्रा को अधिकतम करें": मुझे लगता है कि आपका मतलब न्यूनतम है।
साइमन बायरन

@mpiktas (+1) अच्छा (अद्यतन) उत्तर।
CHL

मुझे लगता है कि यह उदाहरण आपको दिखाता है कि वास्तव में एक आत्मविश्वास अंतराल क्या है। मुझे एक सीआई की व्याख्या करना सबसे आसान लगता है क्योंकि एक बर्नौली से एक अवलोकन, आत्मविश्वास के स्तर के बराबर संभावना वाले पैरामीटर के साथ यादृच्छिक चर वितरित करता है। यह केवल मेरे लिए CI का उपयोग करने के लिए समझ में आता है यदि आप दोहराव से प्रयोग कर रहे हैं। एक और मुद्दा यह है कि वैकल्पिक परिकल्पना क्या है? क्या यह p = 7/10, p> 0.5, p = 1050/2000 है? पी = 527/1000? एक और मुद्दा है कि हम p = से क्या मतलब है1212p(12±ϵ)ϵ

@Simon, क्यों कम करने के लिए सुधार है? क्या पी का मान अनुपात को अधिकतम नहीं करता है?

@statnovice: उत्तर के मूल संस्करण में अंश और हर स्विच था।
साइमन बायरन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.