क्यों 0.05 <p <0.95 परिणाम झूठी सकारात्मक कहा जाता है?


9

संपादित करें: मेरे प्रश्न का आधार त्रुटिपूर्ण है, और मुझे यह समझ कर कुछ समय बिताने की आवश्यकता है कि क्या यह भी समझ में आता है।

संपादित करें 2: स्पष्ट करता हूं कि मैं जानता हूं कि एक पी-वैल्यू एक शून्य परिकल्पना की संभावना का प्रत्यक्ष माप नहीं है, लेकिन मुझे लगता है कि पी-वैल्यू 1 के करीब है, अधिक संभावना है कि यह एक परिकल्पना है प्रायोगिक परीक्षण के लिए चुना गया है जिसकी संबंधित शून्य परिकल्पना सत्य है, जबकि पी-मान 0 के करीब है, अधिक संभावना यह है कि प्रायोगिक परीक्षण के लिए एक परिकल्पना को चुना गया है जिसकी संबंधित शून्य परिकल्पना झूठी है। मैं नहीं देख सकता कि यह कैसे गलत है जब तक कि सभी परिकल्पनाओं (या प्रयोगों के लिए चुने गए सभी परिकल्पनाओं) का सेट किसी तरह से रोगविज्ञानी न हो।

संपादन 3: मुझे लगता है कि मैं अभी भी अपना प्रश्न पूछने के लिए स्पष्ट शब्दावली का उपयोग नहीं कर रहा हूं। जैसे ही लॉटरी नंबर पढ़े जाते हैं, और आप उन्हें अपने टिकट से एक-एक करके मिलाते हैं, कुछ बदल जाता है। आपके द्वारा जीती गई संभावना नहीं बदलती है, लेकिन संभावना है कि आप रेडियो को बंद कर सकते हैं। एक समान परिवर्तन है जो तब होता है जब प्रयोग किए जाते हैं, लेकिन मुझे लगता है कि मैं जिस शब्दावली का उपयोग कर रहा हूं - "पी-मूल्यों की संभावना बदल जाती है कि एक सच्ची परिकल्पना को चुना गया है" - सही शब्दावली नहीं है।

संपादित करें 4: मुझे दो आश्चर्यजनक विस्तृत और ज्ञानवर्धक उत्तर मिले हैं जिनमें मेरे माध्यम से काम करने के लिए जानकारी का खजाना है। मैं उन दोनों को अभी वोट दूंगा और फिर एक को स्वीकार करने के लिए वापस आऊंगा जब मैंने दोनों उत्तरों से पर्याप्त सीखा है यह जानने के लिए कि उन्होंने मेरे प्रश्न का उत्तर दिया है या अमान्य किया है। इस सवाल ने मुझे खाने की उम्मीद की तुलना में कीड़े का एक बड़ा हिस्सा खोला।

मेरे द्वारा पढ़े गए पत्रों में, मैंने "झूठी सकारात्मक" कहे जाने वाले सत्यापन के बाद p> 0.05 के साथ परिणाम देखे हैं। हालाँकि, क्या यह अभी भी अधिक संभावना नहीं है कि मैंने एक गलत अवधारणा को चुना है, जब एक झूठे पतले परिकल्पना के साथ परीक्षण किया जाता है जब प्रायोगिक डेटा एपी <0.50 जो कम है लेकिन> 0.05 है, और दोनों शून्य परिकल्पना नहीं हैं और अनुसंधान की परिकल्पना सांख्यिकीय रूप से अनिश्चित / महत्वहीन (पारंपरिक सांख्यिकीय महत्व कटऑफ को देखते हुए) 0.05 <p < 0.95 के बीच कहीं भी जो भी p <0.05 का विलोम है, विषमता को @ निकिताउंटर के लिंक में बताया गया है ?

चलिए उस नंबर A को कॉल करते हैं, और इसे p-value के रूप में परिभाषित करते हैं जो संभावना के बारे में एक ही बात कहती है कि आपने अपने प्रयोग / विश्लेषण के लिए एक सच्ची अशांति परिकल्पना को चुना है कि 0.05 का p-value उस संभावना के बारे में कहता है जो आप ' आपके प्रयोग / विश्लेषण के लिए मैंने एक सच्चा गैर-शून्य परिकल्पना उठाया है। क्या 0.05 <p <a ऐसा नहीं है, बस सवाल का जवाब देने के लिए आपका नमूना आकार बहुत बड़ा नहीं था, और आप आवेदन / वास्तविक दुनिया के महत्व का न्याय नहीं कर पाएंगे जब तक कि आप एक बड़ा नमूना नहीं लेते हैं और अपनी सांख्यिकीय प्राप्त नहीं करते हैं महत्व छाँट दिया "?

दूसरे शब्दों में, क्या किसी परिणाम को निश्चित रूप से गलत (केवल असमर्थित के बजाय) कॉल करना सही नहीं होना चाहिए, यदि केवल और केवल p> A?

यह मुझे सीधा लगता है, लेकिन इस तरह का व्यापक उपयोग मुझे बताता है कि मैं गलत हो सकता हूं। क्या मैं:

a) गणित की गलत व्याख्या,
b) हानिरहित-अगर-नहीं-सही-सही सम्मेलन के बारे में शिकायत कर रहा है,
c) पूरी तरह से सही है, या
d) अन्य?

मैं मानता हूं कि यह राय के लिए एक कॉल की तरह लगता है, लेकिन ऐसा लगता है कि एक प्रश्न के साथ एक निश्चित गणितीय रूप से सही उत्तर है (एक बार कटऑफ सेट होने के बाद) या तो मैं या लगभग सभी लोग गलत हो रहे हैं।


1
हाय डेविड। यहाँ कागज है कि मुझे इसके बारे में सोच रहा है: लिंक
एंड्रयू क्लेसेन

2
आपकी पहली पंक्ति में आपको "लिखने के बजाय" का अर्थ नहीं है ... मूल रूप से साथ परिणाम लेकिन बाद में सत्यापन के बाद साथ ... "? थ्रेसहोल्ड से अधिक साथ एक परिणाम अन्यथा एक नकारात्मक परिणाम कहा जाता है । आपके संपादन के बाद भी, की व्याख्या का आपका चरित्र-चित्रण गलत है, इसलिए मैं सुझाव देना चाहूंगा कि आप हमारे कुछ पोस्ट की समीक्षा करने के लिए कुछ क्षणों की समीक्षा करें, जो कि आप पी-मान और पुनर्विचार की व्याख्या करना चाहते हैं। p<0.05p0.05pαp
व्हीबर

1
यदि आप चाहें तो आप अपने प्रश्न को हटा सकते हैं, लेकिन जैसा कि आपने दो upvotes प्राप्त किए हैं (ओह बिल्ली, चलो इसे 3 बनाते हैं), एक उत्कीर्ण उत्तर, और "तुम्हारा सही मायने में" से एक और उत्तर प्राप्त करने वाले हैं, मैं अनुरोध करता हूं कि आप इसे छोड़ दें सक्रिय और उस पर काम करें जैसा कि आप फिट देखते हैं, हालांकि मैं सम्मानपूर्वक आपके अधिकार को अपनी इच्छा के अनुसार करना चाहता हूं। चीयर्स!
निक स्टॉनर

1
मैं @ नीक, एंड्रयू से सहमत हूं: आपके पास यहां एक अस्पष्ट और उत्तेजक सवाल है जिसने कुछ विचार और ध्यान आकर्षित किया है, इसलिए हम सबसे आभारी होंगे यदि आप इसे पोस्ट करते रहेंगे और, यदि आप कर सकते हैं, तो इसे थोड़ा ध्यान केंद्रित करें। पी-वैल्यू की व्याख्या कैसे की जाती है, इसके बारे में मुख्य मुद्दा। उपन्यास हिस्सा, जो मैं बता सकता हूं, वह सुझाव है कि अस्वीकृति मानदंड एक बड़े पी-मूल्य पर आधारित होना चाहिए। अपनी टिप्पणी दें: एक झूठी सकारात्मक तब होती है जब परीक्षण महत्वपूर्ण होता है लेकिन यह ज्ञात है कि अशक्त परिकल्पना सच है।
व्हिबर

1
@ वाउचर: मेरे लिए अधिक सम्मोहक पृष्ठभूमि का फोकस इस बात पर है कि परिणाम यह बताएगा कि बड़े नमूने के साथ अनुवर्ती प्रयोग के उत्पादक होने की संभावना है। अब तक की प्रतिक्रियाओं को देखते हुए, ऐसा लगता है कि मुझे यह पूछने की आवश्यकता है कि क्या पी-वैल्यू उस प्रश्न से संबंधित हो सकते हैं। यह जानते हुए कि अशक्त परिकल्पना एक झूठी सकारात्मक के माप के रूप में सत्य है: जब कोई कहेगा कि अशक्त परिकल्पना स्थिति p के बाहर सत्य है> (1 - α)
एंड्रयू क्लासेन

जवाबों:


15

आपका प्रश्न झूठे आधार पर आधारित है:

पी <0.50 होने पर गलत होने की तुलना में अशक्त परिकल्पना अभी भी अधिक नहीं है

एक पी-मूल्य एक संभावना नहीं है कि अशक्त परिकल्पना सच है। उदाहरण के लिए, यदि आपने एक हज़ार मामले लिए हैं जहाँ अशक्त परिकल्पना सच है, तो उनमें से आधे के पास होगा p < .5। वे आधे सब शून्य हो जाएंगे।

दरअसल, इस विचार का p > .95अर्थ है कि अशक्त परिकल्पना "शायद सच है" समान रूप से भ्रामक है। यदि शून्य परिकल्पना सत्य है, तो संभावना जो कि संभावना p > .95के समान ही है p < .05

ईटीए: आपका संपादन यह स्पष्ट करता है कि समस्या क्या है: आपके पास अभी भी ऊपर का मुद्दा है (कि आप पी-मान को एक प्रतिकूल संभावना के रूप में मान रहे हैं, जब यह नहीं है)। यह ध्यान रखें कि यह महत्वपूर्ण है नहीं एक सूक्ष्म दार्शनिक भेद (के रूप में मैं आप लॉटरी टिकट की अपनी चर्चा के साथ हैं जिसका अर्थ लगता है): यह पी मूल्यों की कोई व्याख्या के लिए भारी व्यावहारिक प्रभाव पड़ता है।

लेकिन एक परिवर्तन है जो आप पी-मानों पर कर सकते हैं जो आपको वही मिलेगा जो आप खोज रहे हैं, और इसे स्थानीय झूठी खोज दर कहा जाता है। (जैसा कि इस अच्छे पेपर द्वारा बताया गया है , यह "पोस्टीरियर एरर प्रोबेबिलिटी" के लगातार बराबर है, इसलिए इसे इस तरह से सोचें यदि आप चाहें तो)।

आइए एक ठोस उदाहरण के साथ काम करें। मान लीजिए कि आप यह निर्धारित करने के लिए एक टी-टेस्ट कर रहे हैं कि क्या 10 नंबरों का नमूना (सामान्य वितरण से) का मतलब 0 (एक-नमूना, दो-तरफा टी-टेस्ट) है। पहले, आइए देखें कि पी-वैल्यू वितरण कैसा दिखता है जब वास्तव में शून्य एक छोटा आर सिमुलेशन के साथ होता है:

null.pvals = replicate(10000, t.test(rnorm(10, mean=0, sd=1))$p.value)
hist(null.pvals)

यहाँ छवि विवरण दर्ज करें

जैसा कि हम देख सकते हैं, अशक्त पी-मानों का एक समान वितरण होता है (0 और 1 के बीच सभी बिंदुओं पर समान रूप से संभावना)। यह पी-वैल्यू की एक आवश्यक शर्त है: वास्तव में, यह ठीक है कि पी-वैल्यू का क्या मतलब है! (यह देखते हुए कि यह सच है, 5% संभावना है कि यह .05 से कम है, 10% मौका यह 1 से कम है।)

अब आइए वैकल्पिक परिकल्पना पर विचार करें- ऐसे मामले जहां शून्य गलत है। अब, यह थोड़ा अधिक जटिल है: जब अशक्त झूठ है, तो "कितना झूठ है"? नमूने का मतलब 0 नहीं है, लेकिन यह 5 है? 1? 10? क्या यह बेतरतीब ढंग से बदलता है, कभी छोटा और कभी बड़ा? सादगी के लिए, मान लें कि यह हमेशा 5 के बराबर है (लेकिन याद रखें कि जटिलता, यह बाद में महत्वपूर्ण होगा):

alt.pvals = replicate(10000, t.test(rnorm(10, mean=.5, sd=1))$p.value)
hist(alt.pvals)

यहाँ छवि विवरण दर्ज करें

ध्यान दें कि वितरण अब एक समान नहीं है: इसे 0 की ओर स्थानांतरित कर दिया गया है! अपनी टिप्पणी में आप एक "विषमता" का उल्लेख करते हैं जो जानकारी देती है: यह वह विषमता है।

तो कल्पना कीजिए कि आप उन दोनों वितरणों को जानते थे, लेकिन आप एक नए प्रयोग के साथ काम कर रहे हैं, और आपके पास एक पूर्व है कि 50% संभावना है कि यह शून्य है और 50% यह वैकल्पिक है। आपको .7 का पी-मान मिलता है। आप उस से कैसे प्राप्त कर सकते हैं और पी-मान एक संभावना के लिए?

आपको घनत्व की तुलना क्या करनी चाहिए :

lines(density(alt.pvals, bw=.02))
plot(density(null.pvals, bw=.02))

और अपने पी-मूल्य को देखें:

abline(v=.7, col="red", lty=2)

यहाँ छवि विवरण दर्ज करें

नल घनत्व और वैकल्पिक घनत्व के बीच का अनुपात स्थानीय झूठी खोज दर की गणना करने के लिए इस्तेमाल किया जा सकता है : उच्च नल वैकल्पिक के सापेक्ष है, उच्च स्थानीय FDR। यही संभावना है कि परिकल्पना शून्य है (तकनीकी रूप से इसकी सख्त व्याख्या है, लेकिन हम इसे यहां सरल रखेंगे)। यदि वह मूल्य बहुत अधिक है, तो आप व्याख्या कर सकते हैं "शून्य परिकल्पना लगभग निश्चित रूप से सच है।" वास्तव में, आप स्थानीय FDR की .05 और .95 सीमा बना सकते हैं: इसमें वे गुण होंगे जिनकी आप तलाश कर रहे हैं। (और चूंकि स्थानीय एफडीआर पी-मान के साथ एक-दूसरे से बढ़ता है, कम से कम यदि आप इसे सही कर रहे हैं, तो ये कुछ थ्रेसहोल्ड ए और बी में अनुवाद करेंगे जहां आप कह सकते हैं "

अब, मैं आपको पहले ही पूछ सकता हूँ "फिर हम पी-वैल्यू के बजाय इसका उपयोग क्यों नहीं करते?" दो कारण:

  1. आपको एक पूर्व संभावना पर निर्णय लेने की आवश्यकता है कि परीक्षण शून्य है
  2. आपको विकल्प के तहत घनत्व को जानना होगा। यह अनुमान लगाना बहुत मुश्किल है, क्योंकि आपको यह निर्धारित करने की आवश्यकता है कि आपके प्रभाव के आकार और संस्करण कितने बड़े हो सकते हैं, और वे कितनी बार ऐसा करते हैं!

आपको पी-वैल्यू टेस्ट के लिए उन दोनों में से किसी की आवश्यकता नहीं है, और पी-वैल्यू टेस्ट अभी भी आपको झूठी सकारात्मकता से बचने की सुविधा देता है (जो कि इसका प्राथमिक उद्देश्य है)। अब, यह है कई परिकल्पना परीक्षण में उन मूल्यों के दोनों अनुमान लगाने के लिए, आप पी मूल्यों के हजारों है जब संभव हो (जैसे जीन के हजारों में से प्रत्येक के लिए एक परीक्षण के रूप में: देखने के इस पत्र या इस पत्र उदाहरण के लिए), लेकिन नहीं है जब आप 'एक ही परीक्षा कर रहे हैं।

अंत में, आप कह सकते हैं कि "क्या अभी भी गलत नहीं है कि एक प्रतिकृति जो पी -5 मान से ऊपर पी-मूल्य की ओर जाता है, एक गलत सकारात्मक है?" ठीक है, जबकि यह सच है कि .04 का एक पी-वैल्यू और .06 का एक और पी-वैल्यू प्राप्त करना वास्तव में मूल परिणाम गलत नहीं था, व्यवहार में इसे लेने के लिए एक उचित मीट्रिक है। लेकिन किसी भी मामले में, आपको यह जानकर खुशी हो सकती है कि दूसरों को इसके बारे में संदेह है! आप जिस पेपर का उल्लेख करते हैं, वह आंकड़ों में कुछ विवादास्पद है: यह पेपर एक अलग पद्धति का उपयोग करता है और चिकित्सा अनुसंधान से पी-मूल्यों के बारे में बहुत अलग निष्कर्ष पर आता है, और फिर उस अध्ययन की कुछ प्रमुख बेइज़ियन (और दौर) द्वारा आलोचना की गई थी ...)। इसलिए जब आपका प्रश्न पी-वैल्यू के बारे में कुछ दोषपूर्ण अनुमानों पर आधारित है, तो मुझे लगता है कि यह आपके द्वारा उद्धृत पेपर के हिस्से पर एक दिलचस्प धारणा की जांच करता है।


हाय डेविड। निष्पक्ष बिंदु। मैं उस हिस्से को गलत नहीं होने के लिए अपने प्रश्न को फिर से बनाने पर काम करूंगा, और देखूंगा कि क्या मुझे अभी भी कोई समस्या दिखाई देती है।
एंड्रयू क्लासेन 20

@David_Robinson: बायेसियन नियम में झूठी-अलार्म दर के रूप में पी-मान का उपयोग करना सही होगा, और अनुसंधान की संभावना और / या अशक्त परिकल्पना के बारे में निष्कर्ष निकालने में सक्षम हो सकता है? 50% से पहले सेट करें और वहां से तेज और ढीला खेलें? :-)
एंड्रयू कालेसेन

1
ऐ, आकर्षक! क्या आप इसे अपने उत्तर में काम कर सकते हैं? लेकिन वहाँ एक विषमता है कि पी कैसे व्यवहार करता है जब शून्य सत्य है बनाम जब यह गलत है कि ~ ~ संभावना देना चाहिए कि डेटा से निकाले गए पी-मान के आधार पर शून्य परिकल्पना सच है की संभावना के बारे में कुछ जानकारी दें। अगर एक सच्चा अशक्त परिकल्पना समान रूप से वितरित पी-मान पैदा करता है, और एक सच्चा नहीं-शून्य परिकल्पना पी-मान पैदा करता है जो 0 की ओर तिरछा होता है, तो एपी = 0.01 मार्बल ~ खींचता है ~ आपको सुझाव है कि आपके द्वारा न उठाए जाने की संभावना अधिक है। प्रयोगों की पूरी जार, भले ही प्रयोग करके संभावना बदल नहीं है।
एंड्रयू क्लासेन

1
@AndrewKlaassen: आप "स्थानीय झूठी खोज दर" की अवधारणा में दिलचस्पी ले सकते हैं। यह बायेसियन पोस्टीरियर संभावना के बराबर एक निरंतरवादी है जो शून्य सत्य है। इसके लिए दो बातों की आवश्यकता होती है: क) एक पूर्व संभावना है कि अशक्त सत्य है (कभी-कभी इसे pi0 कहा जाता है), और ख) वैकल्पिक परिकल्पना के लिए घनत्व का अनुमान है। एकाधिक परिकल्पना परीक्षण (यदि आपके पास हजारों पी-मान थे) में, घनत्व को देखकर इन दोनों का अनुमान लगाना संभव है। यदि मेरे पास थोड़ा और समय है तो मैं अपने उत्तर में एक गहन व्याख्या का निर्माण कर सकता हूं।
डेविड रॉबिन्सन

1
@AndrewKlaassen: मेरा संपादन देखें, जहां मैं स्थानीय एफडीआर के बारे में विस्तार से बताता हूं, यह आपके मूल्य "ए" की गणना करने का तरीका क्यों है (हालांकि आप ए की गणना करते समय .05 बदलना चाहते हैं), और यह भी कि इसका उपयोग शायद ही कभी क्यों किया जाता है। । वैसे भी, एक बिंदु को स्पष्ट करने के लिए जो वास्तव में जवाब में फिट नहीं होता है: लॉटरी टिकट के साथ आपका उदाहरण उस बिंदु को गलत समझता है जो मैं और अन्य बना रहे हैं। हम "नई जानकारी के साथ संभावनाएँ बदलते हैं" (बायेसियन और फ़्रीवॉन्सर दोनों की उस की अपनी व्याख्या है) के विचार पर लटका नहीं रहे थे: मुद्दा सिर्फ इतना है कि आप उन्हें सही तरीके से नहीं बदल रहे थे!
डेविड रॉबिन्सन

10

किसी भी पर अपने माउस मँडरा (एक नकली टैग है) इसके विकी का एक संक्षिप्त अंश देखने के लिए नीचे दिखाई दे रहा है। कृपया लाइन रिक्ति के व्यवधान को क्षमा करें। मुझे यह सार्थक लगता है क्योंकि टैग अंश पाठकों को पढ़ने के दौरान शब्दजाल की समझ की जांच करने में मदद कर सकता है। इन अंशों में से कुछ संपादन के लायक भी हो सकते हैं, इसलिए वे भी एक प्रचारक, IMHO के योग्य हैं।

p>.05 आमतौर पर तात्पर्य किसी को अस्वीकार नहीं करना चाहिए । इसके विपरीत,या झूठी सकारात्मकता तब होती है जब कोई व्यक्ति अशक्त को अस्वीकार कर देता है त्रुटि या कुछ अन्य असामान्य घटना जो उत्पादन करती है अन्यथा यह असंभव नहीं था (आमतौर पर साथ p<.05) एक से बेतरतीब ढंग से नमूना लिया गया है जिसमें नल सत्य है। के साथ एक परिणामp>.05 जिसे एक झूठी सकारात्मक कहा जाता है, वह गलत परिकल्पना की गलतफहमी को दर्शाता है आईएनजी (NHST)। प्रकाशित शोध साहित्य में गलतफहमी असामान्य नहीं है, क्योंकि एनएचएसटी कुख्यात रूप से प्रति-सहज है। यह रैली के रोने में से एक हैआक्रमण (जो मैं समर्थन करता हूं, लेकिन पालन नहीं करता ... अभी तक)। मैंने हाल ही में अपने आप को इन जैसे गलत छापों के साथ काम किया है, इसलिए मैं सबसे अधिक दिल से सहानुभूति रखता हूं।

@DavidRobinson यह देखने में सही है p शून्य के झूठे होने की संभावना नहीं है NHST। यह (कम से कम) गुडमैन में से एक (2008) "डर्टी डोजेन" के बारे में गलत धारणा हैpमान ( हर्लबर्ट और लोम्बार्डी, 2009 भी देखें ) । NHST में,p है जो किसी भी भविष्य के यादृच्छिक नमूनों को उसी माध्यम से आकर्षित करेगा, जो किसी रिश्ते या अंतर (या जो कुछ भी) का प्रदर्शन करेगा अशक्त के खिलाफ परीक्षण किया जा रहा है, यदि प्रभाव आकार की अन्य किस्में मौजूद हैं ...?) कम से कम अशक्त परिकल्पना से अलग (एक ही जनसंख्या) के नमूने (ओं) के रूप में एक से एक पर पहुंचने के लिए परीक्षण किया है pमान, यदि नल सत्य है। अर्थात्,pएक नमूना प्राप्त करने की संभावना है जैसे तुम्हारा दिया गया नल ; यह शून्य की संभावना को प्रतिबिंबित नहीं करता है - कम से कम, सीधे नहीं। इसके विपरीत, बायेसियन विधियों ने सांख्यिकीय विश्लेषण के अपने सूत्रीकरण पर गर्व किया, जैसा कि साक्ष्य के आकलन के लिए या उसके खिलाफ केंद्रित थाएक प्रभाव के सिद्धांत को दिया गया है , जिसके बारे में उनका तर्क है कि अन्य फायदे के साथ अधिक सहज रूप से आकर्षक दृष्टिकोण ( Wagenmakers, 2007 ) है , और एक तरफ विवादित नुकसान की स्थापना। (निष्पक्ष होने के लिए, " बायेसियन विश्लेषण के विचार क्या हैं? " आपने उन लेखों का हवाला दिया है जो वहां कुछ अच्छे उत्तर दे सकते हैं: मोये, 2008; हर्लबर्ट और लोम्बार्डी, 2009। )

वास्तव में, शाब्दिक रूप से कहा गया अशक्त परिकल्पना अक्सर गलत होने की तुलना में अधिक होने की संभावना है, क्योंकि शून्य परिकल्पना सबसे अधिक होती है, शाब्दिक रूप से शून्य प्रभाव की परिकल्पना । (कुछ आसान जवाबी उदाहरणों के लिए, उत्तर देखें: " क्या बड़े डेटा परिकल्पना परीक्षण के लिए अनुपयुक्त हैं? ") दर्शन संबंधी मुद्दे जैसे कि तितली के प्रभाव से शाब्दिक खतरा पैदा होता है।ऐसी किसी भी परिकल्पना का; इसलिए अशक्त कुछ nonzero प्रभाव की एक वैकल्पिक परिकल्पना के लिए तुलना के आधार के रूप में सबसे अधिक उपयोगी है। इस तरह की एक वैकल्पिक परिकल्पना डेटा एकत्र किए जाने के बाद नल की तुलना में अधिक प्रशंसनीय रह सकती है जो कि नल के सत्य होने पर असंभव थी । इसलिए शोधकर्ता आमतौर पर अशक्त के खिलाफ सबूत से एक वैकल्पिक परिकल्पना के लिए समर्थन का अनुमान लगाते हैं, लेकिन ऐसा नहीं हैसीधे मात्रा ( Wagenmakers, 2007 )

जैसा कि आपको संदेह है, का एक कार्य है , साथ ही प्रभाव आकार और स्थिरता। (देखें @ हाल ही में सवाल का गुंग का जवाब, " कैसे एक टी परीक्षण सांख्यिकीय रूप से महत्वपूर्ण हो सकता है, तो मतलब अंतर लगभग 0 है? ") सवाल हम अक्सर अपने डेटा के पूछने के लिए करना चाहते हैं, कर रहे हैं "के प्रभाव क्या है xपर y? " विभिन्न कारणों से (आंकड़ों में, विशेष रूप से गैर-सांख्यिकीविदों द्वारा सिखाया गया, जैसे IMO, गलत और अन्यथा कमी वाले शैक्षिक कार्यक्रम), हम अक्सर खुद को खोजने के बजाय शाब्दिक रूप से संबंधित प्रश्न पूछते हैं, "मेरे जैसे बेतरतीब ढंग से नमूना लेने की संभावना क्या है।" जिस आबादी पर xकोई असर नहीं पड़ता y? " यह क्रमशः प्रभाव के आकार के आकलन और महत्व के परीक्षण के बीच आवश्यक अंतर है। एp मूल्य केवल उत्तरार्द्ध प्रश्न का सीधे उत्तर देता है, लेकिन कई पेशेवर (@rpierce शायद आपको मुझसे बेहतर सूची दे सकते हैं; मुझे आपको इसमें खींचने के लिए क्षमा करें!) ने तर्क दिया है कि शोधकर्ताओं ने गलत अनुमान लगाया है! pप्रभाव आकार के पूर्व प्रश्न के उत्तर के रूप में सभी अक्सर; मुझे डर है कि मैं सहमत होना चाहिए।

के अर्थ के बारे में अधिक सीधे जवाब देने के लिए .05<p<.95, यह है कि जिस डेटा की आबादी सच है, अशक्त होने पर यादृच्छिक रूप से नमूना लेने की संभावना है, लेकिन यह उस संबंध या अंतर को प्रदर्शित करता है, जो इससे भिन्न होता है, जो कि शून्य का शाब्दिक रूप से विस्तृत और आपके डेटा के अनुरूप एक मार्जिन द्वारा वर्णन करता है। .. <श्वास> ... 5-95% के बीच है। एक निश्चित रूप से यह तर्क दे सकता है कि यह नमूना आकार का एक परिणाम है, क्योंकि नमूना आकार बढ़ने से छोटे और असंगत प्रभाव के आकार का पता लगाने की क्षमता में सुधार होता है और 5% से अधिक आत्मविश्वास के साथ शून्य प्रभाव, के शून्य प्रभाव से उन्हें अलग करता है। हालांकि, छोटे और असंगत प्रभाव आकार व्यावहारिक रूप से महत्वपूर्ण हो सकते हैं या नहीं भी हो सकते हैं (महत्वपूर्ण रूप से सांख्यिकीय - गुडमैन का एक और (2008) गंदा दर्जन); यह डेटा के अर्थ पर कहीं अधिक निर्भर करता है, जिसके साथ सांख्यिकीय महत्व केवल सीमित सीमा तक ही चिंता करता है। ऊपर दिए गए मेरे जवाब को देखें ।

क्या किसी परिणाम को निश्चित रूप से गलत (केवल असमर्थित के बजाय) कॉल करना सही नहीं होना चाहिए अगर ... p> 0.95?

चूंकि डेटा को आमतौर पर अनुभवजन्य तथ्यात्मक टिप्पणियों का प्रतिनिधित्व करना चाहिए , वे झूठे नहीं होने चाहिए; आदर्श रूप में उनके बारे में केवल इस जोखिम का सामना करना चाहिए। (मापन त्रुटि भी निश्चित रूप से होती है, लेकिन यह मुद्दा कुछ हद तक इस उत्तर के दायरे से बाहर है, इसलिए इसे यहां उल्लेख करने से अलग, मैं इसे अन्यथा अकेले ही बताऊंगा।) कुछ जोखिम हमेशा अशक्त होने के बारे में गलत सकारात्मक अनुमान लगाने से कम उपयोगी होते हैं। वैकल्पिक परिकल्पना की तुलना में, कम से कम जब तक कि अवर को पता नहीं है कि यह सच है। केवल ज्ञान की कठिन-से-कठिन परिस्थिति में कि अशक्त वस्तुतः सत्य है और एक वैकल्पिक परिकल्पना के पक्ष में एक अनुमान निश्चित रूप से गलत है ... कम से कम, जहां तक ​​मैं इस समय की कल्पना कर सकता हूं।

स्पष्ट रूप से, व्यापक उपयोग या सम्मेलन महामारी या हीनता की वैधता पर सबसे अच्छा अधिकार नहीं है। यहां तक ​​कि प्रकाशित संसाधन गिरने योग्य हैं; उदाहरण के लिए पी-वैल्यू परिभाषा में गिरावट । आपका संदर्भ ( हर्लबर्ट और लोम्बार्डी, 2009 ) इस सिद्धांत का कुछ दिलचस्प विवरण भी प्रस्तुत करता है (पृष्ठ 322):

स्टेटसॉफ्ट (2007) अपनी वेबसाइट पर दावा करता है कि उनका ऑनलाइन मैनुअल "एनसाइक्लोपीडिया बिटकॉइनिका द्वारा अनुशंसित आंकड़ों पर एकमात्र इंटरनेट संसाधन है।" बम्पर स्टिकर के अनुसार, 'डेजर्ट्स अथॉरिटी' के लिए यह इतना महत्वपूर्ण नहीं है। [कॉमली टूटी हुई यूआरएल हाइपरलिंक किए गए पाठ में परिवर्तित हो गई।]

इस मामले में एक और मामला: एक बहुत ही हालिया नेचर न्यूज़ लेख ( Nuzzo, 2014 ) में यह वाक्यांश : "P value, साक्ष्य की ताकत के लिए एक सामान्य सूचकांक ..." Wagenmakers देखें (2007, पृष्ठ 787) "समस्या 3:pमान सांख्यिकीय प्रमाण नहीं निर्धारित करते हैं "... हालांकि, @MichaelLew ( Lew, 2013 ) एक तरह से असहमत है जो आपको उपयोगी लग सकता है: वह उपयोग करता हैpसंभावित कार्यों को अनुक्रमित करने के लिए मूल्य। फिर भी इन प्रकाशित स्रोतों में एक दूसरे के विपरीत, कम से कम एक गलत होना चाहिए! (किसी स्तर पर, मुझे लगता है ...) बेशक, यह "अविश्वास" के प्रति उतना बुरा नहीं है। मुझे आशा है कि मैं माइकल को यहाँ टैगिंग के रूप में चिन्हित कर सकता हूँ क्योंकि मेरे पास है (लेकिन मुझे यकीन नहीं है कि उपयोगकर्ता टैग सूचना भेजते समय संपादित किए जाएंगे - मुझे नहीं लगता कि आपका ओपी में किया था)। वह केवल एक ही हो सकता है जो नाज़ो को बचा सकता है - यहां तक ​​कि प्रकृति भी ! हमारी मदद करें ओबी-वान! (और मुझे माफ़ करें अगर मेरा जवाब यहाँ प्रदर्शित करता है कि मैं अभी भी आपके काम के निहितार्थ को समझने में विफल रहा हूँ, जो मुझे यकीन है कि मैं किसी भी मामले में है ...) BTW, Nuzzo भी कुछ पेचीदा आत्म-रक्षा और प्रतिनियुक्ति प्रदान करता है Wagenmaakers की "समस्या 3": Nuzzo का "संभावित कारण" देखें( गुडमैन, 2001 , 1992; गोरोचन, हॉज, हीमैन, डर्नर, और ग्रीनबर्ग, 2007 ) । इनमें केवल वह उत्तर शामिल हो सकता है जिसकी आप वास्तव में तलाश कर रहे हैं, लेकिन मुझे संदेह है कि मैं बता सकता हूं।

पुन: आपके बहुविकल्पीय प्रश्न, मैं चुनता हूं d। हो सकता है कि आपने यहां कुछ अवधारणाओं का गलत अर्थ निकाला हो, लेकिन आप निश्चित रूप से अकेले नहीं हैं यदि आप ऐसा करते हैं, और मैं आपको निर्णय छोड़ दूंगा, क्योंकि केवल आप ही जानते हैं कि आप वास्तव में क्या मानते हैं। गलत व्याख्या निश्चित रूप से कुछ मात्रा में होती है, जबकि एक प्रश्न पूछना विपरीत का अर्थ है, और यह कि जब सवाल अनिश्चित और प्रशंसनीय है, तो यह बहुत ही प्रशंसनीय है। मानव स्वभाव का यह मामला हमारे सम्मेलनों की गलत तरीके से हानिरहित रूप से कम, और यहां संदर्भित लोगों की शिकायतों के योग्य बनाता है। (आपके हिस्से में धन्यवाद!) हालांकि, आपका प्रस्ताव पूरी तरह से सही नहीं है।

से जुड़ी समस्याओं की कुछ रोचक चर्चा pजिन मूल्यों में मैंने भाग लिया है, वे इस प्रश्न में प्रकट होते हैं: पी-मानों के उलझे हुए विचार । मेरा जवाब कुछ संदर्भों को सूचीबद्ध करता है जिन्हें आप व्याख्यात्मक समस्याओं और विकल्पों के लिए आगे पढ़ने के लिए उपयोगी हो सकते हैंpमान। पूर्वाभास हो: मैं अभी भी इस विशेष खरगोश छेद के नीचे खुद को नहीं मार पाया हूं, लेकिन मैं आपको कम से कम यह बता सकता हूं कि यह बहुत गहरा है । मैं अभी भी इसके बारे में खुद सीख रहा हूं (अन्यथा मुझे संदेह है कि मैं अधिक बायेसियन परिप्रेक्ष्य से संपादित करूंगा ]: या शायद एनएफएसए परिप्रेक्ष्य! हर्लबर्ट और लोम्बार्डी, 2009 ) , मैं सबसे अच्छे रूप में एक कमजोर प्राधिकरण हूं, और मैं स्वागत करता हूं किसी भी सुधार या विस्तार से दूसरों को जो मैंने यहाँ कहा है, उसकी पेशकश कर सकते हैं। मैं सभी निष्कर्ष निकाल सकता हूं कि शायद गणितीय रूप से सही उत्तर है, और यह अच्छी तरह से हो सकता है कि ज्यादातर लोग इसे गलत समझें। सही उत्तर निश्चित रूप से आसानी से नहीं आता है, क्योंकि निम्नलिखित संदर्भ प्रदर्शित होते हैं ...

PS के रूप में अनुरोध किया गया (जैसे ... मैं मानता हूं कि मैं वास्तव में इसे काम करने के बजाय इस पर काम कर रहा हूं), यह सवाल कभी-कभी एक समान वितरण के लिए एक बेहतर संदर्भ हैpnull दिया: " क्यों p- मानों को समान रूप से शून्य परिकल्पना के तहत वितरित किया जाता है? " विशेष रूप से रुचि @ whuber की टिप्पणियां हैं, जो अपवादों का एक वर्ग बढ़ाती हैं। एक पूरे के रूप में चर्चा के साथ कुछ हद तक सही है, मैं 100% तर्कों का पालन नहीं करता हूं, अकेले उनके निहितार्थ बताएं, इसलिए मैं उन समस्याओं के बारे में नहीं हूंpवितरण एकरूपता वास्तव में असाधारण हैं। इसके अलावा गहरे बैठे सांख्यिकीय भ्रम के लिए, मुझे डर है ...

संदर्भ

- गुडमैन, एसएन (1992)। प्रतिकृति, पी uesvalues ​​और सबूत पर एक टिप्पणी । चिकित्सा में सांख्यिकी, 11 (7), 875-879।
- गुडमैन, एसएन (2001)। के पी ए विनम्र प्रस्ताव: -values और Bayes। महामारी विज्ञान, 12 (3), 295-297। Http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_BayesesA_Modest_Proposal.6.pdf से पुनर्प्राप्त किया गया ।
- गुडमैन, एस। (2008)। एक गंदा दर्जन: बारहवीं- पी- गलत धारणाएं। हेमटोलॉजी में सेमिनार, 45 (3), 135-140। से लिया गया http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf
- गोरोचन, पी।, हॉज, एसई, हीमैन, जीए, डर्नर, एम।, और ग्रीनबर्ग, डीए (2007)। संघ अध्ययनों की गैर-प्रतिकृति: "छद्म विफलताओं" को दोहराने के लिए? चिकित्सा में जेनेटिक्स, 9 (6), 325-331। Http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html से लिया गया ।
- हर्लबर्ट, एसएच, और लोम्बार्डी, सीएम (2009)। नेमन-पियर्सन निर्णय सिद्धांत और रूपरेखा के अंतिम पतन नेफिशियन का उदय। एनलस ज़ूलोगिसी फ़ेनिकी, 46 (5), 311-349। से लिया गया http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf
- ल्यू, एमजे (2013)। P के लिए P या नहीं: P- मानों की स्पष्ट प्रकृति और वैज्ञानिक अनुमान में उनके स्थान पर। arXiv: 1311.0081 [stat.ME]। से लिया गयाhttp://arxiv.org/abs/1311.0081
- मोय, ला (2008)। नैदानिक ​​परीक्षणों में बायिसियन: स्विच पर सोएं। चिकित्सा में सांख्यिकी, 27 (4), 469-482।
- नाज़ो, आर। (2014, 12 फरवरी)। वैज्ञानिक विधि: सांख्यिकीय त्रुटियां। नेचर न्यूज, 506 (7487)। Http://www.nature.com/news/scientific-method-statutic-errors-1.14700 से लिया गया ।
- वागेनमेकर्स, ईजे (2007)। P मानों की व्यापक समस्याओं का एक व्यावहारिक समाधान । साइकोनोमिक बुलेटिन एंड रिव्यू, 14 (5), 779-804। Http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf से लिया गया ।


मैं अभी भी आपके बहुत गहन उत्तर (इसके लिए धन्यवाद) के माध्यम से काम कर रहा हूं, लेकिन "बायेसियन आक्रमण" के आपके उल्लेख ने मुझे "बायेसियन इन क्लिनिकल ट्रायल्स: सो एट द स्विच", अध्याय 12 के रूप में पुनर्मुद्रित किया , जिसे मैंने ' मैं भी धीरे-धीरे मेरे सिर को लपेट रहा हूं।
एंड्रयू क्लासेन

"आप या तो उस पृष्ठ पर पहुँच गए हैं जो देखने के लिए अनुपलब्ध है या इस पुस्तक के लिए आपकी देखने की सीमा तक पहुँच गया है" ...?
निक स्टॉनर

1
बदकिस्मती से। यदि आपके पास जर्नल एक्सेस है, तो आप इसे यहां पा सकते हैं । वाक्यांश के लिए एक खोज "बेईसियन अब नैदानिक ​​परीक्षणों में पारंपरिक बाधाओं को तोड़ रहे हैं" आपको वहां भी मिल सकता है।
एंड्रयू क्लासेन

1
नेमन-पियर्सन निर्णय सिद्धांत के अंतिम ढहने और नियोफिशरियन के उदय में अनुसंधान में बायेसियन विश्लेषण के उपयोग पर पी-मूल्यों और हमले का एक मनोरंजक इतिहास भी शामिल है। मैं यह नहीं कह सकता कि मैं इसका मूल्यांकन करने के लिए इसे पर्याप्त रूप से समझता हूं, लेकिन मुझे लगता है कि कम से कम वर्तमान उत्साह के लिए सुधारों के बारे में पता होना अच्छा है।
एंड्रयू क्लासेन

1
@NickStauner बस यह चर्चा मिली। कम से कम एक खाते के गलत होने के लिए आवश्यक नहीं है यदि उन खातों का एक समूह है जो असहमत हैं। वे विभिन्न मॉडलों पर आधारित हो सकते हैं। [यदि आप खेल हैं, तो आपको बिल थॉम्पसन की पुस्तक द नेचर ऑफ स्टैटिस्टिकल एविडेंस (2005) को पढ़ना चाहिए। अनैतिक, मेरा खाता निश्चित रूप से सही है ;-) (हालांकि आज सुबह फिर से एक पत्रिका द्वारा खारिज कर दिया गया।) मुझे नोज़ो पेपर मिला। लापरवाह और संभावित रूप से भ्रामक हो।
माइकल लुईस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.