एक P- मान को गलत समझना?


17

इसलिए मैं पी-वैल्यू की सही व्याख्या करने के तरीके के बारे में बहुत कुछ पढ़ रहा हूं, और जो मैंने पढ़ा है, उससे पी-वैल्यू इस संभावना के बारे में कुछ भी नहीं कहता है कि शून्य परिकल्पना सही है या गलत। हालांकि, जब निम्नलिखित बयान पढ़ रहे हैं:

पी - मान एक प्रकार की त्रुटि बनाने की संभावना का प्रतिनिधित्व करता है, या जब यह सत्य है तो अशक्त परिकल्पना को खारिज कर देता है। पी मूल्य जितना छोटा होगा, उतना ही कम संभावना है कि आप गलत तरीके से गलत परिकल्पना को खारिज कर देंगे।

संपादित करें: और फिर 5 मिनट बाद मैंने पढ़ा:

P मानों की गलत व्याख्या बहुत आम है। सबसे आम गलती है एक पी वैल्यू की व्याख्या करना, एक सच्चे अशक्त परिकल्पना (एक प्रकार मैं त्रुटि) को अस्वीकार करके गलती करने की संभावना।

इसने मुझे भ्रमित कर दिया। कौनसा सही है? और क्या कोई यह बता सकता है कि पी-वैल्यू की सही व्याख्या कैसे की जाए और एक प्रकार की त्रुटि करने की संभावना से यह कैसे ठीक से संबंधित है?


1
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is trueपी - मान एक प्रकार की त्रुटि करने की एप्रीओरी संभावना का प्रतिनिधित्व करता है, जो कि इस धारणा के तहत अशक्त परिकल्पना को खारिज करता है कि यह सत्य है।
tnnphns

4
@Paul: अशक्त होने पर अशक्त स्थिति को अस्वीकार करने की संभावना एक प्रकार की त्रुटि की संभावना है, यह पी-मान के समान नहीं है। एक प्रकार की त्रुटि की स्थिरता समान स्तर के लिए (निरंतर यादृच्छिक चर के लिए) बराबर है, नीचे मेरा जवाब भी देखें।

हां, अब मैं देख रहा हूं, आप बिल्कुल सही हैं।
पॉल

4
@fcoppens एक प्रकार की त्रुटि की संभावना केवल अल्फा के पूर्व-चुने हुए स्तर के बराबर है यदि आप अशक्त परिकल्पना के सत्य होने की स्थिति में हैं। बिना शर्त मामले में आप यह नहीं जानते हैं कि अशक्त सही या गलत है और इसलिए आप केवल एक प्रकार की त्रुटि की संभावना को निर्दिष्ट कर सकते हैं यदि आप अशक्त की सत्यता के लिए पूर्व संभावना की आपूर्ति करते हैं।
माइकल ल्यू -

@ माइकल लीव: नल पर यह कंडीशनिंग नीचे मेरे जवाब में उल्लिखित है?

जवाबों:


25

आपकी टिप्पणियों के कारण मैं दो अलग-अलग खंड बनाऊंगा:

पी मूल्यों

सांख्यिकीय परिकल्पना परीक्षण में आप वैकल्पिक परिकल्पना के लिए 'सांख्यिकीय साक्ष्य' पा सकते हैं ; जैसा कि मैंने बताया कि यदि हम अशक्त परिकल्पना को अस्वीकार करने में विफल रहते हैं तो क्या होगा? , यह गणित में 'विरोधाभास द्वारा प्रमाण' के समान है।

इसलिए यदि हम 'सांख्यिकीय साक्ष्य' खोजना चाहते हैं तो हम इसके विपरीत मान लेते हैं, जिसे हम कहते हैं, जिसे हम प्रमाण 1 करने की कोशिश करते हैं, जिसे हम H 1 कहते हैं । इसके बाद हम एक नमूना बनाते हैं, और नमूने से हम एक तथाकथित टेस्ट-स्टेटिस्टिक (जैसे टी-टेस्ट में एक टी-वैल्यू) की गणना करते हैं।H0H1

फिर, जैसा कि हम मानते हैं कि सही है और यह कि हमारा नमूना H 0 के तहत वितरण से अनियमित रूप से तैयार किया गया है , हम मानों के अवलोकन की संभावना की गणना कर सकते हैं जो हमारे (random) नमूने से प्राप्त मूल्य से अधिक या बराबर है। इस संभावना को पी-वैल्यू कहा जाता है।H0H0

यदि यह मान '' पर्याप्त रूप से छोटा '' है, अर्थात हमारे द्वारा चुने गए महत्व के स्तर से छोटा है, तो हम को अस्वीकार करते हैं और हम H 1 को 'सांख्यिकीय रूप से सिद्ध' मानते हैं ।H0H1

इस तरह से करने के लिए कई चीजें महत्वपूर्ण हैं:

  • हमने अनुमानों को व्युत्पन्न मान लिया है कि सत्य हैH0
  • हमने एच 0 के तहत ग्रहण की गई गड़बड़ी से एक यादृच्छिक नमूना लिया हैH0
  • यदि हम यादृच्छिक नमूने से प्राप्त परीक्षण-आँकड़ा पार होने की कम संभावना है, तो एच 1 के लिए प्रमाण मिलने का निर्णय लेते हैं । इसलिए यह असंभव नहीं है कि यह पार हो जाए जबकि H 0 सच है और इन मामलों में हम एक प्रकार की त्रुटि करते हैं। H1H0

तो एक प्रकार क्या है I त्रुटि: एक प्रकार I त्रुटि तब की जाती है जब नमूना, यादृच्छिक रूप से से निकाला जाता है, इस निष्कर्ष की ओर जाता है कि H 0 गलत है जबकि वास्तव में यह सत्य है।H0H0

ध्यान दें कि इसका तात्पर्य यह है कि पी-मान एक प्रकार की त्रुटि की संभावना नहीं है । वास्तव में, एक प्रकार I त्रुटि परीक्षण द्वारा गलत निर्णय है और निर्णय केवल p- मान को चुना हुआ महत्व स्तर से तुलना करके किया जा सकता है, अकेले p- मान के साथ कोई निर्णय नहीं कर सकता है, यह तुलना करने के बाद ही होता है पी-वैल्यू को चुना हुआ महत्व स्तर है कि एक निर्णय किया जाता है , और जब तक कोई निर्णय नहीं किया जाता है, टाइप I त्रुटि भी परिभाषित नहीं है।

फिर पी-वैल्यू क्या है? की संभावित गलत अस्वीकृति इस तथ्य के कारण है कि हम एच 0 के तहत एक यादृच्छिक नमूना खींचते हैं , इसलिए यह हो सकता है कि हम नमूने को खींचकर '' बुरा भाग्य '' बना सकते हैं, और यह '' बुरी किस्मत '' की ओर जाता है। की एक झूठी अस्वीकृति के लिएH0H0। तो पी-मूल्य (हालांकि यह पूरी तरह सही नहीं है) एक '' खराब नमूना '' की संभावना की तरह है। पी-मूल्य की सही व्याख्या यह है कि यह संभाव्यता है कि परीक्षण-आँकड़ा एच 0 के तहत एक बेतरतीब ढंग से खींचे गए नमूने से प्राप्त परीक्षण-सांख्यिकीय के मूल्य के बराबर या उससे अधिक है।H0H0


झूठी खोज दर (FDR)

जैसा कि ऊपर बताया गया है, हर बार शून्य परिकल्पना को खारिज कर दिया जाता है, कोई इसे लिए 'सांख्यिकीय सबूत' मानता है । इसलिए हमने नया वैज्ञानिक ज्ञान पाया है, इसलिए इसे एक खोज कहा जाता है । इसके अलावा ऊपर बताया गया है कि हम झूठी खोज कर सकते हैं (यानी गलत तरीके से खारिज कर सकते हैंH1H0αα- '' झूठे सबूत '' को स्वीकार करने की आपकी इच्छा को प्रतिबिंबित।

α

अगर हम एक ही सैंपल का इस्तेमाल कई करने के लिए करते हैंα

एफडब्ल्यूईआर की तुलना में एक अलग दृष्टिकोण को नियंत्रित करना है FDDH0

इसलिए मैं जिस प्रकार की त्रुटि की संभावना है, उसे कई अलग-अलग नमूनों पर एक ही परीक्षण को निष्पादित करने के साथ करना है। बड़ी संख्या में नमूनों के लिए मैं जिस प्रकार की त्रुटि की संभावना है, वह नमूने की संख्या में परिवर्तित हो जाएगी , जो खींची गई नमूनों की कुल संख्या से विभाजित एक गलत अस्वीकृति की ओर ले जाएगा

H0

ध्यान दें कि, ऊपर के दो पैराग्राफ की तुलना:

  1. संदर्भ अलग है; एक परीक्षण और कई नमूने बनाम कई परीक्षण और एक नमूना।
  2. I त्रुटि संभावना टाइप करने के लिए भाजक FDR कंप्यूटिंग के लिए भाजक से स्पष्ट रूप से अलग है। संख्यात्मक एक तरह से समान हैं, लेकिन एक अलग संदर्भ है।

एच00.38×1000


5
The correct interpretation of the p-value is that it is the probability that the test-statistic exceeds the value of the test-statistic derived from a randomly drawn sample under H0क्या ऐसा है? क्या यह "बराबर या उससे अधिक नहीं है"? पी-वैल्यू वह संभावना है कि सच्चे H0 के तहत हम अंतर या एसोसिएशन का निरीक्षण करते हैं या वास्तव में देखे गए से अधिक मजबूत होते हैं।
tnnphns

@ttnphns एक निरंतर परीक्षण सांख्यिकीय के लिए कोई अंतर नहीं है क्योंकि एक बिंदु का माप शून्य है। असतत परीक्षण सांख्यिकीय के लिए आप सही हैं (+1)। मैंने तदनुसार पाठ को बदल दिया।

1
आप पी-मानों के बीच बहुत उपयोगी अंतर आकर्षित करते हैं और मैं त्रुटि दर टाइप करता हूं, लेकिन मुझे लगता है कि आपको "सिद्ध" शब्द से अधिक सावधान रहने की आवश्यकता है। संशोधक "सांख्यिकीय" जोड़ने से यह पर्याप्त रूप से नरम नहीं होता है, मेरी राय में।
माइकल ल्यू -

1
आपने सबूतों के साथ निपटाया है जैसे कि यह केवल एक द्विआधारी राज्य है: मौजूद है और मौजूद नहीं है। गैर-सांख्यिकीय साक्ष्य की मानक समझ में शब्द अवधारणा का एक वर्गीकृत अस्तित्व है, और यह ताकत के एक आयाम से अधिक जटिल है जो कब्जा कर सकता है। कठिनाई साक्ष्य की साधारण व्याख्या के साथ त्रुटि दर विचारों की असंगति से आती है। मुझे एफडीआर के ढांचे के भीतर 'सबूत' की गैर-द्विआधारी व्याख्या को पकड़ने वाले किसी भी खाते को पढ़ने में बहुत दिलचस्पी होगी। (मैंने अभी तक एक नहीं देखा है।)
माइकल ल्यू -

1
सुधार के लिए धन्यवाद। मैंने कल रात में बदलाव किया और आपकी पोस्ट को श्रेय दिया।
एंटोनी परेला

4

पहला कथन कड़ाई से सत्य नहीं है।

महत्व की गलतफहमी पर एक निफ्टी पेपर से: ( http://myweb.brooklyn.liu.edu/cortiz/PDF%20Files/Misinterpretations%20of%20Significance.pdf )

"[यह कथन] टाइप I की त्रुटि की परिभाषा के समान हो सकता है (यानी, H0 को अस्वीकार करने की संभावना हालांकि यह वास्तव में सच है), लेकिन वास्तव में H0 को अस्वीकार करने के बाद, यह निर्णय गलत होगा यदि और केवल H0 सच थे। इस प्रकार की संभावना "कि आप गलत निर्णय ले रहे हैं" p (H0) है और यह संभावना ... शून्य परिकल्पना महत्व परीक्षण के साथ प्राप्त नहीं की जा सकती है। "

अधिक सरलता से, संभावना का आकलन करने के लिए कि आपने H0 को गलत तरीके से अस्वीकार कर दिया है, आपको इस संभावना की आवश्यकता है कि H0 सत्य है जिसे आप बस इस परीक्षण का उपयोग करके प्राप्त नहीं कर सकते।


धन्यवाद! इसलिए जब मैं आँकड़ों का पहला भाग पढ़ रहा हूँ, तो मुझे पता है कि FDR 38% है, इसलिए इसलिए एक प्रकार की त्रुटि की संभावना 38% है?
rb612

FDR झूठी डिस्कवरी दर है और यह टाइप I त्रुटि से बहुत अलग है, इसलिए आपके प्रश्न का उत्तर नहीं में है। FDR को कई परीक्षण के साथ करना होता है, अर्थात जब आप एक ही नमूने पर कई परीक्षण करते हैं, तो आँकड़े देखें ।stackexchange.com/questions/164181/… । FDR परिवारवाद त्रुटि दर का एक विकल्प है, लेकिन यह समझाने के लिए कि किसी टिप्पणी में वर्णों की संख्या बहुत सीमित है।

मैंने एफडीआर की व्याख्या करने के लिए अपने उत्तर में एक दूसरा खंड जोड़ा।

1
जिस तरह बिना पूर्व के H0 के सही होने की संभावना को निर्धारित करना संभव नहीं है, उसी तरह बिना पूर्व के FDR को निर्धारित करना संभव नहीं है। एफडीआर के कागजात की व्याख्या कैसे करें, इस बात में सावधानी बरतें, क्योंकि उनमें उपयोग किए जाने वाले पुजारी जरूरी नहीं कि आपकी अपनी प्रायोगिक परिस्थितियों के लिए प्रासंगिक हों।
माइकल ल्यू -

1

एक पी-मूल्य की सही व्याख्या एक परिणाम की सशर्त संभावना है कम से कम वैकल्पिक परिकल्पना के लिए प्रवाहकीय मान (कम से कम "चरम" के रूप में) के रूप में, शून्य परिकल्पना को सही मानते हुए । गलत व्याख्याओं में आम तौर पर सीमांत संभावना या स्थिति को बदलना शामिल होता है:

p-value=P(At least as extreme as observed outcome|H0)P(Type I error).

-1

पी-मूल्य हमें यह निर्धारित करने की अनुमति देता है कि अशक्त परिकल्पना (या दावा की गई परिकल्पना) अस्वीकार की जा सकती है या नहीं। यदि पी-मान महत्व स्तर से कम है, α, तो यह एक सांख्यिकीय महत्वपूर्ण परिणाम का प्रतिनिधित्व करता है, और अशक्त परिकल्पना को खारिज कर दिया जाना चाहिए। यदि पी-मान महत्व स्तर, α से अधिक है, तो शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है। यदि आप तालिका का उपयोग कर रहे हैं या ऑनलाइन कैलकुलेटर का उपयोग कर रहे हैं, तो यह पी-मान को देखने का पूरा कारण है, जैसे कि यह पी-वैल्यू कैलकुलेटर , तो टेस्ट स्टेटिस्टिक से पी-वैल्यू का पता लगाने के लिए पी-वैल्यू देखने का पूरा कारण है।

अब मुझे पता है कि आपने टाइप I और टाइप II त्रुटियाँ बताई हैं। यह वास्तव में पी-मूल्य के साथ कुछ नहीं करना है। यह मूल डेटा के साथ करना है, जैसे कि उपयोग किए गए नमूना आकार और डेटा के लिए प्राप्त मान। उदाहरण के लिए, यदि नमूना का आकार बहुत छोटा है, तो इससे टाइप I त्रुटि हो सकती है।


2
-1। मुझे खेद है कि आप हमारी साइट पर आपका स्वागत करते हैं, लेकिन यह उत्तर स्पष्ट रूप से गलत है: यह बस ऐसा नहीं है कि पी-मान शून्य परिकल्पना के सत्य की संभावना है। यह पी-मान और परिकल्पना परीक्षणों के बारे में कई थ्रेड्स में चर्चा की गई है, जैसे आँकड़े ।stackexchange.com/questions/31
whuber

1
मैंने इसे अधिक सटीक बनाने के लिए मूल उत्तर को थोड़ा संशोधित किया।
user1445657
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.