निचले पी-मान नल के खिलाफ अधिक सबूत क्यों नहीं हैं? जोहानसन 2011 से तर्क


31

जोहानसन (2011) में " जय हो असंभव: P-मूल्यों, सबूत, और संभावना है " (यहाँ भी है पत्रिका के लिए लिंक कहा गया है कि कम) -values अक्सर अशक्त के खिलाफ मजबूत साक्ष्य के रूप में माना जाता है। जोहानसन का तात्पर्य यह है कि लोग शून्य के खिलाफ सबूतों पर विचार करेंगे यदि उनका सांख्यिकीय परीक्षण -value का उत्पादन करता है , तो इससे भी मजबूत होगा कि यदि उनका सांख्यिकीय परीक्षण -value का उत्पादन करता है । जोहानसन ने चार कारणों की सूची दी है कि -value को शून्य के खिलाफ सबूत के रूप में क्यों इस्तेमाल नहीं किया जा सकता है:pp0.01p0.45p

  1. p को समान रूप से अशक्त परिकल्पना के तहत वितरित किया जाता है और इसलिए यह अशक्त के लिए कभी भी सबूत नहीं दिखा सकता है।
  2. p पूरी तरह से अशक्त परिकल्पना पर आधारित है और इसलिए साक्ष्य की मात्रा निर्धारित करने के लिए अनुपयुक्त है, क्योंकि साक्ष्य हमेशा एक परिकल्पना के सापेक्ष या किसी परिकल्पना के विपरीत होने के साक्ष्य के सापेक्ष होता है।
  3. p साक्ष्य प्राप्त करने की संभावना के बजाय साक्ष्य प्राप्त करने की संभावना (शून्य) को निर्दिष्ट करता है।
  4. p , अप्रमाणित डेटा और व्यक्तिपरक इरादों पर निर्भर करता है और इसलिए इसका तात्पर्य, स्पष्ट व्याख्या को देखते हुए है कि अवलोकन किए गए डेटा की गोपनीय ताकत उन चीजों पर निर्भर करती है जो नहीं हुई और व्यक्तिपरक इरादे थे।

दुर्भाग्य से मैं जोहानसन के लेख से सहज ज्ञान नहीं प्राप्त कर सका। मेरे लिए एक की -value इंगित करता है वहाँ कम मौका अशक्त सच है, एक से है के -value । निचले क्यू नल के खिलाफ मजबूत सबूत क्यों नहीं हैं? 0.01 पी 0.45 पीp0.01p0.45p


हैलो, @ लुसियानो! मैं देखता हूं कि आपने इस सूत्र में कोई उत्तर स्वीकार नहीं किया है। आप किस तरह के उत्तर की तलाश कर रहे हैं? क्या आपका प्रश्न मुख्य रूप से जोहानसन के तर्कों के बारे में है, या सामान्य रूप से निम्न पी-मूल्यों के बारे में है?
अमीबा का कहना है कि मोनिका

यह सब फिशर बनाम नेमन-पियर्सन के बारे में है। इस उत्तर में और अधिक देखें @gung द्वारा
Firebug

जवाबों:


21

उनके तर्कों का मेरा व्यक्तिगत मूल्यांकन:

  1. यहाँ वह N के लिए सबूत के रूप में का उपयोग करने की बात करता है , जबकि उसकी थीसिस यह है कि p का उपयोग Null के खिलाफ सबूत के रूप में नहीं किया जा सकता है। इसलिए, मुझे लगता है कि यह तर्क काफी हद तक अप्रासंगिक है।pp
  2. मुझे लगता है कि यह गलतफहमी है। फिशर परीक्षण पॉपर के महत्वपूर्ण तर्कवाद के विचार में दृढ़ता से अनुसरण करता है जो बताता है कि आप एक सिद्धांत का समर्थन नहीं कर सकते हैं लेकिन केवल इसकी आलोचना करते हैं। तो उस अर्थ में केवल एक परिकल्पना (नल) है और आप केवल यह जांचते हैं कि आपका डेटा इसके अनुरूप है या नहीं।p
  3. मैं यहां असहमत हूं। यह परीक्षण सांख्यिकीय पर निर्भर करता है, लेकिन आमतौर पर एक प्रभाव आकार का परिवर्तन होता है जो नल के खिलाफ बोलता है। तो उच्च प्रभाव, कम p मान --- अन्य सभी चीजें समान। बेशक, विभिन्न डेटा सेट या परिकल्पना के लिए यह अब मान्य नहीं है। p
  4. मुझे यकीन नहीं है कि मैं इस कथन को पूरी तरह से समझता हूं, लेकिन इससे जो मैं इकट्ठा कर सकता हूं वह की एक समस्या कम है क्योंकि इसका गलत तरीके से उपयोग करने वाले लोग हैं। p का उद्देश्य लंबे समय तक चलने वाली आवृत्ति व्याख्या है और यह एक बग नहीं एक विशेषता है। लेकिन आप उन लोगों के लिए p को दोष नहीं दे सकते जो अपनी परिकल्पना के लिए प्रमाण के रूप में एकल p मान लेते हैं या केवल p < .05 प्रकाशित करने वाले लोग । ppppp<.05

साक्ष्य के एक उपाय के रूप में संभावना अनुपात का उपयोग करने का उनका सुझाव मेरी राय में एक अच्छा है (लेकिन यहां एक बेयस कारक का विचार अधिक सामान्य है), लेकिन जिस संदर्भ में वह इसे थोड़ा अजीब लाता है: पहले वह छोड़ देता है फिशरियन परीक्षण के आधार जहां से संभावना अनुपात की गणना करने के लिए कोई वैकल्पिक परिकल्पना नहीं है। लेकिन अशक्त के खिलाफ सबूत के तौर पर Fisherian है। इसलिए वह फिशर और नेमन-पियर्सन को भ्रमित करता है। दूसरा, सबसे अधिक परीक्षण आँकड़े जो हम उपयोग करते हैं, वे हैं (फ़ंक्शन के) संभावना अनुपात और उस स्थिति में पी संभावना अनुपात का एक परिवर्तन है। जैसा कि कॉस्मा शालिज़ी इसे कहते हैं:pp

किसी दिए गए आकार के सभी परीक्षणों के बीच छोटी मिस संभावना है, या सर्वोच्च शक्ति के साथ एक, फार्म "कहते हैं 'संकेत' है, तो क्यू ( एक्स ) / पी ( एक्स ) > टी ( रों ) , अन्यथा कहते हैं, 'शोर' , "और यह दहलीज टी एस के साथ भिन्न होता है । मात्रा q ( x ) / p ( x ) संभावना अनुपात है; नेमन-पीयरसन लेम्मा का कहना है कि शक्ति को अधिकतम करने के लिए, हमें "सिग्नल" कहना चाहिए, अगर यह पर्याप्त रूप से शोर की तुलना में अधिक संभावना है।sq(x)/p(x)>t(s)tsq(x)/p(x)

यहाँ राज्य "सिग्नल" के तहत घनत्व है और p ( x ) राज्य "शोर" के तहत घनत्व है। के लिए उपाय "पर्याप्त रूप से होने की संभावना" यहाँ होगा पी ( क्ष ( एक्स ) / पी ( एक्स ) > टी बी एस | एच 0 ) जो पी । ध्यान दें कि सही में नेमन-पियर्सन परीक्षण t o b s को एक निश्चित t ( s ) द्वारा प्रतिस्थापित किया गया है जैसे कि Pq(x)p(x)P(q(X)/p(x)>tobsH0)ptobst(s)P(q(X)/p(x)>t(s)H0)=α


6
अकेले बिंदु 3 के लिए +1। कॉक्स संभावित मूल्य (या अन्य परीक्षण सांख्यिकीय) के अंशांकन के रूप में पी-मूल्य का वर्णन करता है और यह अक्सर देखने के लिए भूल गया है।
Scortchi - को पुनः स्थापित मोनिका

(+1) अच्छा जवाब, @ मोमो। मैं सोच रहा हूँ कि क्या इसे "लेकिन वे हैं!" आपकी प्रतिक्रिया के हेडर के रूप में एक बड़े फ़ॉन्ट में, क्योंकि यह ओपी के शीर्षक प्रश्न के लिए आपका जवाब लगता है "क्यों निचले पी-मान शून्य के खिलाफ अधिक सबूत नहीं हैं?"। आप सभी दिए गए तर्कों पर बहस करते हैं, लेकिन शीर्षक प्रश्न का उत्तर स्पष्ट रूप से नहीं देते हैं।
अमीबा का कहना है कि मोनिका

1
मुझे ऐसा करने में थोड़ी हिचकिचाहट होगी, यह सब बहुत ही सूक्ष्म है और मान्यताओं, संदर्भों आदि पर बहुत निर्भर है। उदाहरण के लिए, आप इस बात से इनकार कर सकते हैं कि संभाव्य बयानों को "साक्ष्य" के रूप में इस्तेमाल किया जा सकता है और इस प्रकार यह कथन सही है। एक मछुआरे के दृष्टिकोण में यह नहीं है। इसके अलावा, मैं यह नहीं कहूंगा कि मैं सभी बहस कर रहा हूं, मुझे लगता है कि मैं केवल एक अलग दृष्टिकोण प्रदान करता हूं और तर्क में कुछ तार्किक खामियों को इंगित करता हूं। लेखक अपनी बात को अच्छी तरह से तर्क देता है और एक उचित दृष्टिकोण का समाधान प्रदान करने की कोशिश करता है जिससे स्वयं को समान रूप से समस्याग्रस्त देखा जा सकता है।
मोमो

9

यह कारण है कि जोहानसन की दलीलों को पुनर्नवीनीकरण किया जाता है, अक्सर इस तथ्य से संबंधित प्रतीत होता है कि पी-मान अशक्त के खिलाफ सबूत के संकेत हैं, लेकिन सबूत के उपाय नहीं हैं। प्रमाण में किसी भी एकल संख्या की तुलना में अधिक आयाम हैं, और इसलिए पी-मूल्यों और सबूतों के बीच संबंधों के हमेशा पहलू हैं जो लोगों को मुश्किल लग सकते हैं।

मैंने एक पेपर में जोहानसन द्वारा उपयोग किए गए कई तर्कों की समीक्षा की है, जो पी-मूल्यों और संभावना कार्यों के बीच संबंध को दर्शाता है, और इस प्रकार साक्ष्य: http://arxiv.org/abs/1311.0081 दुर्भाग्य से उस कागज को अब तीन बार खारिज कर दिया गया है, हालांकि इसके तर्कों और उनके लिए सबूतों का खंडन नहीं किया गया है। (ऐसा लगता है कि यह रेफरी के लिए अरुचिकर है जो जोहानसन की तरह गलत के बजाय राय रखते हैं।)


+1 @Michael ल्यू, शीर्षक बदलने के बारे में क्या? P (ee) या P के लिए नहीं (ee) ... ध्वनि की तरह नहीं है। हम सभी जानते हैं कि उस स्थिति में क्या करना है। = डी जोक एक तरफ, आपके पेपर खारिज होने के क्या कारण थे?
समुद्र में एक बूढ़ा आदमी।

4

@ मोमो के अच्छे जवाब में जोड़ना:

गुणा-भाग न भूलें। कई स्वतंत्र पी-मूल्यों, और विरल गैर-तुच्छ प्रभाव आकारों को देखते हुए, सबसे छोटे पी-मान शून्य से हैं, संभावना के साथ झुकते हुए परिकल्पना की संख्या बढ़ जाती है। इसलिए यदि आप मुझसे कहते हैं कि आपके पास एक छोटा सा पी-मूल्य है, तो पहली बात यह जानना चाहता हूं कि आप कितने परिकल्पना कर रहे हैं।1


2
यह ध्यान देने योग्य है कि साक्ष्य स्वयं परीक्षण की बहुलता से प्रभावित नहीं है, भले ही साक्ष्य के प्रति आपकी प्रतिक्रिया बदल जाए। डेटा में सबूत डेटा में सबूत है और यह किसी भी गणना से प्रभावित नहीं है जो आप अपने कंप्यूटर में प्रदर्शन कर सकते हैं। परीक्षण की बहुलता के लिए पी-मानों के विशिष्ट 'सुधार' का संबंध झूठी सकारात्मक त्रुटि दर के संरक्षण से है, जो पी-मूल्य और प्रायोगिक साक्ष्य के बीच के संबंध को ठीक नहीं करता है।
माइकल ल्यू

1

क्या जोहानसन दो अलग-अलग प्रयोगों से पी-मूल्यों के बारे में बात कर रहा है? यदि हां, तो पी-मानों की तुलना सेब के मेमने चॉप्स से तुलना करने जैसी हो सकती है। यदि प्रयोग "ए" में बड़ी संख्या में नमूने शामिल हैं, तो भी एक छोटा सा असंगत अंतर सांख्यिकीय रूप से महत्वपूर्ण हो सकता है। यदि प्रयोग "बी" में केवल कुछ नमूने शामिल हैं, तो एक महत्वपूर्ण अंतर सांख्यिकीय रूप से महत्वहीन हो सकता है। इससे भी बदतर (यही कारण है कि मैंने मेमने चॉप्स और संतरे नहीं कहा है), तराजू पूरी तरह से अतुलनीय हो सकता है (एक में साई और दूसरे में kwh)।


3
मेरी धारणा है कि जोहानसन विभिन्न प्रयोगों से पी-मूल्यों की तुलना करने के बारे में बात नहीं कर रहा है। उस & @ Glen_b की टिप्पणी के प्रकाश में, क्या आप अपनी पोस्ट को स्पष्ट करते हुए कहेंगे, एमिल? संबंधित बिंदु उठाना ठीक है ('मुझे लगता है कि जे के संदर्भ ए में गलत है, लेकिन यह संदर्भ बी' में कुछ योग्यता होगी), लेकिन यह स्पष्ट होना चाहिए कि आप क्या कर रहे हैं। यदि आप कोई प्रश्न पूछ रहे हैं या टिप्पणी कर रहे हैं , तो कृपया इस पोस्ट को हटा दें और इसे टिप्पणी करें।
गंग - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.