पी-वैल्यू के वितरण का उच्च संस्करण (तालेब 2016 में एक तर्क)


17

मैं 2016 में तालेब में किए गए बड़े चित्र के दावे को समझने की कोशिश कर रहा हूं , मानक पी-मूल्यों का मेटा-वितरण

इसमें, Taleb p- मान की अविश्वसनीयता के लिए निम्नलिखित तर्क देता है (जैसा कि मैं इसे समझता हूं):

कुछ वितरण एक्स से आने वाले डेटा बिंदुओं पर एक अनुमान प्रक्रिया संचालित होती है जो एपी वैल्यू को आउटपुट करती है। यदि हम इस वितरण से अधिक अंक प्राप्त करते हैं और दूसरे p मान को आउटपुट करते हैं, तो हम तथाकथित "सही p- मूल्य" की सीमा में प्राप्त इन p-मानों को औसत कर सकते हैं।nX

यह "सच पी-मूल्य", एक परेशान उच्च विचरण के लिए दिखाया गया है ताकि एक वितरण + "सच पी मूल्य" के साथ प्रक्रिया इच्छा समय रिपोर्ट <.05 की एक पी-मूल्य का 60%।.12

प्रश्न : यह कैसे के पक्ष में पारंपरिक तर्क के साथ सामंजस्य स्थापित कर सकते -value। जैसा कि मैं इसे समझता हूं, पी-वैल्यू आपको यह बताने वाला है कि आपकी प्रक्रिया कितने प्रतिशत आपको सही अंतराल (या जो भी) देगी। हालाँकि, यह कागज यह तर्क देता है कि यह व्याख्या भ्रामक है क्योंकि यदि आप प्रक्रिया को फिर से चलाते हैं तो पी-वैल्यू समान नहीं होगी।p

क्या मुझे बात याद आ रही है?


1
क्या आप बता सकते हैं कि यह "पारंपरिक तर्क" क्या है? मुझे यकीन नहीं है कि मैं स्पष्ट हूँ कि आप किस तर्क पर विचार कर रहे हैं।
Glen_b -Reinstate मोनिका

सवाल दिलचस्प है और एक साहित्य से संबंधित है, जिसके लिए सीवी में एक टैग, संयोजन-पी-मूल्य भी हैं, जिन्हें आप जोड़ना पसंद कर सकते हैं यदि आप इसे उचित समझते हैं।
mdewey

1
मेरा मानना ​​है कि पी-वैल्यू के प्रजनन के बारे में सवाल इस एक से बहुत निकटता से संबंधित हो सकते हैं। संभवत: वहां विश्लेषण उसी (या यहां तक ​​कि) के समान है जैसा कि यहां बताया गया है।
whuber

जवाबों:


13

एक पी-मान एक यादृच्छिक चर है।

(कम से कम एक निरंतर वितरित सांख्यिकीय के लिए) के तहत , पी-मूल्य का एक समान वितरण होना चाहिएH0

एक सुसंगत परीक्षण के लिए, के तहत पी-मान को सीमा में 0 तक जाना चाहिए क्योंकि नमूना आकार अनंत की ओर बढ़ता है। इसी प्रकार, जैसा कि प्रभाव आकार में वृद्धि होती है, पी-वैल्यू के वितरण को भी 0 की ओर शिफ्ट होना चाहिए, लेकिन यह हमेशा "स्प्रेड आउट" होगा।H1

एक "सच" पी-मूल्य की धारणा मुझे बकवास लगती है। इसका क्या मतलब होगा, या तो या एच 1 के तहत । आप उदाहरण के लिए कह सकते हैं कि आपका मतलब है " कुछ दिए गए प्रभाव आकार और नमूना आकार में पी-मूल्यों के वितरण का मतलब ", लेकिन फिर किस अर्थ में आपके पास अभिसरण है जहां प्रसार को छोटा करना चाहिए? यह ऐसा नहीं है जब आप इसे स्थिर रखते हुए नमूना आकार बढ़ा सकते हैं।H0H1

यहां एक नमूना टी-टेस्ट और तहत एक छोटे प्रभाव आकार के साथ एक उदाहरण है । जब नमूना आकार छोटा होता है, तो पी-मान लगभग एक समान होते हैं, और नमूना आकार बढ़ने पर वितरण धीरे-धीरे 0 की ओर केंद्रित होता है।H1

यहाँ छवि विवरण दर्ज करें

यह ठीक उसी तरह है कि पी-मानों को कैसे माना जाता है - एक झूठी अशक्तता के लिए, जैसा कि नमूना आकार बढ़ता है, पी-मूल्यों को कम मूल्यों पर अधिक केंद्रित होना चाहिए, लेकिन यह सुझाव देने के लिए कुछ भी नहीं है कि मूल्यों का वितरण तब होता है जब आप इसे लेते हैं। एक प्रकार II त्रुटि करें - जब पी-मान आपके महत्व स्तर से ऊपर है - तो किसी तरह से उस महत्व स्तर पर "बंद" होना चाहिए।

α=0.05

यह अक्सर इस बात पर विचार करने में मददगार होता है कि विकल्प के तहत आप जो भी टेस्ट स्टैटिस्टिक्स का उपयोग करते हैं उसके वितरण के साथ क्या हो रहा है और ndf के तहत cdf को लागू करने से क्या होगा जो कि वितरण के लिए होगा (जो कि पी-वैल्यू के वितरण के तहत देगा विशिष्ट विकल्प)। जब आप इन शर्तों के बारे में सोचते हैं तो अक्सर यह देखना मुश्किल नहीं होता कि व्यवहार क्यों है।

मुद्दा जैसा कि मैं देख रहा हूं कि यह इतना अधिक नहीं है कि पी-मान या परिकल्पना परीक्षण के साथ कोई अंतर्निहित समस्या है, यह अधिक मामला है कि क्या परिकल्पना परीक्षण आपकी विशेष समस्या के लिए एक अच्छा उपकरण है या कुछ और अधिक उपयुक्त होगा या नहीं किसी भी विशेष मामले में - यह व्यापक ब्रश पॉलीमिक्स के लिए एक स्थिति नहीं है, लेकिन इस तरह के सवालों का सावधानीपूर्वक विचार करना है जो परिकल्पना परीक्षण को संबोधित करते हैं और आपकी परिस्थिति की विशेष आवश्यकताएं हैं। दुर्भाग्य से इन मुद्दों पर सावधानीपूर्वक विचार शायद ही कभी किया जाता है - सभी को अक्सर फॉर्म का एक प्रश्न दिखाई देता है "मैं इन आंकड़ों के लिए किस परीक्षण का उपयोग करता हूं?" ब्याज का प्रश्न क्या हो सकता है, इस पर विचार किए बिना, अकेले जाने दें कि क्या कुछ परिकल्पना परीक्षण इसे संबोधित करने का एक अच्छा तरीका है।

एक कठिनाई यह है कि परिकल्पना परीक्षण व्यापक रूप से गलत समझा और व्यापक रूप से दुरुपयोग दोनों हैं; लोग बहुत बार सोचते हैं कि वे हमें ऐसी चीजें बताते हैं जो वे नहीं करते हैं। पी-मान संभवतः परिकल्पना परीक्षणों के बारे में सबसे गलत समझा गया है।


pnm

nnn

1
H1H1

3
n

3
+1। एक संबंधित - और मजेदार - विश्लेषण जो मेरे दिमाग में आता है, जिसे ज्योफ कमिंग "पी-मूल्यों का नृत्य" कहते हैं: youtube.com/watch?v=5OL1RqHrZQ8 ("नृत्य" लगभग 9 मिनट के निशान पर होता है) । यह पूरी छोटी प्रस्तुति मूल रूप से जोर देती है कि अपेक्षाकृत उच्च शक्ति के लिए भी पी-वैल्यू कितना परिवर्तनशील है। मैं कमिंग के मुख्य बिंदु से बिल्कुल सहमत नहीं हूं कि आत्मविश्वास अंतराल पी-मूल्यों की तुलना में बहुत बेहतर है (और मुझे नफरत है कि वह इसे "नए आंकड़े" कहते हैं), लेकिन मुझे लगता है कि यह राशि परिवर्तनशीलता कई लोगों के लिए आश्चर्य की बात है और "नृत्य" इसे प्रदर्शित करने का एक प्यारा तरीका है।
अमीबा का कहना है कि

11

Glen_b का उत्तर हाजिर है (+1; मेरा पूरक मानें)। तालेब द्वारा आपके द्वारा उल्लिखित कागज, मनोविज्ञान और सांख्यिकी साहित्य के भीतर कागजों की एक श्रृंखला के समान ही है, इस बारे में कि आप किस तरह की सूचनाओं को पी-मानों के वितरण (जिसे लेखक पी-कर्व कहते हैं, के विश्लेषण से चमका सकते हैं; उनकी साइट देखें; संसाधनों का गुच्छा, यहां पी-कर्व विश्लेषण ऐप भी शामिल है )।

लेखक पी-वक्र के दो प्राथमिक उपयोगों का प्रस्ताव करते हैं:

  1. आप साहित्य के पी-कर्व का विश्लेषण करके एक साहित्य के स्पष्ट मूल्य का मूल्यांकन कर सकते हैं । यह पी-कर्व का उनका पहला विज्ञापित उपयोग था। अनिवार्य रूप से, जैसा कि ग्लेन_ बी वर्णन करता है, जब आप गैर-शून्य प्रभाव आकारों के साथ काम कर रहे होते हैं, तो आपको पी-कर्व्स को देखना चाहिए जो कि पी <.05 के पारंपरिक सीमा से नीचे तिरछे होते हैं , क्योंकि छोटे पी-मान पी की तुलना में अधिक होने चाहिए। मान पी के करीब= .05 जब कोई प्रभाव (या प्रभाव का समूह) "वास्तविक" होता है। इसलिए आप महत्वपूर्ण सकारात्मक तिरछे के लिए एक पी-कर्व का परीक्षण कर सकते हैं जो स्पष्टवादिता मूल्य के परीक्षण के रूप में है। इसके विपरीत, डेवलपर्स का प्रस्ताव है कि आप नकारात्मक तिरछा (यानी अधिक बॉर्डरलाइन महत्वपूर्ण पी-वैल्यूएशन छोटे वाले) का परीक्षण कर सकते हैं, अगर यह निर्धारित करने के लिए कि क्या प्रभाव का एक सेट विभिन्न संदिग्ध विश्लेषणात्मक प्रथाओं के अधीन है।
  2. आप प्रकाशित पी-वैल के साथ पी-कर्व का उपयोग करके प्रभाव-आकार के प्रकाशन-पूर्वाग्रह मुक्त मेटा-एनालिटिक अनुमान की गणना कर सकते हैं । यह संक्षिप्त रूप से समझाने के लिए थोड़ा पेचीदा मामला है, और इसके बजाय, मैं आपको सलाह दूंगा कि आप उनके प्रभाव-आकार-आकलन केंद्रित कागजात (साइमनसोहन, नेल्सन, और सीमन्स, 2014 ए, 2014 बी) की जांच करें और स्वयं तरीकों पर पढ़ें। लेकिन अनिवार्य रूप से, लेखकों का सुझाव है कि पी-वक्र का उपयोग फ़ाइल-दराज प्रभाव के मुद्दे को स्कर्ट करने के लिए किया जा सकता है, जब एक मेटा-विश्लेषण का संचालन करता है।

तो, अपने व्यापक प्रश्न के रूप में:

इसे पी-वैल्यू के पक्ष में पारंपरिक तर्क के साथ कैसे जोड़ा जा सकता है?

मैं कहूंगा कि तालेब (और अन्य) जैसी विधियों ने पी-मूल्यों को फिर से तैयार करने का एक तरीका खोज लिया है, ताकि हम पी-मूल्यों के समूहों का विश्लेषण करके संपूर्ण साहित्य के बारे में उपयोगी जानकारी प्राप्त कर सकें , जबकि एक पी-मूल्य अपने आप हो सकता है। इसकी उपयोगिता में बहुत अधिक सीमित है।

संदर्भ

सिमोनसोहन, यू।, नेल्सन, एलडी, और सीमन्स, जेपी (2014 ए)। पी-कर्व: फाइल की दराज की कुंजी। प्रायोगिक मनोविज्ञान जर्नल: जनरल , 143 , 534-547।

सिमोनसोहन, यू।, नेल्सन, एलडी, और सीमन्स, जेपी (2014 बी)। पी-वक्र और प्रभाव का आकार: केवल महत्वपूर्ण परिणामों का उपयोग करके प्रकाशन पूर्वाग्रह के लिए सुधार। मनोवैज्ञानिक विज्ञान पर परिप्रेक्ष्य , 9 , 666-681।

सिमोनसोहन, यू।, सीमन्स, जेपी, और नेल्सन, एलडी (2015)। बेहतर पी-वक्र: पी-वक्र विश्लेषण को त्रुटियों, धोखाधड़ी, और महत्वाकांक्षी पी-हैकिंग, एक जवाब के लिए उलरिच और मिलर (2015) के लिए और अधिक मजबूत बनाता है। प्रायोगिक मनोविज्ञान जर्नल: जनरल , 144 , 1146-1152।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.