पी-वैल्यूज़ के लुभावने दृश्य


31

कभी-कभी रिपोर्टों में मैं पी-मूल्यों और मेरे द्वारा प्रदान किए गए अन्य हीनतापूर्ण आंकड़ों के बारे में एक अस्वीकरण शामिल करता है। मैं कहता हूं कि चूंकि नमूना यादृच्छिक नहीं था, इसलिए ऐसे आँकड़े कड़ाई से लागू नहीं होंगे। मेरा विशिष्ट शब्दांकन आमतौर पर फुटनोट में दिया गया है:

"जबकि, कड़ाई से बोलते हुए, हीनता के आंकड़े केवल यादृच्छिक नमूने के संदर्भ में लागू होते हैं, हम रिपोर्टिंग स्तरों और / या आत्मविश्वास अंतरालों में कन्वेंशन का पालन करते हैं, जबकि गैर-आयामी नमूनों के लिए भी सुविधाजनक यार्डस्टिक्स हैं। माइकल ओक्स के सांख्यिकीय निष्कर्ष: सामाजिक और के लिए एक टिप्पणी। व्यवहार विज्ञान (एनवाई: विले, 1986)।

कुछ अवसरों पर - एक बार एक गैर-अकादमिक सेटिंग में एक या दो बार पीयर-रिव्यू किए गए पेपर के लिए - संपादक या समीक्षक ने इस अस्वीकृति पर आपत्ति जताई, इसे भ्रामक कहा, और महसूस किया कि हीनतापूर्ण निष्कर्षों को बस लिखित रूप में खड़ा किया जाना चाहिए। (और अधिकार का मंत्र दिया जाएगा)। क्या किसी और ने इस समस्या का सामना किया है और एक अच्छा समाधान पाया है? एक तरफ, पी-वैल्यू के बारे में लोगों की समझ आमतौर पर निराशाजनक है, यहां तक ​​कि यादृच्छिक नमूने के संदर्भ में, इसलिए शायद यह बहुत मायने नहीं रखता कि हम क्या कहते हैं। दूसरी तरफ, गलतफहमियों में और योगदान देने के लिए समस्या का एक हिस्सा बना हुआ लगता है। मुझे यह जोड़ना चाहिए कि मैं अक्सर सर्वेक्षण अध्ययनों से निपटता हूं, जहां यादृच्छिक असाइनमेंट लागू नहीं होता है और जहां मोंटे कार्लो सिमुलेशन अक्सर प्रतिनिधित्व के मुद्दे को संबोधित करने में विफल होगा।


3
एक समीक्षक पर टिप्पणी बेहद दुखद है, एक व्यक्ति यह उम्मीद करेगा कि उस स्थिति में कोई व्यक्ति कम से कम खुले तौर पर अपनी अज्ञानता को प्रदर्शित नहीं करेगा, और ऐसा करने से आगे सांख्यिकीय पद्धति की गलत व्याख्या का समर्थन करेगा।
रिचमीमोर्रिसो

8
सही होने पर मुझे सही करें, लेकिन नमूने की यादृच्छिकता उस डिग्री को प्रभावित करती है जिस पर आप निष्कर्षों को सामान्य कर सकते हैं। इसके विपरीत, कारण असाइनमेंट के लिए यादृच्छिक असाइनमेंट अधिक महत्वपूर्ण विशेषता है।
माइक लॉरेंस

3
माइक, मैं आपसे सहमत हूं। क्या आप इस बिंदु को चर्चा का विस्तार करने के लिए या मेरे द्वारा कही गई असहमति को इंगित करने के लिए बनाते हैं?
rolando2

@richiemorrisroe: किसी को भी सभी समीक्षकों की अपेक्षा करना मूर्खतापूर्ण होगा, लेकिन मुझे लगता है कि एक ऐसे भविष्य की उम्मीद कर सकता है जिसमें हम उम्मीद कर सकते हैं, और हमें निश्चित रूप से प्रकाशकों को मांग करने और उसे लागू करने के लिए अधिक दबाव देना चाहिए। । रोलाण्डो, मुझे लगता है कि माइक की चर्चा इस कारण को स्पष्ट करने के लिए है क्योंकि यह इस कारण से संबंधित मुद्दों से संबंधित है। जाहिर है कि कुछ लोगों को यह मददगार लगा, हालांकि मुझे लगा कि यह पहले से ही काफी स्पष्ट था, व्यक्तिगत रूप से। यदि मैं सही हूं, यह अनजाने में पी मूल्यों के बारे में दूसरों के भ्रम को मापता है , जो मूल पोस्ट को प्रेरित करता है!
निक स्टैनर

जवाबों:


11

अस्वीकरण को शामिल नहीं करने के लिए वास्तव में एक तर्क है। सच कहूँ तो, मैं एक जर्नल लेख में पी-मूल्यों की प्रकृति पर एक संक्षिप्त ग्रंथ मिल जाएगा, एक छोटे से डाल करने के लिए, और एक पल के लिए विराम देना होगा और यह पता लगाने की कोशिश करेंगे कि क्या आपने विशेष रूप से कुछ किया है .. .esoteric ... एक निश्चित बिंदु पर उस स्थान को समर्पित करने के लिए वारंट।

मूल रूप से, एक समीक्षक के रूप में, मैं इसे अनावश्यक कहूंगा क्योंकि पाठक को पहले से ही पता होना चाहिए कि पी-मूल्य क्या है और क्या करता है। मुझे इस पर भी आपत्ति हो सकती है क्योंकि इस तरह के नोट बनाने से वास्तव में पी-वैल्यू के साथ होने वाले विश्लेषण और व्याख्या के कई अपराधों को नहीं रोका जा सकता है, यह केवल "मुझ पर विश्वास करो, मुझे पता है कि मैं क्या कर रहा हूं"। यह भी थोड़ा अजीब है - "मैं पी-वैल्यू के खिलाफ एक बोल्ड स्टैंड बनाने जा रहा हूं, लेकिन इतना बोल्ड नहीं हूं कि मैं उन्हें रिपोर्ट नहीं करता"।

जब मैं "पी मूल्यों पर आरोपित विचारों" पर विचार, मैं बहुत कम है कि आप ऊपर पोस्ट, और भी बहुत कुछ के बारे में चिंतित हूँ अधिक प्रकाशित होने के क्रम में सांख्यिकीय महत्व पर समीक्षकों की जिद के बारे में चिंतित या कागज का ध्यान केंद्रित (पुट किसी खोज द्वारा स्टार और अचानक इसकी एक बड़ी डील) या किसी खोज के महत्व के साथ सांख्यिकीय महत्व को सम्मिश्रित करना।


3
मुझे नहीं लगता कि यह ओपी को जवाब देता है। मैं मान रहा हूं कि @ rolando2 अन्य आँकड़े रिपोर्ट करता है जो उसकी चर्चाओं (जैसे, प्रभाव आकार) के लिए अधिक केंद्रीय हैं, और ज्यादातर पारंपरिक मूल्यों को समायोजित करने के एक तरीके के रूप में पी मूल्यों की रिपोर्ट करते हैं, भले ही वे सख्ती से लागू नहीं होते हैं। इस तरह, हमें पी- वैल्यू में बहुत अधिक पढ़ रहे हैं; हमें अस्वीकरण के लिए उसकी प्रेरणा पर विचार करना चाहिए। पाठकों को नहीं पता कि उन्हें क्या करना चाहिए; ओपी इसका उल्लेख करता है। अस्वीकरण संदेह को बढ़ावा देता है, विश्वास को नहीं। इसके अनुरूप होने पर एक मानक के लिए आपत्ति करना अजीब नहीं है; यह एक साहसिक स्टैंड नहीं है।
निक स्टॉनर

@NickStauner मैं नहीं देखता कि यह कैसे "उत्तर" ओपी नहीं करता है। शायद यह समर्थन नहीं करता है कि वे क्या करना चाहते हैं, लेकिन मेरे दिमाग में यह दोनों कागज़ात की वास्तविक सामग्री से एक बहुत ही अजीब ब्रेक है, और यह भी बेकार है - "यह गलत है, लेकिन मैं सिपाही पर जा रहा हूं जैसे कि सही है क्योंकि यह है कि आप सभी की उम्मीद है "अगर गलत मायने रखता है मुझे नहीं बताता ।
फोमाइट

3
ओपी का सवाल: "क्या किसी और ने इस समस्या का सामना किया है और एक अच्छा समाधान पाया है?" आपका उत्तर विचार का जवाब देने के लिए शाब्दिक प्रश्न को अनदेखा करता है, और ज्यादातर इस पर आपकी राय प्रस्तुत करता है कि विचार को क्यों शूट किया जाना चाहिए। आप ओपी के विचार के एक रचनात्मक आलोचना पर संकेत देना शुरू कर रहे हैं: आपको लगता नहीं है कि ओक्स प्रशस्ति पत्र आपको बताता है कि यह क्यों मायने रखता है। मैं अपने स्वयं के उत्तर में इस पर थोड़ा विस्तार करूंगा।
निक स्टनर

12

न केवल एक जनसंख्या मॉडल के आधार पर, बल्कि एक यादृच्छिकरण मॉडल के आधार पर अनुमानी आंकड़ों के उपयोग को उचित ठहराया जा सकता है। बाद वाला नमूना प्राप्त करने के तरीके के बारे में कोई धारणा नहीं बनाता है। वास्तव में, फिशर वह था जिसने सुझाव दिया था कि यादृच्छिककरण मॉडल सांख्यिकीय अनुमान के लिए आधार होना चाहिए (जैसा कि नेमन और पियर्सन के विपरीत)। उदाहरण के लिए देखें:

अर्न्स्ट, एमडी (2004)। क्रमपरिवर्तन विधि: सटीक अनुमान के लिए एक आधार। सांख्यिकीय विज्ञान, 19, 676-685। [लिंक (खुली पहुंच)]

लुडब्रुक, जे। और डुडले, एच। (1998)। क्यों बायोमेडिकल रिसर्च में टी और एफ परीक्षणों से क्रमपरिवर्तन परीक्षण बेहतर हैं। अमेरिकी सांख्यिकीविद्, 52, 127-132। [लिंक (यदि आपके पास JSTOR पहुंच है)]

मुझे किसी तरह संदेह है कि संपादकों या समीक्षकों ने इस प्रश्न का उपयोग आपके अस्वीकरण को "भ्रमित" करने के लिए किया था।


1
वोल्फगैंग - दिलचस्प और सहायक अंक। मुझे स्पष्ट करना चाहिए था, हालांकि, मेरा ज्यादातर काम सर्वेक्षणों पर है।
rolando2

7
यदि प्राथमिक लक्ष्य जनसंख्या पर किसी प्रकार का आक्षेप करना है और नमूना तंत्र ऐसी प्रकृति का है कि नमूने की प्रतिनिधित्वशीलता संदिग्ध है, तो वास्तव में, कोई भी निष्कर्ष भी संदिग्ध होगा। अनिवार्य रूप से, आप केवल आबादी के उस हिस्से के लिए एक अनुमान बना सकते हैं कि नमूना तंत्र का प्रतिनिधित्व प्रदान करता है। सिद्धांत रूप में, आपके द्वारा किए गए इंफ़ॉर्मेशन आबादी के उस हिस्से के लिए उपयुक्त होंगे। क्या जनसंख्या का वह हिस्सा आपके लिए (या पाठकों के) हित का है, एक और मुद्दा है।
वोल्फगैंग

7

pमूल्य वास्तव में समस्याग्रस्त अध्ययन में उनकी गैर-नगण्य अवैधता के बावजूद रिपोर्ट करने के लिए आवश्यक हैं (एक वर्ग जिसमें सभी बहुत प्रकाशित लेख गिर जाते हैं), कोई उन्हें संक्षेप में बता सकता है। इसके बजाय अपने आख्यान पर ध्यान केंद्रित करने पर विचार करें - शायद विशेष रूप से भी - प्रभाव आकारों पर। यदि आपका अध्ययन पर्याप्त रूप से सूचनात्मक होने के लिए पर्याप्त रूप से प्रतिनिधि है (यह पूरी तरह से यादृच्छिक नमूनाकरण की आवश्यकता नहीं होनी चाहिए, केवल व्याख्याओं की व्यापकता में सावधानी), तो आपके प्रभाव का आकार रिश्तों या मतभेदों के अस्तित्व और दिशाओं को इंगित करने की तुलना में व्यापक रूप से निहितार्थ होना चाहिए। प्रभाव के आकारों पर किसी की चर्चा को केंद्रित करना एक व्यावहारिक समझ में रिश्तों या मतभेदों के बारे में एक गहरी समझ की सुविधा प्रदान कर सकता है, हालांकि यह अभी भी अध्ययन के विषय के संदर्भ में विचार करने की आवश्यकता है (जैसे,r=.03ppp

एक और, संभावित पूरक विकल्प आपके फुटनोट पर विस्तार करना होगा। समीक्षकों के रूप में समस्या के आपके दोनों विवरणों ने इसे अनुभव किया है, और वर्तमान में इस पृष्ठ पर स्वीकार किए गए उत्तर का सुझाव देते हैं कि फुटनोट सहित अपनी प्रेरणा को समझाने के लिए पर्याप्त जानकारी नहीं दी गई है, न ही पाठक को संदर्भ के लिए आपके उद्धरण का अनुसरण करने के लिए प्रेरित करने के लिए पर्याप्त है। कि आप इसका उपयोग इतनी सरलता से समझाने के लिए करते हैं। एक एकल, अतिरिक्त वाक्य, यहां तक ​​कि आपके संदर्भ से एक संक्षिप्त उद्धरण, आपके फुटनोट के मूल्य को समझाने और पाठकों को गहराई से पढ़ने के लिए प्रेरित करने की दिशा में एक लंबा रास्ता तय कर सकता है। जाहिर है, जैसा कि आपका फुटनोट जल्द ही एक सरल, नकारात्मक, आपकी प्रतिक्रिया के बारे में अपनी अनुचित धारणा को बाधित करने के लिए अपने समझे हुए प्रयास के प्रति नकारात्मक, बर्खास्त प्रतिक्रिया को प्रेरित करता है। यदि आप उन समस्याओं के बारे में मुख्य बिंदुओं में से एक या दो चम्मच चम्मच से पढ़ते हैं, तो वे बौद्धिक रूप से बहुत कम आलसी हो सकते हैं, जो संभवतः नियमित रूप से अनदेखी करते हैं। इसके अलावा, कई विशेष समस्याओं के साथp

p

ppp

संदर्भ

- गुडमैन, एसएन (1992)। प्रतिकृति, पी uesvalues ​​और सबूत पर एक टिप्पणी । चिकित्सा में सांख्यिकी, 11 (7), 875-879।
- गुडमैन, एसएन (2001)। के पी ए विनम्र प्रस्ताव: -values और Bayes। महामारी विज्ञान, 12 (3), 295-297। Http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_BayesesA_Modest_Proposal.6.pdf से पुनर्प्राप्त किया गया ।
- गुडमैन, एस। (2008)। एक गंदा दर्जन: बारहवीं- पी- गलत धारणाएं। हेमटोलॉजी में सेमिनार, 45 (3), 135-140। से लिया गया http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf
- गोरोचन, पी।, हॉज, एसई, हीमैन, जीए, डर्नर, एम।, और ग्रीनबर्ग, डीए (2007)। एसोसिएशन अध्ययनों की गैर-प्रतिकृति: "छद्म विफलताओं" को दोहराने के लिए? चिकित्सा में जेनेटिक्स, 9 (6), 325-331। Http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html से प्राप्त किया गया ।
- हर्लबर्ट, एसएच, और लोम्बार्डी, सीएम (2009)। नेमन-पियर्सन निर्णय सिद्धांत और रूपरेखा के अंतिम पतन नेफिशियन का उदय। एनलस ज़ूलोगीसी फेनीसी, 46 (5), 311-349। से लिया गया http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf
- ल्यू, एमजे (2013)। पी या पी के लिए नहीं: पी-मानों की गोपनीय प्रकृति और वैज्ञानिक निष्कर्ष में उनके स्थान पर। arXiv: 1311.0081 [stat.ME]। से लिया गयाhttp://arxiv.org/abs/1311.0081
- नाज़ो, आर। (2014, 12 फरवरी)। वैज्ञानिक विधि: सांख्यिकीय त्रुटियां। नेचर न्यूज, 506 (7487)। Http://www.nature.com/news/scientific-method-statutic-errors-1.14700 से लिया गया ।
- रोसेन्थल, आर।, रोसावेन, आरएल, और रुबिन, डीबी (2000)। व्यवहार अनुसंधान में विरोधाभास और प्रभाव आकार: एक सहसंबंधी दृष्टिकोण। कैम्ब्रिज यूनिवर्सिटी प्रेस।
- सन्नी, एस। (2001)। पी-मूल्यों के लिए दो चीयर्स? जर्नल ऑफ एपिडेमियोलॉजी एंड बायोस्टैटिस्टिक्स, 6 (2), 193–204। Http://www.phil.vt.edu/dmayo/conference_2010/Senn%20Two%20Cheers%20Paper.pdf से लिया गया ।
- वागेनमेकर्स, ईजे (2007)। की व्याप्त समस्याओं का एक व्यावहारिक समाधानp मान। साइकोनोमिक बुलेटिन एंड रिव्यू, 14 (5), 779-804। Http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf से लिया गया ।


3
पी-वैल्यूज़ की सभी आलोचनाएँ सही नहीं हैं या उनकी वीरता के बावजूद वारंट नहीं किया गया है। आपको टिप्पणी करने वाले कुछ काउंटरपॉइंट के लिए इन दो पत्रों को देखना चाहिए जो आप उद्धृत करते हैं: पी वैल्यूज़ के लिए दो चीयर्स (स्टीफन सेन् द्वारा) phil.vt.edu/dmayo/conference_2010/… ; पी या नॉट टू पी (मेरे द्वारा) arxiv.org/abs/1311.0081
माइकल ल्यू

1
बहुत बढ़िया बात! धन्यवाद! मैंने आपके योगदानों को शामिल करने के लिए थोड़ा संपादित किया है, और मैंने जो कुछ कहा है, उसके बारे में अपने निहितार्थों को शामिल करने के लिए उन्हें अच्छी तरह से समझने के बाद मैं थोड़ा और अधिक संपादित कर सकता हूं। यही कारण है कि मैं क्रॉस
वैलिडेट से

2
क्या आपके पास अपने दावे के पक्ष में कोई प्रायोगिक साक्ष्य है कि एडवर्ड्स की धारणा पी-मूल्यों तक फैली हुई है? मैं अपने आप को बेहद संदेहपूर्ण पाता हूं। सादृश्य का मेरा तरीका, मैंने एक दंपति पत्र देखा है जो प्रदर्शित करता है कि अनुभवी डेटा वैज्ञानिकों को स्कैल्पलेट से सहसंबंध गुणांक का अनुमान लगाने में परेशानी होती है। ऐसा लगता है कि आप वैज्ञानिकों से बहुत अधिक पूछ रहे हैं कि संभावना के संदर्भ में एप मूल्य का क्या अर्थ है। संभावना कार्यों के पक्ष में आपका तर्क दिलचस्प है ... वे कुछ हद तक पीछे के वितरण की तरह दिखते हैं, नहीं?
रुसलपिएर्स

2
@ मेरे पास सांख्यिकीय विधियों के उपयोगकर्ताओं की समझ के लिए प्रयोगात्मक प्रमाण नहीं हैं। मैं, हालांकि, इस बात का खंडन करता हूं कि कम से कम कुछ अध्ययन जो यह देखने के लिए किए गए हैं कि क्या वैज्ञानिकों के 'पी-वैल्यू' '' के वास्तविक मूल्य के वास्तविक स्पष्ट रूप से सार्थक विवरण के विकल्पों में शामिल नहीं होने से मोटे तौर पर दोषपूर्ण हैं। आपका सादृश्य करीब नहीं है क्योंकि तथ्य यह है कि सहसंबंध गुणांक आसानी से अनुमान नहीं लगाया जाता है एक पी-मूल्य से साक्ष्य की ताकत का अनुमान लगाने के समान समस्या नहीं है।
माइकल लेव

1
@rpierce पहले से एक समान रूप से खराब होने की संभावना घनत्व समारोह संभावना समारोह के लिए आनुपातिक होगा।
माइकल लेव
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.