पी-वैल्यू (साथ ही सांख्यिकीय निष्कर्ष के अन्य मेट्रिक्स) के सापेक्ष प्रभाव आकारों की उपयोगिता मेरे क्षेत्र-मनोविज्ञान में नियमित रूप से बहस की जाती है - और यह बहस वर्तमान में "गर्म" है, जो आपके प्रश्न के लिए प्रासंगिक कारणों से सामान्य है। हालांकि मुझे यकीन है कि मनोविज्ञान जरूरी नहीं कि सबसे सांख्यिकीय रूप से परिष्कृत वैज्ञानिक क्षेत्र है, इसने आसानी से चर्चा की है, अध्ययन किया है - और कई बार, प्रदर्शन किया - सांख्यिकीय अनुमान के लिए विभिन्न दृष्टिकोणों की सीमाएं, या कम से कम वे मानव उपयोग द्वारा कैसे सीमित हैं। पहले से ही पोस्ट किए गए उत्तरों में अच्छी अंतर्दृष्टि शामिल है, लेकिन यदि आप कारणों के बारे में अधिक व्यापक सूची (और संदर्भ) में रुचि रखते हैं और प्रत्येक के खिलाफ, नीचे देखें।
पी-वैल्यू अवांछनीय क्यों हैं?
- जैसा कि डैरेन जेम्स नोट (और उनके सिमुलेशन से पता चलता है), पी-मान काफी हद तक आपके द्वारा देखे गए टिप्पणियों के आधार पर आकस्मिक हैं देखे जाने वाले (देखें किर्क, 2003)
- जॉन नोटों के रूप में, पी-मान डेटा को देखने के सशर्त संभावना को चरम या अधिक चरम के रूप में दर्शाते हैं, यह देखते हुए कि शून्य परिकल्पना सच है। जैसा कि अधिकांश शोधकर्ता अनुसंधान परिकल्पना की संभावनाएँ, और / या अशक्त परिकल्पना करते हैं, पी-मान उन सम्भावनाओं पर बात नहीं करते हैं जिनमें शोधकर्ता सबसे अधिक रुचि रखते हैं (यानी, शून्य या शोध परिकल्पना की, डायोड देखें, 2008)
- बहुत से लोग जो पी-वैल्यू का उपयोग करते हैं, वे समझ नहीं पाते हैं कि उनका क्या मतलब है / मतलब नहीं है (श्मिट एंड हंटर, 1997)। माइकल ल्यू के गेलमैन और स्टर्न के संदर्भ (2006) के पेपर में शोधकर्ता गलतफहमी को समझते हैं कि पी-मानों से कोई क्या (या नहीं कर सकता) की व्याख्या करता है। और फाइव थर्टीहाइट पर अपेक्षाकृत हाल की कहानी के रूप में, यह मामला जारी है।
- पी-मान बाद के पी-मानों की भविष्यवाणी करने में महान नहीं हैं (कमिंग, 2008)
- पी-वैल्यू को अक्सर गलत तरीके से प्रस्तुत किया जाता है (अधिक बार महत्व को बढ़ाते हुए ), और गलत शेयरिंग डेटा को साझा करने की अनिच्छा से जुड़ा होता है (बकर एंड वीचर्ट्स, 2011; न्यूजेटन एट अल।, 2016; विचर्ट्स एट अल।, 2011)।
- पी-मान विश्लेषणात्मक लचीलेपन के माध्यम से सक्रिय रूप से विकृत हो सकते हैं (और ऐतिहासिक रूप से,) और इसलिए अविश्वास (जॉन एट अल।, 2012; सिमंस एट अल।, 2011)
- पी-मान असमान रूप से महत्वपूर्ण हैं, क्योंकि वैज्ञानिक सटीकता पर वैज्ञानिक महत्व के लिए अकादमिक प्रणाली वैज्ञानिकों को पुरस्कृत करती दिखाई देती है (फैनेली, 2010; नोज़क एट अल।, 2012; रोसेंथल, 1979)।
प्रभाव आकार वांछनीय क्यों हैं?
ध्यान दें कि मैं आपके प्रश्न की व्याख्या विशेष रूप से मानकीकृत प्रभाव आकारों के रूप में कर रहा हूं, जैसा कि आप कहते हैं कि वे शोधकर्ताओं को अपने निष्कर्ष "एक मेमन मीट्रिक" को बदलने की अनुमति देते हैं।
- जैसा कि जॉन और डैरेन जेम्स संकेत करते हैं, प्रभाव आकार एक प्रभाव की भयावहता का संकेत देते हैं, टिप्पणियों की संख्या से स्वतंत्र (अमेरिकी मनोवैज्ञानिक एसोसिएशन 2010; कमिंग, 2014) एक प्रभाव है या नहीं, इसके बारे में द्विभाजित निर्णय लेने के विरोध में।
- प्रभाव का आकार मूल्यवान है क्योंकि वे मेटा-विश्लेषण को संभव बनाते हैं, और मेटा-विश्लेषण ड्राइव संचयी ज्ञान (बोरेनस्टीन एट।), 2009; चान एंड आर्वे, 2012;
- प्रभाव आकार एक प्राथमिक शक्ति विश्लेषण के माध्यम से नमूना आकार योजना को सुविधाजनक बनाने में मदद करता है , और इसलिए अनुसंधान में कुशल संसाधन आवंटन (कोहेन, 1992)
पी-वैल्यू वांछनीय क्यों हैं?
हालांकि वे कम अक्सर जासूसी कर रहे हैं, पी-मूल्यों की संख्या कई है। कुछ प्रसिद्ध और दीर्घकालिक हैं, जबकि अन्य अपेक्षाकृत नए हैं।
पी-मान सांख्यिकीय मॉडल नल परिकल्पना के खिलाफ सबूत की ताकत का एक सुविधाजनक और परिचित सूचकांक प्रदान करते हैं।
जब सही तरीके से गणना की जाती है, तो पी-वैल्यू द्विगुणित निर्णय लेने का एक साधन प्रदान करते हैं (जो कभी-कभी आवश्यक होते हैं), और पी-वैल्यू स्वीकार्य स्तर पर लंबी-झूठी झूठी सकारात्मक दरों को बनाए रखने में मदद करते हैं (डायनेस, 2008; सलुक, 2016) "यह यह कहने के लिए कड़ाई से सही नहीं है कि द्वि-निगमित निर्णयों के लिए पी-मान आवश्यक हैं। वे वास्तव में उस तरह से व्यापक रूप से उपयोग किए जाते हैं, लेकिन नेमन एंड पियर्सन ने उस उद्देश्य के लिए परीक्षण सांख्यिकीय स्थान में 'महत्वपूर्ण क्षेत्रों' का इस्तेमाल किया। देखिए यह सवाल और इसके जवाब]
- पी-वैल्यू का उपयोग लगातार कुशल नमूना आकार योजना (न केवल एक बार बिजली-विश्लेषण) की सुविधा के लिए किया जा सकता है (Lakens, 2014)
- पी-मूल्यों का उपयोग मेटा-विश्लेषण की सुविधा के लिए किया जा सकता है और साक्ष्य मूल्य (साइमनोशन एट अल।, 2014.; सिमोनसोहन एट अल।, 2014 बी) का उपयोग किया जा सकता है। इस ब्लागपोस्ट को एक सुलभ चर्चा के लिएदेखेंकि कैसे इस तरह से पी-वैल्यू के वितरण का उपयोग किया जा सकता है, साथ ही इस सीवी पोस्ट संबंधित चर्चा के लिए ।
- पी-वैल्यू का उपयोग फोरेंसिक रूप से यह निर्धारित करने के लिए किया जा सकता है कि क्या संदिग्ध अनुसंधान प्रथाओं का उपयोग किया जा सकता है, और कैसे पुन: प्रयोज्य परिणाम हो सकते हैं (शिमैक, 2014; स्कोनब्रॉड्ट ऐप, 2015 भी देखें)
प्रभाव आकार अवांछनीय (या ओवररेटेड) क्यों हैं?
शायद कई के लिए सबसे अधिक काउंटर-सहज स्थिति; क्यों मानकीकृत प्रभाव आकार की रिपोर्टिंग अवांछनीय होगी, या बहुत कम से कम, ओवररेटेड?
- कुछ मामलों में, मानकीकृत प्रभाव आकार वे सभी नहीं होते हैं जो टूट जाते हैं (उदाहरण के लिए, ग्रीनलैंड, श्लेस्सलमैन, और क्रिक्वि, 1986)। Baguely (2009), विशेष रूप से, कुछ कारणों का एक अच्छा विवरण है कि क्यों कच्चे / अनियंत्रित प्रभाव आकार वांछनीय हो सकते हैं।
- एक प्राथमिकता शक्ति विश्लेषण के लिए उनकी उपयोगिता के बावजूद, प्रभावी आकार-आकार योजना (मैक्सवेल, 2004) को सुविधाजनक बनाने के लिए प्रभाव आकारों का वास्तव में उपयोग नहीं किया जाता है।
- यहां तक कि जब प्रभाव आकार का उपयोग नमूना आकार योजना में किया जाता है, क्योंकि उन्हें प्रकाशन पूर्वाग्रह के माध्यम से फुलाया जाता है (रोसेन्थल, 1979) प्रकाशित प्रभाव आकार विश्वसनीय नमूना-आकार योजना (साइमनोशन, 2013) के लिए संदिग्ध उपयोगिता के हैं
- प्रभाव का आकार अनुमान लगाया जा सकता है और सांख्यिकीय रूप से सॉफ्टवेयर में व्यवस्थित रूप से रखा गया है (लेविन और हुलेट, 2002)
- प्रभाव आकार गलती से निकाले जाते हैं (और शायद गलत तरीके से) जो मेटा- एनालिसिस (Gøtzsche et al।), 2007 की विश्वसनीयता को कम करता है ।
- अंत में, प्रभाव के आकार में प्रकाशन पूर्वाग्रह के लिए सही अप्रभावी बनी हुई है (कार्टर एट अल।, 2017 देखें), जो, यदि आप मानते हैं कि प्रकाशन पूर्वाग्रह मौजूद हैं, तो मेटा-विश्लेषण को कम प्रभावशाली बनाता है।
सारांश
माइकल ल्यू द्वारा किए गए बिंदु की गूंज, पी-वैल्यू और प्रभाव आकार हैं, लेकिन सांख्यिकीय प्रमाण के दो टुकड़े; वहाँ दूसरों को भी विचार के लायक हैं। लेकिन पी-वैल्यू और इफेक्ट साइज़ की तरह, इवेबिलिटी वैल्यू के अन्य मेट्रिक्स ने साझा किया है और अनूठी समस्याएं भी। शोधकर्ता आमतौर पर आत्मविश्वास अंतराल (जैसे, होकेस्ट्रा एट अल।, 2014; मोरे एट अल।, 2016), उदाहरण के लिए, और बायेसियन विश्लेषण के परिणाम शोधकर्ताओं द्वारा विकृत कर सकते हैं, जैसे पी-मान का उपयोग करते समय (जैसे, साइमनोशन)। , 2014)।
सभी साक्ष्यों के मीट्रिक जीत गए हैं और सभी को पुरस्कार मिलना चाहिए।
संदर्भ
अमेरिकन मनोवैज्ञानिक संगठन। (2010)। अमेरिकन साइकोलॉजिकल एसोसिएशन का प्रकाशन मैनुअल (6 वां संस्करण)। वाशिंगटन, डीसी: अमेरिकन साइकोलॉजिकल एसोसिएशन।
बागुले, टी। (2009)। मानकीकृत या सरल प्रभाव आकार: क्या बताया जाना चाहिए? मनोविज्ञान के ब्रिटिश जर्नल, 100 (3), 603-617।
बकर, एम।, और विचर्ट्स, जेएम (2011)। मनोविज्ञान पत्रिकाओं में सांख्यिकीय परिणामों की (गलत) रिपोर्टिंग। व्यवहार अनुसंधान विधियों, 43 (3), 666-678।
बोरेंस्टीन, एम।, हेजेज, एलवी, हिगिंस, जे।, और रोथस्टीन, एचआर (2009)। मेटा-विश्लेषण का परिचय। वेस्ट ससेक्स, यूके: जॉन विले एंड संस, लिमिटेड
कार्टर, EC, Schönbrodt, FD, Gervais, WM, & Hilgard, J. (2017, 12 अगस्त)। मनोविज्ञान में पूर्वाग्रह के लिए सुधार: मेटा-एनालिटिकल विधियों की तुलना। Osf.io/preprints/psyarxiv/9h3nu से लिया गया
चान, एमई, और आरवी, आरडी (2012)। मेटा-विश्लेषण और ज्ञान का विकास। मनोवैज्ञानिक विज्ञान पर परिप्रेक्ष्य, 7 (1), 79-92।
कोहेन, जे। (1992)। एक पावर प्राइमर। मनोवैज्ञानिक बुलेटिन, 112 (1), 155-159।
कमिंग, जी। (2008)। प्रतिकृति और पी अंतराल: पी मान पूर्व-भविष्य को केवल अस्पष्ट रूप से निर्धारित करते हैं, लेकिन आत्मविश्वास अंतराल बहुत बेहतर करते हैं। मनोवैज्ञानिक विज्ञान पर परिप्रेक्ष्य, 3, 286- 300।
डायनेस, डी। (2008)। मनोविज्ञान को एक विज्ञान के रूप में समझना: वैज्ञानिक और सांख्यिकीय निष्कर्ष के लिए एक परिचय। न्यूयॉर्क, एनवाई: पालग्रेव मैकमिलन।
फैनेली, डी। (2010)। "सकारात्मक" परिणाम विज्ञान के पदानुक्रम को बढ़ाते हैं। प्लोस वन, 5 (4), ई 10068।
जेलमैन, ए।, और स्टर्न, एच। (2006)। "महत्वपूर्ण" और "महत्वपूर्ण नहीं" के बीच का अंतर स्वयं सांख्यिकीय रूप से महत्वपूर्ण नहीं है। द अमेरिकन स्टेटिस्टिशियन, 60 (4), 328-331।
Gøtzsche, PC, Hróbjartsson, A., Marić, K., & Tendal, B. (2007)। मेटा-विश्लेषण में डेटा निष्कर्षण त्रुटियां जो मानकीकृत माध्य अंतरों का उपयोग करती हैं। JAMA, 298 (4), 430-437।
ग्रीनलैंड, एस।, श्लेस्सलमैन, जेजे और क्रिक्वि, एमएच (1986)। प्रभाव के उपायों के रूप में मानकीकृत प्रतिगमन गुणांक और सहसंबंधों को नियोजित करने की गिरावट। अमेरिकन जर्नल ऑफ एपिडेमियोलॉजी, 123 (2), 203-208।
होकेस्ट्रा, आर।, मोरे, आरडी, राइडर, जेएन, और वेगेनमेकर्स, ईजे (2014)। आत्मविश्वास के अंतराल की गलत व्याख्या। साइकोनोमिक बुलेटिन एंड रिव्यू, 21 (5), 1157-1164।
जॉन, एलके, लोवेनस्टीन, जी।, और प्रीलेक, डी। (2012)। सत्य कहने के लिए प्रोत्साहन के साथ संदिग्ध अनुसंधान प्रथाओं की व्यापकता को मापना। मनोवैज्ञानिक विज्ञान, 23 (5), 524-532।
किर्क, आरई (2003)। प्रभाव परिमाण का महत्व। एस एफ डेविस (एड।), प्रयोगात्मक मनोविज्ञान में अनुसंधान विधियों की पुस्तिका (पीपी 83-105)। माल्डेन, एमए: ब्लैकवेल।
लकेंस, डी। (2014)। अनुक्रमिक विश्लेषण के साथ कुशलता से उच्च ing संचालित अध्ययन करना। यूरोपीय जर्नल ऑफ सोशल साइकोलॉजी, 44 (7), 701-710।
लेविन, टीआर, और हुलेट, सीआर (2002)। एटा स्क्वायर्ड, आंशिक ईटा स्क्वर्ड, और संचार अनुसंधान में प्रभाव के आकार का गलत चित्रण। मानव संचार अनुसंधान, 28 (4), 612-625।
मैक्सवेल, एसई (2004)। मनोवैज्ञानिक अनुसंधान में कमज़ोर अध्ययन की दृढ़ता: कारण, परिणाम और उपचार। मनोवैज्ञानिक तरीके, 9 (2), 147।
मोरे, आरडी, होकेस्ट्रा, आर।, राइडर, जेएन, ली, एमडी, और वेगेनमेकर्स, ईजे (2016)। आत्मविश्वास अंतराल में आत्मविश्वास रखने की गिरावट। साइकोनोमिक बुलेटिन एंड रिव्यू, 23 (1), 103-123।
नोसेक, बीए, जासूस, जेआर, और मोतील, एम। (2012)। वैज्ञानिक यूटोपिया: II। युवावस्था पर सत्य को बढ़ावा देने के लिए प्रोत्साहन और प्रथाओं का पुनर्गठन। मनोवैज्ञानिक विज्ञान पर परिप्रेक्ष्य, 7 (6), 615-631।
Nuijten, MB, Hartgerink, CH, van Assen, MA, Epskamp, S., & Wicherts, JM (2016)। मनोविज्ञान में सांख्यिकीय रिपोर्टिंग त्रुटियों की व्यापकता (1985-2013)। व्यवहार अनुसंधान विधियों, 48 (4), 1205-1226।
रोसेन्थल, आर। (1979)। फ़ाइल परिणाम समस्या और अशक्त परिणामों के लिए सहिष्णुता। मनोवैज्ञानिक बुलेटिन, 86 (3), 638-641।
सकलुक, जेके (2016)। छोटे की खोज, बड़े की पुष्टि: संचयी और नकल मनोवैज्ञानिक अनुसंधान को आगे बढ़ाने के लिए नए आँकड़ों के लिए एक वैकल्पिक प्रणाली। जर्नल ऑफ़ एक्सपेरिमेंटल सोशल साइकोलॉजी, 66, 47-54।
शिमैक, यू। (2014)। सांख्यिकीय अनुसंधान वफ़ादारी का परिमाण: द रिप्लेसेबिलिटी-इंडेक्स। Http://www.r-index.org से लिया गया
श्मिट, एफएल, और हंटर, जेई (1997)। अनुसंधान डेटा के विश्लेषण में महत्व परीक्षण के बंद होने पर आठ आम लेकिन झूठी आपत्तियां। एलएल हरलो, एसए मुलिक, और जेएच स्टीगर (ईडीएस) में, क्या होगा अगर कोई महत्व परीक्षण नहीं थे? (पीपी। 37-64)। महवा, एनजे: एर्लबम।
स्कोनब्रोड, एफडी (2015)। पी-चेकर: एक के लिए सभी पी-मूल्य विश्लेषक। Http://shinyapps.org/apps/p-checker/ से लिया गया ।
सीमन्स, जेपी, नेल्सन, एलडी, और साइमनोशन, यू (2011)। गलत-सकारात्मक मनोविज्ञान: डेटा संग्रह और विश्लेषण में अज्ञात लचीलापन महत्वपूर्ण के रूप में कुछ भी पेश करने की अनुमति देता है। मनोवैज्ञानिक विज्ञान, 22 (11), 1359-1366।
सिमोनसोहन, यू। (2013)। मनाया प्रभाव आकार के आधार पर शक्ति प्रतिकृति की मूर्खता। से पुनर्प्राप्त http://datacolada.org/4
सिमोनसोहन, यू। (2014)। पोस्टीरियर-हैकिंग। Http://datacolada.org/13 से लिया गया ।
साइमनोशन, यू।, नेल्सन, एलडी, और सीमन्स, जेपी (2014)। पी-वक्र: फाइल-ड्रावर की एक कुंजी। प्रायोगिक मनोविज्ञान जर्नल: जनरल, 143 (2), 534-547।
साइमनोशन, यू।, नेल्सन, एलडी, और सीमन्स, जेपी (2014)। पी-वक्र और प्रभाव का आकार: केवल महत्वपूर्ण परिणामों का उपयोग करके प्रकाशन पूर्वाग्रह के लिए सही। मनोवैज्ञानिक विज्ञान पर परिप्रेक्ष्य, 9 (6), 666-681।
विचर्ट्स, जेएम, बकर, एम।, और मोलेनार, डी। (2011)। अनुसंधान डेटा साझा करने की इच्छा साक्ष्य की ताकत और सांख्यिकीय परिणामों की रिपोर्टिंग की गुणवत्ता से संबंधित है। प्लोस वन, 6 (11), ई 26828।