NY टाइम्स का यह लेख " द ओड्स, कंटीन्यूअसली अपडेटेड" मेरा ध्यान आकर्षित करने के लिए हुआ। संक्षेप में, यह कहा गया है कि
[Bayesian आँकड़े] जटिल समस्याओं से निपटने में विशेष रूप से उपयोगी साबित हो रहे हैं, जिसमें 2013 में इस्तेमाल किए गए एक कोस्ट गार्ड जैसे लापता मछुआरे, जॉन एल्ड्रिज (हालांकि अभी तक, मलेशिया एयरलाइंस की उड़ान 370 के लिए शिकार में) को ढूंढना शामिल नहीं है। ......, बायेसियन आँकड़े भौतिकी से लेकर कैंसर अनुसंधान, पारिस्थितिकी से लेकर मनोविज्ञान तक सभी चीजों में व्याप्त हैं।
लेख में, अक्सर व्यक्ति के पी-मूल्य के बारे में कुछ आलोचनाएं भी हैं, उदाहरण के लिए:
यदि पी-मान 5 प्रतिशत से कम है, तो परिणाम आमतौर पर "सांख्यिकीय रूप से महत्वपूर्ण" माना जाता है। कोलंबिया में एक सांख्यिकी प्रोफेसर एंड्रयू जेलमैन ने कहा कि इस परंपरा में एक खतरा है। भले ही वैज्ञानिकों ने हमेशा गणना सही ढंग से की हो - और वे नहीं करते हैं, उनका तर्क है - 5 प्रतिशत के पी-मूल्य के साथ सब कुछ स्वीकार करने का मतलब है कि 20 में से एक "सांख्यिकीय रूप से महत्वपूर्ण" परिणाम यादृच्छिक शोर के अलावा कुछ भी नहीं है।
ऊपर के अलावा, शायद पी-मूल्य की आलोचना करने वाला सबसे प्रसिद्ध पेपर यह है - प्रकृति से रेजिना नुज़ो द्वारा "वैज्ञानिक विधि: सांख्यिकीय त्रुटियां" , जिसमें पी-मान दृष्टिकोण द्वारा उठाए गए कई वैज्ञानिक मुद्दों पर चर्चा की गई है, जैसे कि प्रजनन संबंधी चिंताएं। पी-मूल्य हैकिंग, आदि।
P मान, सांख्यिकीय वैधता के 'सोने के मानक', उतने विश्वसनीय नहीं हैं जितने वैज्ञानिक मानते हैं। ...... शायद सबसे बड़ी गिरावट आत्म-धोखे की है, जिसके लिए पेन्सिलवेनिया विश्वविद्यालय के मनोवैज्ञानिक उरी सिमोनसोहन और उनके सहयोगियों ने पी-हैकिंग शब्द को लोकप्रिय बनाया है; इसे डेटा-ड्रेजिंग, स्नूपिंग, फिशिंग, महत्व-पीछा और डबल-डिपिंग के रूप में भी जाना जाता है। "पी-हैकिंग," साइमनसोहन कहते हैं, "जब तक आप वांछित परिणाम प्राप्त नहीं करते तब तक कई चीजें कोशिश कर रही हैं" - यहां तक कि अनजाने में भी। ...... "ऐसा लगता है कि पी-हैकिंग के माध्यम से प्राप्त किया गया है, लेखकों ने एक स्थिति को गिरा दिया ताकि समग्र पी-मान .05 से कम हो", और "वह एक पी-हैकर है, वह हमेशा डेटा की निगरानी करती है जबकि इसे एकत्र किया जा रहा है। ”
एक और बात से निम्नलिखित के रूप में एक दिलचस्प साजिश है यहाँ , साजिश के बारे में टिप्पणी के साथ:
कोई फर्क नहीं पड़ता कि आपका प्रभाव कितना छोटा है, आप हमेशा डेटा इकट्ठा करने की कड़ी मेहनत कर सकते हैं ताकि p <.05 की सीमा को पार किया जा सके। जब तक आप जिस प्रभाव का अध्ययन कर रहे हैं वह अस्तित्वहीन नहीं है, पी-वैल्यू केवल यह मापता है कि आपने डेटा एकत्र करने में कितना प्रयास किया है।
उपरोक्त सभी के साथ, मेरे प्रश्न हैं:
दूसरे ब्लॉक उद्धरण में एंड्रयू जेलमैन के तर्क का क्या मतलब है, ठीक है? उन्होंने 5-प्रतिशत पी-मूल्य की व्याख्या "20 में से एक के रूप में महत्वपूर्ण रूप से महत्वपूर्ण परिणाम नोटिंग लेकिन यादृच्छिक शोर" के रूप में की थी? मुझे विश्वास नहीं हो रहा है कि एक एकल अध्ययन पर निष्कर्ष निकालने के लिए मेरे लिए पी-वैल्यू का उपयोग किया जाता है। उनकी बात कई परीक्षण से संबंधित लगती है।
अद्यतन: इस बारे में एंड्रयू जेलमैन के ब्लॉग की जाँच करें: नहीं, मैंने ऐसा नहीं कहा! (श्रेय @Scortchi, @whuber को)।
- क्या सांख्यिकीय विश्लेषण के लिए पी-मूल्य का उपयोग करने का कोई अच्छा व्यावहारिक मार्गदर्शन है जो अधिक विश्वसनीय अनुसंधान परिणामों को जन्म दे सकता है?
कुछ सांख्यिकीविद अधिवक्ता के रूप में बेयसियन मॉडलिंग को आगे बढ़ाने का एक बेहतर तरीका होगा? विशेष रूप से, बेयसियन दृष्टिकोण गलत मुद्दों को सुलझाने या डेटा मुद्दों में हेरफेर करने की अधिक संभावना होगी? मैं यहाँ भी आश्वस्त नहीं हूँ क्योंकि बायेसियन दृष्टिकोण में पूर्व बहुत व्यक्तिपरक है। क्या कोई व्यावहारिक और प्रसिद्ध अध्ययन है जो बेयसियन दृष्टिकोण दिखाते हैं, लगातारवादी के पी-मूल्य से बेहतर है, या कम से कम कुछ विशेष मामलों में?
अद्यतन: मुझे विशेष रूप से इस बात में दिलचस्पी होगी कि क्या ऐसे मामले हैं जो बायेसियन दृष्टिकोण लगातार पी के मूल्य के दृष्टिकोण से अधिक विश्वसनीय है। "विश्वसनीय" से मेरा मतलब है कि बायेसियन दृष्टिकोण वांछित परिणामों के लिए डेटा में हेरफेर करने की कम संभावना है। कोई सुझाव?
अपडेट 6/9/2015
बस खबर पर गौर किया, और सोचा कि इसे चर्चा के लिए यहां रखना अच्छा होगा।
मनोविज्ञान पत्रिका P मानों पर प्रतिबंध लगाती है
एक विवादास्पद सांख्यिकीय परीक्षण अंत में कम से कम एक पत्रिका में अपने अंत से मिला है। इस महीने की शुरुआत में, बेसिक एंड एप्लाइड सोशल साइकोलॉजी (बीएएसपी) के संपादकों ने घोषणा की कि पत्रिका अब पी वैल्यू वाले पेपर प्रकाशित नहीं करेगी, क्योंकि आंकड़े अक्सर कम गुणवत्ता वाले अनुसंधान का समर्थन करने के लिए उपयोग किए जाते थे।
हाल ही में एक पेपर के साथ, "फिकल पी वैल्यू , पी वैल्यू के बारे में " नेचर से इररेप्रोडयूसीबल परिणाम उत्पन्न करता है ।
अपडेट 5/8/2016
मार्च में वापस, अमेरिकन स्टैटिस्टिकल एसोसिएशन (एएसए) ने सांख्यिकीय महत्व और पी-मूल्यों पर बयान जारी किया, ".... एएसए स्टेटमेंट का उद्देश्य 'पोस्ट पी <0.05 युग' में शोध को आगे बढ़ाना है।"
इस कथन में 6 सिद्धांत हैं जो पी-मूल्य के दुरुपयोग को संबोधित करते हैं:
- पी-मान इंगित कर सकते हैं कि निर्दिष्ट सांख्यिकीय मॉडल के साथ डेटा कितने असंगत हैं।
- पी-मान उस संभावना को नहीं मापते हैं कि अध्ययन की गई परिकल्पना सच है, या संभावना है कि डेटा अकेले यादृच्छिक मौका द्वारा उत्पादित किए गए थे।
- वैज्ञानिक निष्कर्ष और व्यवसाय या नीतिगत निर्णय केवल इस आधार पर नहीं होना चाहिए कि क्या पी-मूल्य एक विशिष्ट सीमा से गुजरता है।
- उचित आक्षेप के लिए पूर्ण रिपोर्टिंग और पारदर्शिता की आवश्यकता होती है।
- एक पी-मूल्य, या सांख्यिकीय महत्व, किसी परिणाम के आकार या परिणाम के महत्व को नहीं मापता है।
- अपने आप से, एक पी-मूल्य एक मॉडल या परिकल्पना के बारे में सबूत का एक अच्छा उपाय प्रदान नहीं करता है।
विवरण: "पी-मूल्यों पर एएसए का बयान: संदर्भ, प्रक्रिया और उद्देश्य" ।