क्या यह पी-वैल्यू समस्या का समाधान है?


67

फरवरी 2016 में, अमेरिकी सांख्यिकीय एसोसिएशन ने सांख्यिकीय महत्व और पी-मूल्यों पर एक औपचारिक बयान जारी किया। इसके बारे में हमारे सूत्र ने इन मुद्दों पर व्यापक चर्चा की। हालाँकि, कोई भी प्राधिकारी अब तक एक सार्वभौमिक मान्यता प्राप्त प्रभावी विकल्प की पेशकश करने के लिए आगे नहीं आया है - अब तक। अमेरिकन स्टेटिस्टिकल सोसाइटी (ASS) ने अपनी प्रतिक्रिया, पी-वैल्यू प्रकाशित की है : आगे क्या है?

"पी-मान ज्यादा के लिए अच्छा नहीं है।"

हमें लगता है कि एएसए पर्याप्त दूर नहीं गया। यह स्वीकार करने का समय है कि पी-मूल्यों का युग समाप्त हो गया है। सांख्यिकीविदों ने उन्हें हर जगह अंडरग्रेजुएट्स, ट्रिक वैज्ञानिकों और मूर्ख संपादकों को चकमा देने के लिए सफलतापूर्वक इस्तेमाल किया है, लेकिन दुनिया इस रज़्यू के माध्यम से देखना शुरू कर रही है। हमें निर्णय लेने को नियंत्रित करने के लिए सांख्यिकीविदों द्वारा 20 वीं शताब्दी के शुरुआती प्रयास को छोड़ने की आवश्यकता है। हमें वास्तव में काम करने के लिए वापस लौटने की आवश्यकता है

ASS का आधिकारिक प्रस्ताव यह है:

पी-मूल्यों के स्थान पर, ASS STOP (SeaT-to-पैंट प्रक्रिया) की वकालत करता है इस समय सम्मानित और -tested पद्धति का उपयोग प्राचीन यूनानियों, पुनर्जागरण पुरुषों और सभी वैज्ञानिकों द्वारा किया गया था जब तक कि रोनाल्ड फिशर ने साथ नहीं आया और चीजों को बर्बाद कर दिया। STOP सरल, प्रत्यक्ष, डेटा-चालित और आधिकारिक है। इसे बाहर ले जाने के लिए, एक अथॉरिटी फिगर (वरीयता से एक बड़ा पुरुष) डेटा की समीक्षा करता है और निर्णय लेता है कि क्या वे उसकी राय से सहमत हैं। जब वह निर्णय लेता है कि वे क्या करते हैं, तो परिणाम "महत्वपूर्ण" होता है, अन्यथा यह पूरी तरह से नहीं है और हर किसी को पूरी बात भूलना चाहिए।

सिद्धांतों

प्रतिक्रिया एएसए के छह सिद्धांतों में से प्रत्येक को संबोधित करती है।

  1. STOP यह संकेत दे सकता है कि एक निर्दिष्ट सांख्यिकीय मॉडल के साथ डेटा कितना असंगत है।

    हम इस वाक्यांश को पसंद करते हैं क्योंकि यह कहने का एक फैंसी तरीका है कि STOP किसी भी प्रश्न का उत्तर हाँ या नहीं में देगा। पी-वैल्यू या अन्य सांख्यिकीय प्रक्रियाओं के विपरीत, यह कोई संदेह नहीं छोड़ता है। यह उन लोगों के लिए एकदम सही प्रतिक्रिया है, जो कहते हैं कि "हमें किसी बदबूदार अशक्त परिकल्पना की आवश्यकता नहीं है!" क्या *?! @ है, वैसे भी? कोई भी कभी भी यह पता नहीं लगा सका कि यह क्या होना चाहिए था। ”

  2. STOP इस संभावना को नहीं मापता है कि एक परिकल्पना सच है: यह वास्तव में तय करता है कि यह सच है या नहीं।

    हर कोई संभावनाओं से भ्रमित है। तस्वीर से संभावना निकालकर, STOP स्नातक और स्नातक अध्ययन के वर्षों की आवश्यकता को समाप्त करता है। अब कोई भी (जो पर्याप्त रूप से बूढ़ा और पुरुष है) बिना एक भी सांख्यिकीय व्याख्यान या रनिंग आर्कान सॉफ्टवेयर के सुनने के दर्द और यातना के बिना सांख्यिकीय विश्लेषण कर सकता है जो अनजाने में आउटपुट को फैलाता है।

  3. वैज्ञानिक निष्कर्ष और व्यापार या नीतिगत निर्णय सामान्य ज्ञान और वास्तविक प्राधिकरण के आंकड़ों पर आधारित हो सकते हैं।

    महत्वपूर्ण निर्णय हमेशा अधिकारियों द्वारा किए गए हैं, वैसे भी, तो चलो इसे स्वीकार करते हैं और बिचौलियों को काटते हैं। एसटीओपी का उपयोग सांख्यिकीविदों को वह करने के लिए स्वतंत्र होगा जो वे इसके लिए सबसे उपयुक्त हैं: संख्याओं का उपयोग सच्चाई को बाधित करने और सत्ता में उन लोगों की वरीयताओं को पवित्र करने के लिए।

  4. उचित अनुमान के लिए पूर्ण रिपोर्टिंग और पारदर्शिता की आवश्यकता होती है।

    STOP अब तक की गई सबसे पारदर्शी और स्व-स्पष्ट सांख्यिकीय प्रक्रिया है: आप डेटा को देखते हैं और आप तय करते हैं। यह उन सभी भ्रामक z- परीक्षणों, टी-परीक्षणों, ची-स्क्वेर्ड परीक्षणों, और वर्णमाला सूप प्रक्रियाओं (ANOVA! GLM! MLE!) को लोगों द्वारा उपयोग किए गए तथ्य को छिपाने के लिए उपयोग करता है कि उनके पास कोई सुराग नहीं है कि डेटा का क्या मतलब है।

  5. STOP परिणाम के महत्व को मापता है।

    यह स्वयं स्पष्ट है: यदि प्राधिकरण का कोई व्यक्ति STOP नियुक्त करता है, तो परिणाम महत्वपूर्ण होना चाहिए।

  6. अपने आप में, STOP एक मॉडल या परिकल्पना के बारे में सबूत का एक अच्छा उपाय प्रदान करता है।

    हम एक प्राधिकरण को चुनौती नहीं देना चाहेंगे? शोधकर्ता और निर्णय निर्माता यह पहचानेंगे कि STOP वे सभी जानकारी प्रदान करता है जो उन्हें जानने की आवश्यकता होती है। इन कारणों से, डेटा विश्लेषण STOP के साथ समाप्त हो सकता है; वैकल्पिक दृष्टिकोणों की आवश्यकता नहीं है, जैसे पी-वैल्यू, मशीन लर्निंग, या ज्योतिष।

अन्य दृष्टिकोण

कुछ सांख्यिकीविद तथाकथित "बायेसियन" विधियों को पसंद करते हैं, जिसमें एक अस्पष्ट प्रमेय को मरणोपरांत 18 वीं शताब्दी के मौलवी द्वारा प्रकाशित किया जाता है, जो हर समस्या को हल करने के लिए निडरता से लागू होता है। इसके सबसे विख्यात वकील इन विधियों को स्वतंत्र रूप से स्वीकार करने की वकालत करते हैं "व्यक्तिपरक"। यदि हम व्यक्तिपरक तरीकों का उपयोग करने जा रहे हैं, तो जाहिर है कि निर्णय निर्माता जितना अधिक आधिकारिक और जानकार होगा, उतना ही बेहतर परिणाम होगा। इस प्रकार STOP सभी Bayes विधियों की तार्किक सीमा के रूप में उभरता है। क्यों उन भयानक गणनाओं को काम करने के लिए और इतने कंप्यूटर समय को बांधने के प्रयास पर जाएं, जब आप केवल प्रभारी व्यक्ति को डेटा दिखा सकते हैं और उससे पूछ सकते हैं कि उसकी राय क्या है? कहानी का अंत।

एक अन्य समुदाय हाल ही में सांख्यिकीविदों की पुरोहिती को चुनौती देने के लिए पैदा हुआ है। वे खुद को "मशीन सीखने वाले" और "डेटा वैज्ञानिक" कहते हैं, लेकिन वे वास्तव में सिर्फ हैकर उच्च स्थिति की तलाश कर रहे हैं। यह ASS की आधिकारिक स्थिति है कि इन लोगों को अपना पेशेवर संगठन बनाना चाहिए अगर वे चाहते हैं कि लोग उन्हें गंभीरता से लें।


प्रश्न

क्या यह उन समस्याओं का जवाब है जो एएसए ने पी-मूल्यों और अशक्त परिकल्पना परीक्षण के साथ पहचानी हैं? क्या यह वास्तव में बायेसियन और फ़्रीक्वेंटिस्ट प्रतिमानों को एकजुट कर सकता है (जैसा कि प्रतिक्रिया में दावा किया गया है)?


11
"सुप्रीम स्टॉप ASS जज के लिए डोनाल्ड ट्रम्प: आंकड़ों को फिर से महान बनाएं!"
एलेक्स आर।

14
स्पष्ट रूप से STOP एक उप-प्रक्रिया है। मुझे आश्चर्य है कि इसने विद्वानों के ऐसे सम्मानित संगठन को एएसएस के रूप में बचा लिया है। बुद्धि के लिए, डेटा को देखने में समय क्यों बर्बाद करना है ? बस अपनी हां / ना में कोई प्रतिक्रिया दें। यह कार्यप्रणाली पहले से ही महान प्रभाव में है। मामले के अध्ययन के द्वारा 4. विभाज्य वर्षों के दौरान प्रचुर मात्रा में, विशेष रूप से संयुक्त राज्य अमेरिका में
कार्डिनल

4
मुझे लगता है कि इन तरीकों को अपनाने से व्यवसायों को भी काफी फायदा हो सकता है, क्योंकि उन्हें अब अपने डेटा का विश्लेषण करने के लिए लोगों को काम पर रखने की भारी लागत का सामना नहीं करना पड़ेगा।
dsaxton

4
@ जब्री [april-1] टैग के रूप में हमें यह नहीं बताया?
Glen_b

9
@ हेनरी गंभीरता से? क्या आप हमें कोई भी नकली संगठन दिखा सकते हैं जो Google का नाम लेते ही एक चौथाई मिलियन से अधिक हिट हो जाता है?
whuber

जवाबों:


18

मैं RADD: R oll A D amn D यानी नामक सांख्यिकीय निर्णय के लिए अपने स्वयं के नए दृष्टिकोण की वकालत कर रहा हूं । यह सभी प्रमुख बिंदुओं को भी संबोधित करता है।

1) RADD यह संकेत दे सकता है कि निर्दिष्ट सांख्यिकीय मॉडल के साथ डेटा कितना संगत है।

यदि आप अधिक संख्या में रोल करते हैं, तो स्पष्ट रूप से आपके मॉडल के पक्ष में साक्ष्य अधिक हैं! एक अतिरिक्त लाभ यह है कि, यदि हम और भी अधिक आत्मविश्वास की इच्छा रखते हैं, तो हम अधिक पक्षों के साथ एक मर को रोल कर सकते हैं। यदि आप पर्याप्त खोज करते हैं तो आप 100 तरफा पासा भी पा सकते हैं!

2) RADD तय कर सकता है कि एक परिकल्पना सच है या नहीं।

आपको केवल एक 2 तरफा मरना है, यानी एक सिक्का फ्लिप करना है।

3) RADD का उपयोग व्यवसाय या नीतिगत निर्णय लेने के लिए किया जा सकता है

एक कमरे में नीति निर्माताओं का एक समूह प्राप्त करें, और उन सभी को पासा रोल करें! सबसे ऊंची जीत!

4) RADD पारदर्शी है।

परिणाम दर्ज किया जा सकता है, और खुद को आगे के शोध के लिए रखा जा सकता है *

5) RADD परिणाम के महत्व को मापता है।

जाहिर है, रोलिंग उच्च संकेत एक बहुत ही महत्वपूर्ण घटना हुई है।

6) RADD सबूत का एक अच्छा उपाय प्रदान करता है।

क्या हमने यह नहीं कहा कि उच्च रोल बेहतर हैं?

तो, नहीं, STOP जवाब नहीं है। जवाब है RADD।


7
भूलने के लिए नहीं, यह टाइप I त्रुटि नियंत्रण सुनिश्चित कर सकता है (किसी भी वांछित स्तर पर पर्याप्त पक्षीय पासा दिया गया) उदाहरण के लिए केवल एक अशक्त परिकल्पना को खारिज करके जब 100 पक्षीय पासा की उच्चतम संख्या के साथ 5 पक्षों में से एक को प्राप्त करने के लिए आता है। 5% प्रकार I त्रुटि दर।
ब्योर्न


17

मुझे अपने अनुभव से कहना चाहिए कि व्यावसायिक वास्तविकता में STOP डिफ़ॉल्ट निर्णय लेने का मानदंड है, जिसे पसंद किया जाता हैp-विकास और अन्य अक्सरवादी, या बायेसियन तरीके। व्यावसायिक दृष्टिकोण से STOP सरल और निश्चित उत्तर प्रदान करता है जो इसे अनिश्चित "संभाव्य" विधियों की तुलना में अधिक विश्वसनीय बनाता है। इसके अलावा, अधिकांश मामलों में इसे लागू करना सरल है और अन्य तरीकों की तुलना में बदलती वास्तविकता के अनुकूल होना आसान है। हां / नहीं निर्णय मध्यम और वरिष्ठ प्रबंधन के लिए अधिक आश्वस्त हैं। ज्यादातर मामलों में "STOP रिपोर्ट" डेटा आधारित लोगों की तुलना में छोटी और पढ़ने में आसान होती है। इसके अलावा, इस पद्धति को अपनाने से आपके नियोक्ता को डेटा वैज्ञानिकों और एसएएस लाइसेंस पर लागत में कटौती करने में सक्षम बनाता है। मैं कहूंगा कि STOP के साथ एकमात्र समस्या यह है कि PowerPoint प्रस्तुति को STOP परिणाम प्रस्तुत करना कठिन है, लेकिन यह एक गतिशील रूप से विकसित क्षेत्र है, इसलिए भविष्य में बेहतर विज़ुअलाइज़ेशन विधियों का प्रस्ताव किया जा सकता है।


6
एक बार जब निष्कर्ष के साथ PowerPoint स्लाइड को संक्षिप्त कर दिया गया है, तो इसे बदलने में बहुत देर हो चुकी है, इसलिए दो विकल्प हैं, विश्लेषण को निष्कर्ष पर फिट करें, या विश्लेषण करने में परेशान न करें।
मार्क एल। स्टोन

12
@ MarkL.Stone ज़रूर! मुझे व्यक्तिगत रूप से डेटा को देखने से पहले प्रस्तुति के लिए भूखंड बनाने का विचार पसंद है, यह विचार बेयसियन सोच में निहित है और मैं उन्हें एक प्राथमिक भूखंड कहता हूं :) मुझे लगता है कि यह दृष्टिकोण पहली बार यहां प्रिंट में दिखाई दिया: dilbert.com/strip/ 2008-05-08
टिम

15

पी-वैल्यू बहस के लिए यह ठीक है, दिलचस्प है, लेकिन यह भी कुछ हद तक बासी है, जो मुझे कुछ साल पहले ब्रिटिश मेडिकल जर्नल (बीएमजे) के क्रिसमस अंक में प्रकाशित एक अनोखे पेपर की याद दिलाता है , जो हर क्रिसमस वास्तविक अभी तक मजेदार शोध प्रकाशित करता है लेख। विशेष रूप से, आइजैक और फिट्जगेराल्ड के इस काम ने साक्ष्य आधारित चिकित्सा के सात प्रमुख विकल्पों पर प्रकाश डाला (अर्थात वास्तविक नैदानिक ​​और सांख्यिकीय प्रमाणों के आधार पर दवा का अभ्यास):

  • महानता आधारित चिकित्सा
  • वीमेन्स आधारित दवा
  • वाग्मिता आधारित चिकित्सा
  • प्रोविडेंस आधारित दवा
  • कठिनाई आधारित चिकित्सा
  • घबराहट आधारित दवा
  • आत्मविश्वास आधारित चिकित्सा

सबसे दिलचस्प बात यह है कि, आपको उपरोक्त मदों के लिए माप उपकरणों और माप की इकाइयों को उजागर करने वाले कॉलम को देखना होगा (उदाहरण के लिए, वैद्यता आधारित दवा के लिए ऑडियोमीटर और डेसीबल!)।


4
+1। पूरी तरह से सवाल की भावना में एक शानदार योगदान के लिए धन्यवाद। (१) सिर्फ स्पष्ट करने के लिए: क्या यह पी-वैल्यू डिबेट है जिसे आप "बासी" पाते हैं या सिर्फ यह सवाल? (२) क्या आपको पता होगा कि संदर्भ (६), "जे एक्सपोनेंशियल सैलरी" कहां मिलेगा? मुझे यकीन है कि अगर यह बेहतर तरीके से जाना जाता है तो इसके कई शौकीन पाठक होंगे।
व्हिबर

5
(1) आपका योगदान 'प्रमाणित ताजा' (rottentomato.com उद्धृत करने के लिए) है। इसके विपरीत, मैं पी मूल्यों की सीमाओं पर इस जोर को कुछ हद तक बासी पाता हूं। जनता के बीच मशीन लर्निंग, बड़े डेटा और खराब वैज्ञानिक साक्षरता के युग में, एएसए का रुख थोड़ा मसोचवादी हो सकता है। (२) मुझे लगता है कि आपको वह लेख उसी पत्रिका में मिलेगा जहाँ उन्होंने इस अन्य बीएमजे क्रिसमस के टुकड़े में अनुशंसित यादृच्छिक परीक्षण प्रकाशित किया था: bmj.com/content/327/7429/1459
22:22 पर जो_74

मैं हमेशा भूल जाता हूं, क्या यह कॉन्फिडेंस बेस्ड मेडिसिन है जो डायनिंग-क्रुजर-आधारित इंसट्रक्शन का उपयोग करता है?
एलेक्सिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.