क्या परिणामों को "अत्यधिक महत्वपूर्ण" के रूप में संदर्भित करना गलत है?


18

क्यों सांख्यिकीविदों हमें हतोत्साहित करते हैं "परिणाम की चर्चा करते हुए से अत्यधिक जब महत्वपूर्ण" -value अच्छी तरह से पारंपरिक नीचे है α का स्तर 0.05 ?pα0.05

क्या किसी परिणाम पर भरोसा करना वास्तव में गलत है जिसके पास एक प्रकार I त्रुटि ( ) नहीं होने का 99.9% मौका है जो केवल 99% ( p = 0.01 ) पर आपको वह मौका देता है ?p=0.001p=0.01


16
यहाँ @ gung के उत्तर को पढ़ना सार्थक हो सकता है । शीघ्रता से: निर्णय के लिए "महत्वपूर्ण बनाम नहीं-महत्वपूर्ण" या "शून्य परिकल्पना को अस्वीकार करें बनाम शून्य परिकल्पना को अस्वीकार न करें" यह केवल मायने रखता है कि क्या अंतराल आपके α से नीचे है जो आप अध्ययन से पहले निर्धारित करते हैं (नेमैन और पीयरसन) । दूसरी ओर, आप n-परिकल्पना के खिलाफ सबूत के एक निरंतर माप के रूप में p -value को मान सकते हैं जिसमें कोई "कटऑफ" (फिशर) नहीं है। pαp
COOLSerdash

10
आप पी-मानों के बारे में एक गंभीर गलत धारणा रखते हैं (पी-वैल्यूज़ एरर प्रॉब्लम नहीं हैं ), अगर सही किया गया, तो आपको यह समझने में मदद मिल सकती है कि आप सांख्यिकीविदों से कुछ बातें क्यों सुन सकते हैं।
लड़का

10
मैं स्वीकार करता हूं कि मैं कभी-कभी "अत्यधिक महत्वपूर्ण" जैसे वाक्यांशों का उपयोग करता हूं। रिपोर्ट में कहीं और कई प्रारंभिक परिणामों को कई परीक्षणों के लिए समायोजित करना पड़ सकता है, जिसमें "अत्यधिक महत्वपूर्ण" अधिक तकनीकी अर्थ प्राप्त करता है "कई तुलनाओं के लिए उपयुक्त समायोजन के बाद भी महत्वपूर्ण बना रहता है।" यहां तक ​​कि जब सभी पाठक उचित का उपयोग करने के लिए सहमत होते हैं (जो कि कई हितधारकों द्वारा उपयोग किए गए विश्लेषणों के लिए दुर्लभ है), तो "महत्वपूर्ण" क्या है या नहीं परिकल्पना के सेट पर निर्भर करता है कि प्रत्येक पाठक को रिपोर्ट देखने से पहले ध्यान में रखना चाहिए। α
whuber

7
सभी सांख्यिकीविदों का कहना है कि यह गलत है। मैं स्वयं (आमतौर पर दुर्लभ) अवसर पर इस शब्द का उपयोग करता हूं - उदाहरण के लिए, इस आंकड़े पर कि इस अशक्त को मेरे द्वारा उपयोग किए जा रहे लोगों की तुलना में काफी कम महत्व के स्तरों पर काम करने वाले लोगों द्वारा अस्वीकार कर दिया गया होगा, लेकिन यह महत्वपूर्ण है कि इसका अधिक अर्थ संलग्न न करें की तुलना में यह है। मैं बस इतना ही कहूंगा कि किसी को सावधानी बरतनी चाहिए - कभी-कभी इसके बारे में - जब इस तरह के वाक्यांश की व्याख्या की जाती है, बजाय इसके कि यह विशेष रूप से गलत है । अंक में से कुछ यहां प्रासंगिक होगा।
Glen_b -Reinstate मोनिका

7
(ctd) ... तुलना करके, मुझे लगता है कि एक बड़ी चिंता लोगों की परिकल्पना परीक्षणों का उपयोग करना है जो केवल उनके हित के सवाल का जवाब नहीं देते हैं (जो मुझे लगता है कि मामला बहुत बार होता है)। बेहतर तरीके से उस चकाचौंध और महत्वपूर्ण मुद्दे पर ध्यान केंद्रित करने के बजाय, एक छोटे से पी-वैल्यू को व्यक्त करने के तरीके में एक मामूली उल्लंघन के बारे में अत्यधिक हठधर्मी होना।
Glen_b -Reinstate मोनिका

जवाबों:


17

मुझे लगता है कि यह कहने में बहुत गलत नहीं है कि परिणाम "अत्यधिक महत्वपूर्ण" हैं (भले ही हां, यह थोड़ा टेढ़ा है)।

इसका अर्थ है कि यदि आपने बहुत छोटा महत्व स्तर निर्धारित किया है , तो आप अभी भी परिणामों को महत्वपूर्ण मानेंगे। या, समकक्ष, यदि आपके कुछ पाठकों के मन में बहुत छोटा α है, तो वे अभी भी आपके परिणामों को महत्वपूर्ण मान सकते हैं।αα

ध्यान दें कि महत्व स्तर की नजर में है, जबकि पी -वेल्यू (कुछ कैविट्स के साथ) डेटा की एक संपत्ति है।αp

अवलोकन सिर्फ पी = 0.04 के अवलोकन के समान नहीं है , भले ही दोनों को आपके क्षेत्र के मानक सम्मेलनों द्वारा "महत्वपूर्ण" कहा जा सकता है ( α = 0.05 )। टिनी पी -value साधन अशक्त के खिलाफ मजबूत सबूत (जो परिकल्पना परीक्षण के फिशर ढांचे की तरह उन लोगों के लिए); इसका मतलब है कि प्रभाव आकार के आसपास विश्वास अंतराल एक बड़ा मार्जिन (जो उन लोगों के लिए सीआईएस पसंद करते हैं के लिए के साथ शून्य मान को बाहर निकाल देगा पी -values); इसका मतलब है कि अशक्त की पूर्ववर्ती संभावना कुछ छोटी होगी (कुछ पूर्व के साथ बायेसियन के लिए); यह सभी समतुल्य है और बस इसका मतलब है कि निष्कर्ष अधिक ठोस हैंp=1010p=0.04α=0.05pp। देखें छोटे पी मूल्यों अधिक समझाने हैं? अधिक चर्चा के लिए।

"अत्यधिक महत्वपूर्ण" शब्द सटीक नहीं है और होने की आवश्यकता नहीं है। यह एक व्यक्तिपरक विशेषज्ञ निर्णय है, जो आश्चर्यजनक रूप से बड़े प्रभाव के आकार का अवलोकन करने और इसे "विशाल" (या शायद बस "बहुत बड़ा)" कहने के समान है। आपके डेटा के गुणात्मक, व्यक्तिपरक विवरण का उपयोग करने के साथ कुछ भी गलत नहीं है, यहां तक ​​कि वैज्ञानिक लेखन में भी; बेशक, उद्देश्य मात्रात्मक विश्लेषण के रूप में अच्छी तरह से प्रस्तुत किया है।


उपरोक्त कुछ उत्कृष्ट टिप्पणियाँ, +1 से @whuber, @Glen_b, और @COOLSerdash भी देखें।


2
माना। -value एक मात्रात्मक संकेतक है; इसलिए इस तरह से बात करते हैं, हालांकि कुछ संदर्भ के बाहर अभेद्य है, वास्तव में अमान्य नहीं है, "बिल लंबा है" और "फ्रेड वास्तव में लंबा है" कहने का कोई भी तरीका अंग्रेजी का अमान्य उपयोग है। हमें संख्याओं और उनके संदर्भ इत्यादि को भी देखना चाहिए। इनमें से कोई भी उन लोगों को नहीं रोकता है जिन्हें पी < 0.05 पर तेज निर्णय लेने की आवश्यकता है या जो कुछ भी वे चाहते हैं ठीक उसी तरह कर रहे हैं, लेकिन उनकी प्राथमिकताएं शासन नहीं करती हैं इस। PP<0.05
निक कॉक्स

यह बिल्कुल भी टेढ़ा नहीं है। यह औपचारिक परिभाषा के रूप में अच्छी तरह से प्रलेखित है।
उल्लू

3

यह एक सामान्य प्रश्न है।

इसी तरह का प्रश्न "क्यों पी <= 0.05 महत्वपूर्ण माना जाता है?" ( http://www.jerrydallal.com/LHSP/p05.htm )

@ माइकल-मेयर ने उत्तर का एक हिस्सा दिया: महत्व उत्तर का केवल एक हिस्सा है। पर्याप्त डेटा के साथ, आमतौर पर कुछ मापदंडों को "महत्वपूर्ण" (बोन्फेरोनी सुधार देखें) के रूप में दिखाया जाएगा। एकाधिक परीक्षण आनुवांशिकी में एक विशिष्ट समस्या है जहां महत्व की तलाश में बड़े अध्ययन आम हैं और पी-मान <10 -8 अक्सर आवश्यक होते हैं ( http://www.ncbi.nlm.nih.gov/pmc/articles/PMC26212312 )।

इसके अलावा, कई विश्लेषणों के साथ एक मुद्दा यह है कि वे अवसरवादी थे और पूर्व-नियोजित नहीं थे (अर्थात "यदि आप डेटा को पर्याप्त यातना देते हैं, तो प्रकृति हमेशा कबूल करेगी।" - रोनाल्ड कोसे)

आम तौर पर, यदि एक विश्लेषण पूर्व नियोजित (सांख्यिकीय शक्ति के लिए दोहराया-विश्लेषण सुधार के साथ), तो इसे महत्वपूर्ण माना जा सकता है। अक्सर, कई व्यक्तियों या समूहों द्वारा बार-बार परीक्षण यह पुष्टि करने का सबसे अच्छा तरीका है कि कुछ काम करता है (या नहीं)। और परिणामों की पुनरावृत्ति सबसे अधिक बार महत्व के लिए सही परीक्षा है।


2

एक परीक्षण एक काले-सफेद निर्णय के लिए एक उपकरण है, अर्थात यह 'हां, क्या कोई सच्चा उपचार प्रभाव है?' अक्सर, विशेष रूप से यदि डेटा सेट बड़ा है, तो ऐसा प्रश्न संसाधनों की काफी बर्बादी है। बाइनरी प्रश्न क्यों पूछ रहा है कि क्या 'कितना बड़ा ट्रीटमेंट इफेक्ट है' जैसे मात्रात्मक सवाल का जवाब मिलना संभव है? यह भी स्पष्ट रूप से उत्तर हां / नहीं सवाल है? इसलिए उच्च निश्चितता के साथ एक बिना किसी हाँ / नहीं के प्रश्न का उत्तर देने के बजाय, हम अक्सर विश्वास अंतराल के उपयोग की सलाह देते हैं जिसमें अधिक जानकारी होती है।


2
+1 हालाँकि आप अधिक स्पष्ट हो सकते हैं कि यह ओपी के प्रश्न का उत्तर कैसे देता है (यह इतना स्पष्ट नहीं है)।

@ मैथ्यू: मैं पूरी तरह से सहमत हूं।
माइकल एम।

माइकल को धन्यवाद देता है। लेकिन मुझे लगता है कि विश्वास अंतराल (जो "निरंतर पैमाने" उत्तर देता है) प्रभाव के आकार को संदर्भित करेगा, है ना? फिर भी, एक द्विआधारी उत्तर की आवश्यकता नहीं है और साथ ही निरंतर उत्तर को पूरक करने के लिए, अर्थात यह प्रभाव या नहीं (जिसका आकार सीआईएस द्वारा वर्णित है) सहमत α-level से मिलता है? या हो सकता है कि आप पी-वैल्यू के लिए भी सीआई दे सकते हैं?
z8080

(ए) "प्रभाव आकार" आमतौर पर उपचार प्रभाव के एक मानकीकृत संस्करण की बात कर रहा है और इस प्रकार प्रभाव की तुलना में व्याख्या करना आसान है। (बी) पी मानों के लिए CI कभी-कभी सिमुलेशन अनिश्चितता व्यक्त करने के लिए नकली पी मूल्यों के लिए जोड़ा जाता है। (सी) यदि आपका स्तर 0.05 है, तो लगभग हर परीक्षण की स्थिति में, परीक्षण से काले / सफेद निर्णय को इसी 95% ci को देखकर लिया जा सकता है।
माइकल एम।

(प्रतियोगिता।) आपका प्रश्न किसी भी तरह निम्नलिखित से संबंधित है: क्या यह बताना अधिक उपयोगी है कि 99.9999% ci भी अशक्त है या सही प्रभाव के लिए 95% ci की निचली सीमा भी बहुत आशाजनक है?
माइकल एम।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.