क्या परिणामों को "लगभग" या "कुछ" महत्वपूर्ण के रूप में संदर्भित करना गलत है?


13

एक समान प्रश्न पर आम सहमति, क्या परिणामों को "अत्यधिक महत्वपूर्ण" के रूप में संदर्भित करना गलत है? यह कि "अत्यधिक महत्वपूर्ण" एक मान्य है, हालांकि गैर-विशिष्ट, एक संघ की ताकत का वर्णन करने का तरीका जो आपके पूर्व-निर्धारित महत्व सीमा से काफी कम पी-मूल्य है। हालांकि, पी-मूल्यों का वर्णन करने के बारे में क्या है जो आपकी दहलीज से थोड़ा ऊपर हैं ? मैंने देखा है कि कुछ कागजात "कुछ हद तक महत्वपूर्ण", "लगभग महत्वपूर्ण", "निकटता महत्व", और इसी तरह की शर्तों का उपयोग करते हैं। मुझे लगता है कि ये शब्द थोड़ा इच्छा-वासना के हैं, कुछ मामलों में एक नकारात्मक परिणाम के साथ एक अध्ययन से बाहर सार्थक परिणाम खींचने के लिए एक शानदार तरीका। क्या ये शब्द ऐसे परिणामों का वर्णन करने के लिए स्वीकार्य हैं, जो आपके पी-वैल्यू कटऑफ को "मिस करते हैं"?


3
मुझे विश्वास नहीं है कि किसी ने भी "एसोसिएशन की ताकत" का वर्णन करने के लिए "महत्व" का सुझाव दिया है; उत्तरार्द्ध प्रभाव के आकार के माप की तरह लगता है। वैसे भी, एक फुलर सूची के लिए यहां देखें ।
Scortchi - को पुनः स्थापित मोनिका

1
@ स्कोर्टची - मेरी समझ से, एक बहुत छोटा पी-मूल्य अत्यधिक महत्वपूर्ण है, जिसका अर्थ है कि प्रश्न और लक्ष्य में परिवर्तनशील के बीच एक मजबूत संबंध। यह एक बड़े प्रभाव आकार, बहुत सारे डेटा या दोनों का परिणाम है। बड़े पी-वैल्यू के लिए, चर और लक्ष्य के बीच सहयोग का प्रमाण कमजोर है। इसके अलावा, अपने लिंक में उस सूची को प्यार करें।
परमाणु वैंग

9
एक छोटे प्रभाव के आकार के लिए बहुत छोटा पी-मान प्राप्त करना शायद ही एक "मजबूत संघ" कहा जा सकता है। यह केवल एक डिटेक्टिव एसोसिएशन होगा।
whuber

2
मैंने देखा है कि लोग इन वाक्यांशों का उद्योग में बहुत उपयोग कर रहे हैं, अकादमिक पत्रों में नहीं।
अक्कल

1
शायद आपकी बेचैनी यह मानने से आती है कि पी-मान (या किसी नमूने से प्राप्त अन्य संख्या) किसी चीज के तेज उपाय हैं।
एरिक टावर्स

जवाबों:


14

यदि आप "महत्व" को डिग्री के स्वीकार करने की अनुमति देना चाहते हैं तो उचित ("कुछ हद तक महत्वपूर्ण", "काफी महत्वपूर्ण"), लेकिन उन वाक्यांशों से बचें जो सुझाव देते हैं कि आप अभी भी एक सीमा के विचार के लिए तैयार हैं, जैसे "लगभग महत्वपूर्ण" , "महत्व के निकट", या "महत्व के शिखर पर" ( ब्लॉग संभावित त्रुटि पर "अभी भी महत्वपूर्ण नहीं" से मेरा पसंदीदा ), अगर आप हताश नहीं दिखना चाहते हैं।


9
(+1) लिंक के लिए। लेकिन मुझे लगता है कि काव्यात्मक रचनात्मकता का मुख्य आकर्षण "महत्व के कगार पर टीटरिंग (पी = 0.06)" है
एलेकोस पापाडोपोलोस

1
@AlecosPapadopoulos: आप सही हैं, हालांकि "महत्व के पारंपरिक स्तरों के साथ छेड़खानी" और "सांख्यिकीय महत्व के करीब मँडरा" माननीय उल्लेख के लायक हैं। "अर्ध-महत्वपूर्ण" शायद एक अलग श्रेणी में विजेता है।
Scortchi - को पुनः स्थापित मोनिका

4
वास्तव में पहली दो सच्ची सिनेमैटोग्राफिक आत्माएं हैं, पहली फिल्म "सांख्यिकीय जिगोलो" (जो एक पारंपरिक स्तर के साथ फ़्लर्ट करेगा ?), जबकि दूसरी फिल्म "डाइंग ऑन द टेल" से, जहां हम मासिक धर्म का अपमान देखते हैं? (पी-मूल्य) मरने वाले नायक (सांख्यिकीय महत्व) पर मँडराते हुए।
एलेकोस पापाडोपोलोस सिप

1
व्यक्तिगत रूप से, मैं अपने वाक्यांश में 'महत्वपूर्ण' शब्द को छोड़ दूंगा और p = 0.06 को 'काफी रोचक' कहूंगा। सही, या गलत तरीके से, जब मैंने पहली बार सिक्स सिग्मा कोर्स के भीतर पी-वैल्यू का सामना किया, तो प्रशिक्षक ने सुझाव दिया कि 0.05 <= 0.1 के लिए सही लेबल 'अधिक डेटा आवश्यक' था (औद्योगिक सेटिंग के आधार पर जहां अतिरिक्त डेटा अंक हासिल करना मुश्किल है। , इसलिए किसी भी 'बिग डेटा' परिदृश्य के लिए पूरी तरह से अलग
रॉबर्ट डी ग्रेफ

6

मेरे नजरिए से, यह मुद्दा उबलता है कि वास्तव में इसका क्या मतलब है कि एक महत्वपूर्ण परीक्षण किया जाए। महत्वपूर्ण परीक्षण या तो शून्य परिकल्पना को अस्वीकार करने या इसे अस्वीकार करने में विफल रहने के निर्णय के साधन के रूप में तैयार किया गया था। फिशर ने स्वयं उस (मनमाना) निर्णय लेने के लिए कुख्यात 0.05 नियम पेश किया।

मूल रूप से, महत्व परीक्षण का तर्क यह है कि उपयोगकर्ता को डेटा एकत्र करने से पहले अशक्त परिकल्पना (पारंपरिक रूप से 0.05) को अस्वीकार करने के लिए एक अल्फा स्तर निर्दिष्ट करना होगा । महत्व परीक्षण पूरा करने के बाद, उपयोगकर्ता शून्य को अस्वीकार कर देता है यदि पी मान अल्फा स्तर से छोटा है (या अन्यथा इसे अस्वीकार करने में विफल रहता है)।

इस कारण से कि आप अत्यधिक महत्वपूर्ण होने के लिए एक प्रभाव की घोषणा नहीं कर सकते हैं (जैसे, 0.001 स्तर पर) क्योंकि आप इसे खोजने के लिए निर्धारित किए गए तुलना में अधिक मजबूत प्रमाण नहीं पा सकते हैं। इसलिए, यदि आप परीक्षण से पहले अपने अल्फा स्तर को 0.05 पर सेट करते हैं, तो आप केवल 0.05 स्तर पर सबूत पा सकते हैं, भले ही आपका पी मान कितना छोटा हो। उसी तरह, उन प्रभावों की बात करना जो "कुछ हद तक महत्वपूर्ण हैं" या "महत्व के करीब" भी बहुत मायने नहीं रखते हैं क्योंकि आपने 0.05 की इस मनमानी कसौटी को चुना है। यदि आप महत्व परीक्षण के तर्क की शाब्दिक व्याख्या करते हैं, तो 0.05 से बड़ा कुछ भी महत्वपूर्ण नहीं है।

मैं मानता हूँ कि "महत्व के करीब" जैसे शब्दों का उपयोग अक्सर प्रकाशन की संभावनाओं को बढ़ाने के लिए किया जाता है। हालांकि, मुझे नहीं लगता कि लेखकों को इसके लिए दोषी ठहराया जा सकता है क्योंकि कुछ विज्ञानों में वर्तमान प्रकाशन संस्कृति अभी भी 0.05 की "पवित्र कब्र" पर बहुत निर्भर करती है।

इनमें से कुछ मुद्दों पर चर्चा की जाती है:

गिगेरेंज़र, जी। (2004)। नासमझ आँकड़े। जर्नल ऑफ सोशियो-इकोनॉमिक्स, 33 (5), 587-606।

रॉयल, आर। (1997)। सांख्यिकीय साक्ष्य: एक संभावना प्रतिमान (खंड 71)। CRC प्रेस।


1
यदि आप फिशर के महत्व के परीक्षण में अल्फा-स्तर जोड़ते हैं, तो आप नेयमैन / पियर्सन के दृष्टिकोण के साथ विज्ञान के फिशरियन दर्शन को मिला रहे हैं।
RBirkelbach

5

यह फिसलन ढलान शून्य-परिकल्पना महत्व परीक्षण (NHST) के लिए फिशर बनाम नेमन / पियर्सन ढांचे को वापस बुलाता है। एक ओर, व्यक्ति केवल इस बात की मात्रात्मक मूल्यांकन करना चाहता है कि अशक्त परिकल्पना (उदाहरण के लिए, प्रभाव आकार) के तहत परिणाम की संभावना कितनी कम है। दूसरी ओर, दिन के अंत में आप एक असतत निर्णय चाहते हैं कि क्या आपके परिणाम अकेले हैं या नहीं, संभावना है कि अकेले मौके के कारण। हमने जो समाप्त किया है वह एक प्रकार का संकर दृष्टिकोण है जो बहुत संतोषजनक नहीं है।

अधिकांश विषयों में, महत्व के लिए पारंपरिक पी 0.05 पर सेट है, लेकिन ऐसा क्यों होना चाहिए, इसके लिए वास्तव में कोई आधार नहीं है। जब मैं एक पेपर की समीक्षा करता हूं, तो मुझे 0.06 महत्वपूर्ण, या यहां तक ​​कि 0.07 को कॉल करने वाले लेखक के साथ कोई समस्या नहीं है, बशर्ते कि कार्यप्रणाली ध्वनि है, और संपूर्ण चित्र, जिसमें सभी विश्लेषण, आंकड़े आदि शामिल हैं, एक सुसंगत और विश्वसनीय कहानी बताते हैं। जहां आप समस्याओं में भाग लेते हैं, जब लेखक छोटे प्रभाव आकारों के साथ एक कहानी को तुच्छ डेटा से बाहर करने का प्रयास करते हैं। इसके विपरीत, मैं पूरी तरह से 'विश्वास' नहीं कर सकता कि एक परीक्षण व्यावहारिक रूप से भी सार्थक है जब यह पारंपरिक पी <0.05 महत्व तक पहुंच जाता है। मेरे एक सहकर्मी ने एक बार कहा था: "आपके आंकड़े बस वही होना चाहिए जो आपके आंकड़ों में पहले से स्पष्ट है।"

उस सबने कहा, मुझे लगता है कि वासिलिव सही है। टूटी हुई प्रकाशन प्रणाली को देखते हुए, आपको बहुत अधिक p मानों को शामिल करना होगा, और इसलिए आपको बहुत अधिक गंभीरता से लिए जाने वाले 'महत्वपूर्ण' शब्द का उपयोग करना होगा, भले ही इसके लिए "मामूली" (जो मुझे पसंद हो) जैसे विशेषणों की आवश्यकता हो। आप इसे हमेशा सहकर्मी की समीक्षा में लड़ सकते हैं, लेकिन आपको पहले वहां पहुंचना होगा।


5

आमतौर पर दो पी-वैल्यू के बीच का अंतर महत्वपूर्ण नहीं है। तो, इससे कोई फर्क नहीं पड़ता कि आपका पी-मान 0.05, 0.049, 0.051 है ...

संघ की ताकत के माप के रूप में पी-मूल्यों के संबंध में: एक पी-मूल्य सीधे एसोसिएशन की ताकत का एक उपाय नहीं है। एक पी-मूल्य आपके द्वारा देखे गए डेटा के रूप में चरम या अधिक चरम डेटा के रूप में खोजने की संभावना है, यह देखते हुए कि पैरामीटर 0 है (यदि किसी की अशक्त परिकल्पना में रुचि है - निक कॉक्स की टिप्पणी देखें)। हालांकि, यह अक्सर वह मात्रा नहीं होती है जिस पर शोधकर्ता की दिलचस्पी होती है। कई शोधकर्ता ऐसे सवालों के जवाब देने में रुचि रखते हैं जैसे "कुछ चुने हुए कट-ऑफ वैल्यू से अधिक होने की पैरामीटर की संभावना क्या है?" यदि यह वह है जिसमें आप रुचि रखते हैं, तो आपको अपने मॉडल में अतिरिक्त पूर्व सूचना शामिल करने की आवश्यकता है।


6
मैं इस भावना से सहमत हूं, लेकिन हमेशा की तरह छोटे प्रिंट को पूरी सतर्कता की जरूरत है। "दिया गया पैरामीटर 0 माना जाता है": अक्सर, लेकिन हमेशा नहीं। पी-मानों की गणना अन्य परिकल्पनाओं के लिए भी की जा सकती है। इसके अलावा, "ग्रहण" के लिए "परिकल्पित" पढ़ें।
निक कॉक्स

आप पूरी तरह से सही हैं - मैं अपना उत्तर संपादित करूँगा!
RBirkelbach

3

p<αp>α(प्रभाव की ताकत नहीं, बिल्कुल)। ऐसे "महाद्वीपवादी" के लिए, "लगभग महत्वपूर्ण" एक उदारवादी पी-मूल्य के साथ परिणाम का वर्णन करने का एक समझदार तरीका है। समस्या तब पैदा होती है जब लोग इन दो दर्शनों को मिलाते हैं - या इससे भी बदतर, यह नहीं जानते कि दोनों मौजूद हैं। (वैसे - लोग अक्सर इन नक्शों को नेमन / पीयरसन और फिशर पर साफ-साफ मान लेते हैं, लेकिन उन्हें इसकी जरूरत होती है। इसलिए मेरे लिए उनके लिए यह स्वीकार्यता है। इस विषय पर इस ब्लॉग पोस्ट में इसके बारे में और विस्तार से: https://scientistseessquirrel.wordpress.com/2015/11/16/is-nearly-significant-ridiculous/


1

मुझे लगता है कि कुछ कहना लगभग सांख्यिकीय रूप से महत्वपूर्ण है एक तकनीकी दृष्टिकोण से सही नहीं है। एक बार जब आप अपनी सहनशीलता का स्तर निर्धारित कर लेते हैं तो महत्व का सांख्यिकीय परीक्षण निर्धारित हो जाता है। आपको सैंपलिंग डिस्ट्रीब्यूशन के विचार पर वापस जाना होगा। यदि आपकी सहिष्णुता का स्तर 0.05 है और आप 0.053 का पी-मान प्राप्त करने के लिए होते हैं तो यह केवल संयोग से है कि इस्तेमाल किया गया नमूना उस आंकड़े को प्राप्त करता है। आप बहुत अच्छी तरह से एक और नमूना प्राप्त कर सकते हैं जो समान परिणाम प्राप्त नहीं कर सकता है- मेरा मानना ​​है कि होने की संभावना सहिष्णुता स्तर सेट पर आधारित है न कि नमूना आंकड़े पर। याद रखें कि आप जनसंख्या पैरामीटर के खिलाफ नमूनों का परीक्षण कर रहे हैं और नमूनों का अपना नमूना वितरण है। इसलिए मेरी राय में, या तो कुछ सांख्यिकीय रूप से महत्वपूर्ण है या यह नहीं है।


0

[0,1]H0p>α

H1

उदाहरण के लिए देखें विकिपीडिया


मैं आपको काफी फॉलो नहीं करता। हां, किसी भी निरंतर वितरण में, ठीक 0.051 के परिणाम प्राप्त करने की संभावना 1 के परिणाम के बराबर होने की संभावना के बराबर है - यह शून्य है। लेकिन परिकल्पना परीक्षण एक मान को कम से कम चरम पर देखने की संभावना की जांच करता है जितना कि मनाया गया। आपको हमेशा पी-मान कम से कम 1 के रूप में चरम मिलेगा, लेकिन यह बहुत कम संभावना है कि पी-मान को 0.051 के रूप में चरम पर देखें। क्या वह अंतर "अर्थहीन" बनाता है?
परमाणु वैंग

अशक्त के तहत अंतराल [०.०५,०.०५१] में एक पी-मान का निरीक्षण करने की संभावना है क्योंकि यह अंतराल [०.९९९ १] में एक पी-मूल्य का निरीक्षण करना है। थ्रेसहोल्ड के करीब एक पी-वैल्यू का अवलोकन करना 0 के खिलाफ अधिक सबूत नहीं है क्योंकि अस्वीकृति क्षेत्र के बाहर किसी भी अन्य पी-मूल्य का अवलोकन करना।
स्नट

कुछ कॉल एपी मान 0.05 महत्वपूर्ण हैं, अन्य का उपयोग 0.01 या 0.1 एक सीमा के रूप में करते हैं। तो, 3 शोधकर्ताओं के बीच जो समान विश्लेषण करते हैं और 0.03 का पी-मूल्य पाते हैं, दो इसे महत्वपूर्ण कह सकते हैं और एक नहीं हो सकता है। यदि वे सभी 0.91 का पी-मान पाते हैं, तो कोई भी इसे महत्वपूर्ण नहीं कहेगा। थ्रेशोल्ड के करीब एक पी-वैल्यू का अर्थ है कि अधिक व्यक्ति शून्य को अस्वीकार करने के लिए पर्याप्त सबूत होने के लिए वहां जाएंगे। मैं यह नहीं देखता कि पी 1 = 0.051 और पी = 1 को एच 1 के लिए समर्थन के मामले में अप्रभेद्य क्यों होना चाहिए - कुछ लोग पी 1 = 0.051 के साथ एच 1 का समर्थन करेंगे; पी = 1 के साथ कोई भी ऐसा नहीं करेगा।
न्यूक्लियर वैंग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.