एक परिकल्पना की अनुपस्थिति में पी मूल्यों की बहुतायत


28

मैं महामारी विज्ञान में हूँ। मैं एक सांख्यिकीविद् नहीं हूं, लेकिन मैं खुद विश्लेषण करने की कोशिश करता हूं, हालांकि मैं अक्सर कठिनाइयों का सामना करता हूं। मैंने अपना पहला विश्लेषण कुछ 2 साल पहले किया था। मेरे विश्लेषणों में पी वैल्यू को हर जगह शामिल किया गया था (मैंने बस वही किया जो अन्य शोधकर्ता कर रहे थे) वर्णनात्मक तालिकाओं से प्रतिगमन विश्लेषणों तक। छोटे से, मेरे अपार्टमेंट में काम करने वाले सांख्यिकीविदों ने मुझे उन सभी मूल्यों को छोड़ देने के लिए राजी कर लिया है, जहां मैं वास्तव में एक परिकल्पना है, को छोड़कर।

समस्या यह है कि चिकित्सा अनुसंधान प्रकाशनों में पी मान प्रचुर मात्रा में हैं। यह बहुत अधिक लाइनों पर p मान शामिल करने के लिए पारंपरिक है; साधनों, मध्यस्थों या जो भी आमतौर पर पी मानों के साथ जाते हैं (छात्रों के टी-टेस्ट, ची-स्क्वायर आदि)।

मैंने हाल ही में एक पत्रिका को एक पेपर प्रस्तुत किया है, और मैंने अपने "आधारभूत" वर्णनात्मक तालिका में पी मान जोड़ने के लिए (विनम्रता से) इनकार कर दिया। कागज को अंततः खारिज कर दिया गया था।

उदाहरण के लिए, नीचे दिया गया आंकड़ा देखें; यह आंतरिक चिकित्सा के सम्मानित जर्नल में नवीनतम प्रकाशित लेख से वर्णनात्मक तालिका है। यहाँ छवि विवरण दर्ज करें

सांख्यिकीविद ज्यादातर इन पांडुलिपियों की समीक्षा में शामिल होते हैं (यदि हमेशा नहीं)। इसलिए मेरे जैसे आम आदमी को कोई भी ऐसा मूल्य नहीं मिलने की उम्मीद है जहाँ कोई परिकल्पना न हो। लेकिन वे प्रचुर मात्रा में हैं, लेकिन इसका कारण मेरे लिए मायावी है। मुझे यह विश्वास करना कठिन है कि यह अज्ञानता है।

मुझे एहसास है कि यह एक सीमावर्ती सांख्यिकीय सवाल है। लेकिन मैं इस घटना के पीछे के तर्क की तलाश कर रहा हूं।


12
एक परिकल्पना के बिना एक पी-मूल्य स्वाभाविक रूप से त्रुटिपूर्ण है। जब आपके पास कोई परिकल्पना नहीं होती है, तब भी पी-वैल्यू का क्या मतलब है?
jameselmore

3
क्या आप शायद बिना किसी परिकल्पना के पी-मूल्यों का उपयोग करने वाले लोगों के कुछ उदाहरण दे सकते हैं? यह स्पष्ट नहीं है।
अमीबा का कहना है कि मोनिका

4
@amoeba "" समस्या यह है कि पी वैल्यू हर मेडिकल जर्नल में हर जगह हैं। प्रत्येक पंक्ति पर पी वैल्यू को शामिल करना पारंपरिक है, जहाँ साधन, मध्य या अनुपात वर्णित हैं। "" वे सरल फिशर सटीक परीक्षण या अंतर के लिए ची-स्क्वायर परीक्षण करते हैं, यह पूछते हैं कि क्या सारांश तालिका की किसी पंक्ति में महत्वपूर्ण अंतर है। । निहित परिकल्पना यह है कि प्रत्येक पंक्ति मायने रखती है।
कार्ल

2
मुझे संदेह है कि एक बड़ी ताकत यह है कि पी-वैल्यू किसी दिए गए दावे को अंतिम रूप देने की भ्रामक धारणा देते हैं। इन पत्रिकाओं के प्रकाशकों को इससे प्यार करना चाहिए क्योंकि इसका मतलब है कि उनके पास खुद की जानकारी है जो भविष्य के लिए मूल्यवान होगी। प्रतिकृति अध्ययनों का वित्तपोषण या प्रस्ताव नहीं करने की समवर्ती संस्कृति भी विवादास्पद परस्पर विरोधी परिणामों की उपस्थिति को कम करने में मदद करती है। मुझे आश्चर्य है कि अगर लोग अंततः खुद को "निरर्थक गतिविधि" (@ glen_b के कार्यकाल) के बारे में जानकारी महसूस करते हैं तो क्या होगा। यहां तक ​​कि अगर वहाँ उपयोगी सामग्री मिश्रित है ... heuristics आपको बचने के लिए बताते हैं।
लैविड

1
[at] jameselmore: मैं एक ही सवाल पूछ रहा हूं; इसका कोई मतलब नहीं है लेकिन इसे हर दिन लागू किया जाता है। [at] अमीबा: मैं बेतरतीब ढंग से उन पत्रिकाओं में से एक चुनता हूं, जो मैंने पढ़ीं, नवीनतम प्रकाशित लेख को हिट किया और यह पाया: onlinelibrary.wiley.com/doi/10.1111/joim.12230/full [at] कार्ल] बिल्कुल, धन्यवाद। @ मोमो: मैंने सवाल के सूत्रीकरण में सुधार के लिए अब एक प्रयास किया है। मुझे लगता है कि यह एक महत्वपूर्ण सवाल है और मैं आपके सुझाव की सराहना करता हूं। [at] Livid: इस टिप्पणी के लिए धन्यवाद। वास्तव में कई शोधकर्ताओं ने पी मूल्यों के पूरे बिंदु को गलत समझा हो सकता है।
एडम रॉबिंसन

जवाबों:


29

स्पष्ट रूप से मुझे आपको यह बताने की आवश्यकता नहीं है कि पी-मान क्या है, या उन पर अति-निर्भरता एक समस्या क्यों है; आप स्पष्ट रूप से उन चीजों को काफी पहले से ही अच्छी तरह से समझते हैं।

प्रकाशन के साथ, आपके पास दो प्रतिस्पर्धी दबाव हैं।

पहला - और जो आपको हर उचित अवसर पर धकेलना चाहिए - वह करना है जो समझ में आता है।

दूसरा, अंततः, वास्तव में प्रकाशित करने की आवश्यकता है। बहुत कम लाभ होता है अगर कोई भी भयानक अभ्यास में सुधार के आपके प्रयासों को नहीं देखता है।

इसलिए इसे पूरी तरह से टालने के बजाय:

  • इसे कम से कम इस तरह की व्यर्थ गतिविधि के रूप में करें जो आप दूर हो सकते हैं जो अभी भी इसे प्रकाशित करता है

  • हो सकता है कि इस हाल के प्रकृति विधियों लेख [1] का एक उल्लेख शामिल करें यदि आपको लगता है कि यह मदद करेगा, या शायद एक या एक से अधिक अन्य संदर्भों में बेहतर होगा। कम से कम यह स्थापित करने में मदद करनी चाहिए कि पी-मूल्यों की प्रधानता के लिए कुछ विरोध है।

  • अन्य पत्रिकाओं पर विचार करें, यदि कोई अन्य उपयुक्त होगा

क्या अन्य विषयों में भी ऐसा ही है?

पी-मूल्यों के अधिक उपयोग की समस्या कई विषयों में होती है (यह तब भी एक समस्या हो सकती है जब कुछ परिकल्पना होती है), लेकिन दूसरों की तुलना में कुछ में बहुत कम आम है। कुछ विषयों में पी-वैल्यू-इटिस के साथ समस्याएं होती हैं, और जो समस्याएं होती हैं, वे अंततः कुछ हद तक अतिरेक प्रतिक्रियाएं पैदा कर सकती हैं [2] (और कुछ हद तक, [1], और कम से कम कुछ स्थानों पर, कुछ अन्य। भी)।

α

उनमें से कुछ आत्मविश्वास के अंतराल पर ध्यान केंद्रित करने की वकालत करते हैं, कुछ अधिवक्ता प्रभाव के आकार को देखते हैं, कुछ अधिवक्ता बायेसियन विधियों, कुछ छोटे पी-मूल्यों, कुछ विशेष तरीकों से पी-मूल्यों का उपयोग करने से बचने पर। इसके बजाय क्या करना है, इस पर कई अलग-अलग विचार हैं, लेकिन उनके बीच पी-मूल्यों पर भरोसा करने के साथ समस्याओं पर बहुत अधिक सामग्री है, कम से कम जिस तरह से यह आमतौर पर किया जाता है।

आगे के कई संदर्भों के लिए उन संदर्भों को देखें। यह सिर्फ एक नमूना है - कई दर्जनों और संदर्भ मिल सकते हैं। कुछ लेखक कारण देते हैं कि वे क्यों सोचते हैं कि पी-मूल्य प्रचलित हैं।

इनमें से कुछ संदर्भ उपयोगी हो सकते हैं यदि आप एक संपादक के साथ बात करना चाहते हैं।

[१] हैल्से एलजी, कर्रान-एवरेट डी।, वॉवलर एसएल एंड ड्रमंड जीबी (२०१५),
"चंचल पी मूल्य इररेप्रोड्यूबल परिणाम उत्पन्न करता है,"
नेचर मेथड्स १२ ,, १ 179 179-१ do५ डोई: १०.१०३38 / एनएमथ ३2888
http: // www .nature.com / nmeth / पत्रिका / v12 / n3 / पेट / nmeth.3288.html

[२] डेविड ट्रैफिमो, डी। और मार्क्स, एम। (२०१५),
संपादकीय,
बेसिक और एप्लाइड सोशल साइकोलॉजी ,
http
: // : १-२ http://www.tandfonline.com/loi/hbas20 DOI: १०.१०7० / ०१ ९ 35३५३३.२५१.१११ ९९ १

[३] कोहेन, जे। (१ ९९ ०),
चीजें जो मैंने (अभी तक) सीखी हैं,
अमेरिकी मनोवैज्ञानिक , ४५ (१२), १३०४-१३१२।

[४] कोहेन, जे। (१ ९९ ४),
पृथ्वी गोल है (p <.05),
अमेरिकी मनोवैज्ञानिक , ४ ९ (१२), ९९ 12 -१००३।

[५] वैलेन ई। जॉनसन (२०१३),
सांख्यिकीय साक्ष्य PNAS , खंड के लिए संशोधित मानक । 110, नहीं। 48, 19313–19317 http://www.pnas.org/content/110/48/19313.full.pdf

[६] क्रूसके जेके (२०१०),
क्या विश्वास करें: डेटा विश्लेषण के लिए बायेसियन तरीके,
संज्ञानात्मक विज्ञान में रुझान १४ (,), २ ९३-३००

[[] आयोनिडिस, जे। (२००५)
क्यों सबसे प्रकाशित शोध निष्कर्ष गलत हैं,
पीएलओएस मेड। अगस्त; 2 (8): e124।
doi: 10.1371 / journal.pmed.0020124

[[] जेलमैन, ए। (२०१३), पी वैल्यूज़ एंड स्टैटिस्टिकल प्रैक्टिस,
एपिडेमियोलॉजी वॉल्यूम। 24 , नंबर 1, जनवरी, 69-72

[९] गेलमैन, ए। (२०१३),
"पी-वैल्यूज़ के साथ समस्या यह है कि उनका उपयोग कैसे किया जाता है",
(पॉल पी-मानों की रक्षा में, " पारिस्थितिकी के लिए पॉल मुर्टो द्वारा चर्चा ) अप्रकाशित
http: // citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.300.9053
http://www.stat.columbia.edu/~GLman/research/unpublished.murtaugh2.pdf

[१०] नाज़ो आर। (२०१४),
सांख्यिकीय त्रुटियां: पी वैल्यू, सांख्यिकीय वैधता के 'सोने के मानक', उतने विश्वसनीय नहीं हैं जितने वैज्ञानिक मान लेते हैं,
समाचार और टिप्पणी,
प्रकृति , वॉल्यूम। 506 (13), 150-152

[११] वागेनमेकर्स ई, (२०० 2007)
पी मूल्यों की व्यापक समस्याओं का एक व्यावहारिक समाधान,
साइकोनोमिक बुलेटिन एंड रिव्यू १४ (५), -80-80 ९ -4०४


7
+1। मैंने इस नेचर मेथड्स पेपर [1] को एक और सप्ताह पढ़ा और मुझे यकीन नहीं है कि मुझे यह बहुत पसंद है। वे अनिवार्य रूप से तर्क देते हैं कि कम-शक्ति परीक्षणों में पी-मान बहुत परिवर्तनशील हो सकते हैं (यूट्यूब पर "पी-मानों का नृत्य" भी देखें) - ऐसा कुछ जो निश्चित रूप से सच है और इस पर जोर देने की आवश्यकता है। वे निष्कर्ष निकालते हैं कि पी-मान "खराब" हैं (शीर्षक बहुत कठोर लगता है) और लोगों को आत्मविश्वास अंतराल का उपयोग करना चाहिए जो "अच्छा" है। लेकिन निश्चित रूप से आत्मविश्वास अंतराल भी कम शक्ति में बहुत परिवर्तनशील हैं! चित्र 6 की स्थिति (बाएं) मेरे लिए चित्रा 2 की तुलना में बहुत बेहतर नहीं लगती है
अमीबा कहती है कि मोनिका

2
@amoeba मैं यह नहीं कहूँगा कि मैं आपसे असहमत हूँ - वहाँ काफी कुछ है जिससे मैं असहमत हूँ; फिर भी वहाँ कुछ बिंदु हैं जो ओपी के लिए उपयोगी हो सकते हैं। वास्तव में, आपने मुझे एक बदलाव की याद दिलाई है जिसे बनाने का मेरा इरादा था लेकिन भूल गया।
Glen_b -राइनेट मोनिका

3
हां, मैं संभावित उपयोगिता से सहमत हूं, फिर भी - विशेष रूप से क्योंकि नेचर मेथड्स काफी सम्मानजनक हैं कि लोग शायद इसके "अधिकार" से आश्वस्त हो सकते हैं। मैं ओपी को वहां सब कुछ लेने के खिलाफ चेतावनी देना चाहता था (उनका गणित ठीक है, मैं यहां निष्कर्ष / व्याख्या के बारे में बात कर रहा हूं)
अमीबा का कहना है कि मोनिका

1
इस संदर्भ में भी दिलचस्प है विल्किंसन और सांख्यिकीय बल पर टास्क फोर्स, मनोविज्ञान पत्रिकाओं में सांख्यिकीय तरीके, अमेरिकी मनोवैज्ञानिक , वॉल्यूम। 54, नंबर 8, 594-604, 1999.

Glen_b, मैंने "Fickle P" पेपर में एक अजनबी के दावे के बारे में एक प्रश्न पोस्ट किया: आंकड़े ।stackexchange.com / questions / 250269 - आपकी अंतर्दृष्टि की बहुत सराहना करेंगे।
अमीबा का कहना है कि

10

पी-मूल्य, या अधिक आम तौर पर, नल-परिकल्पना महत्व परीक्षण (एनएचएसटी), धीरे-धीरे कम और कम मूल्य धारण कर रहा है। इतना कि पत्रिकाओं में प्रतिबंध लगना शुरू हो गया है।

अधिकांश लोग यह नहीं समझ पाते हैं कि पी-वैल्यू वास्तव में हमें क्या बताता है और यह हमें यह क्यों बताता है, भले ही यह हर जगह उपयोग किया जाता है।

समस्या यह है कि पी-मूल्य हमें बताता हैP(Data|H0)P(H0|Data)

H0H0


1
मैं जोड़ूंगा कि P (H0 | डेटा) केवल सार्थक है यदि H0 सार्थक है। अध्ययन के लिए मौका से परे परिणाम (पूर्वाग्रह, ड्रॉपआउट, बेसलाइन मतभेद) के लिए अन्य निर्बाध स्पष्टीकरणों को नियमबद्ध करने के लिए डिजाइन और रिपोर्ट करने की आवश्यकता है। इसके अलावा, यहां तक ​​कि पर्याप्त प्रभाव आकार के साथ एक सही अंधा आरसीटी केवल आपको बताता है कि कुछ दिलचस्प मापा गया था। यदि आप वास्तव में जिस चीज़ से चिंतित हैं, उसका मापन करने पर यह पता चलता है कि पी-वैल्यू जुनून के साथ अक्सर पाया जाने वाला एक और मुद्दा है।
लैविश

8

क्या अन्य विषयों में भी ऐसा ही है? पी मूल्यों के साथ जुनून का कारण क्या है?

ग्रीनवल्ड एट अल। (1996) मनोविज्ञान से संबंधित इस प्रश्न से निपटने का प्रयास। जैसा कि एनएचएसटी को आधारभूत अंतरों पर लागू करने के लिए, संभवतः संपादकों (सही या गलत तरीके से) यह तय करेंगे कि "गैर-महत्वपूर्ण" आधारभूत अंतर परिणामों की व्याख्या नहीं कर सकते, जबकि "महत्वपूर्ण" परिणाम बता सकते हैं। यह ग्रीनवाल्ड एट अल द्वारा पेश किए गए "कारण 1" के समान है। :

क्यों NHT लोकप्रिय रहता है?

"एनएचटी की आलोचना क्यों नहीं होती है? एक बेहतर जवाब के अभाव में, यह एनएचटी के व्यवहार वैज्ञानिकों की चरित्र की कमी को जारी रखने के लिए प्रलोभन दे रहा है। व्यवहारिक वैज्ञानिकों की अनिच्छा से संभवतः शून्य परिकल्पना अस्वीकृति प्राप्त करने की दोषी खुशी का त्याग करना पड़ सकता है। एक प्री-डिनर कॉकटेल की आदत को छोड़ने के लिए पीने वाले की अनिच्छा की तरह हो ... "

कारण I: HT एक Dichotomous आउटकम प्रदान करता है

"कन्वेंशन के व्यापक रूप से गोद लेने के कारण p <.05" सांख्यिकीय रूप से महत्वपूर्ण है, "NHT का उपयोग एक शून्य परिकल्पना के बारे में एक प्रश्न के लिए एक द्विगुणित उत्तर (अस्वीकार या अस्वीकार नहीं) करने के लिए किया जा सकता है। इसे अक्सर माना जा सकता है। सैद्धांतिक प्रश्नों के लिए एक उपयोगी उत्तर के रूप में, जो एक पैरामीटर के अपेक्षित मूल्य के संदर्भ में भविष्यवाणी की दिशा के संदर्भ में कहा गया है ...

कारण 2: पी मूल्य एक आम कॉमन लैंग्वेज ट्रांसलेशन फॉर टेस्ट स्टैटिस्टिक्स के रूप में

"ऐसी किसी भी चीज़ के विपरीत जिसे टी, एफ, या आर मानों (उनके संबंधित डीएफ के साथ) से सीधे माना जा सकता है, एपी मूल्य के आश्चर्य के उपाय को केवल अपने दशमलव बिंदु के दाईं ओर लगातार शून्य की संख्या द्वारा कब्जा कर लिया जाता है ..."

कारण 3: p मान विश्वास की एक माप प्रदान करता है "अशक्त परिकल्पना के अस्वीकृति में

"[यू] एक प्रभाव आकार (या एक आत्मविश्वास अंतराल) को पसंद करता है, एनएचटी से उत्पन्न एपी मूल्य एक गैर-अशक्त खोज की पुनरावृत्ति के अनुमान से संबंधित है। इस कथन में, प्रतिसादिता (जो नीचे से अधिक औपचारिक रूप से परिभाषित है) का इरादा है। केवल अस्वीकार-अप्राप्य निष्कर्ष को दोहराने के अपने एनएचटी अर्थ में और बिंदु या बीच के अंतर के बीच निकटता के अपने आकलन की भावना में नहीं। "

प्रभाव आकार और पी मान: क्या रिपोर्ट किया जाना चाहिए और क्या दोहराया जाना चाहिए? एंथोनी जी GREENWALD, रिचर्ड गोन्ज़लेज़, रिचर्ड जे। हैरिस, और डोनाल्ड GUTHRIE। साइकोफिज़ियोलॉजी, 33 (1996)। 175-183। कैम्ब्रिज यूनिवर्सिटी प्रेस। यूएसए में छपा। साइकोफिजियोलॉजिकल रिसर्च के लिए कॉपीराइट ओ 1996 सोसायटी


इन महत्वपूर्ण टिप्पणियों के लिए धन्यवाद, जिन्हें मैं अगली बार समीक्षकों के साथ बहस करने के लिए निश्चित रूप से उपयोग करूंगा।
एडम रॉबिंसन

6

पी-वैल्यू दो समूहों के परिणामों के दो समूहों ("उपचार" बनाम "नियंत्रण", "ए" बनाम "बी", आदि) के बीच अंतर के बारे में जानकारी देते हैं। अंतर की प्रकृति को परिकल्पना के कथन में औपचारिक रूप दिया गया है - उदाहरण के लिए "A का अर्थ B से अधिक है"। कम पी-मान बताते हैं कि अंतर यादृच्छिक भिन्नता के कारण नहीं हैं, जबकि उच्च पी-मूल्यों का सुझाव है कि दो नमूनों में अंतर उन मतभेदों से अलग नहीं किया जा सकता है जो बस यादृच्छिक भिन्नता से उत्पन्न हो सकते हैं। पी-वैल्यू के लिए "कम" या "उच्च" ऐतिहासिक रूप से कठोर तर्क या साक्ष्य के विश्लेषण द्वारा स्थापित होने के बजाय सम्मेलन और स्वाद का मामला रहा है।

पी-मानों का उपयोग करने के लिए एक शर्त यह है कि परिणामों के दो समूह वास्तव में तुलनीय हैं, अर्थात् उनके बीच अंतर का एकमात्र स्रोत आपके द्वारा मूल्यांकन किए जा रहे चर से संबंधित है। एक अतिरंजित उदाहरण के रूप में, कल्पना करें कि आपके पास दो बीमारियों पर दो समय अवधि में आंकड़े हैं - ए: ब्रिटिश जेलों में पुरुषों के बीच हैजा से मृत्यु दर 1920-1930, और नाइजीरिया में मलेरिया द्वारा संक्रमण 1960-1970। डेटा के इन दो सेटों से एक पी-मूल्य की गणना करना बेतुका होगा। अब, यदि A: ब्रिटिश जेलों में उन पुरुषों के बीच हैजेरा से मृत्यु दर का इलाज किया जाता है जो B बनाम इलाज नहीं करते हैं: ब्रिटिश जेलों में पुरुषों के बीच हैजा से होने वाली मृत्यु का पुन: हाइड्रेशन के साथ इलाज किया जाता है, तो आपके पास एक ठोस सांख्यिकीय परिकल्पना का आधार है।

ज्यादातर यह सावधानीपूर्वक प्रयोग डिजाइन, या सावधान सर्वेक्षण डिजाइन, या ऐतिहासिक डेटा के सावधान संग्रह, आदि के माध्यम से पूरा किया जाता है। इसके अलावा, नमूना परिणामों से जुड़े बयानों में दो परिणामों के बीच अंतर को औपचारिक रूप दिया जाना चाहिए - अक्सर नमूना साधन, लेकिन यह भी हो सकता है नमूना संस्करण, या अन्य नमूना आँकड़े हो। स्टोचैस्टिक प्रभुत्व का उपयोग करते हुए, दो नमूना वितरण की तुलना करते हुए हाइपोथेसिस स्टेटमेंट बनाना भी संभव है। ये दुर्लभ हैं।

अनुसंधान के लिए "वास्तव में महत्वपूर्ण क्या है" पर पी-मान केंद्रों पर विवाद? यह वह जगह है जहां प्रभाव आकार आते हैं। मूल रूप से, प्रभाव आकार दो समूहों के बीच अंतर का परिमाण है। उच्च सांख्यिकीय महत्व (कम पी-मान -> यादृच्छिक भिन्नता के कारण नहीं) लेकिन कम प्रभाव आकार (परिमाण में बहुत कम अंतर) होना संभव है। जब प्रभाव आकार बहुत बड़ा होता है, तो कुछ उच्च पी-मानों की अनुमति देना ठीक हो सकता है।

अधिकांश अनुशासन अब प्रभाव के आकार की रिपोर्टिंग, और पी-मूल्यों की भूमिका को कम करने या कम करने की दिशा में बहुत दृढ़ता से आगे बढ़ रहे हैं। वे नमूना वितरण के बारे में अधिक वर्णनात्मक आंकड़ों को भी प्रोत्साहित करते हैं। बायेसियन स्टैटिस्टिक्स सहित कुछ दृष्टिकोण, पी-वैल्यू के साथ सभी को दूर करते हैं।


मेरा उत्तर घनीभूत और सरलीकृत है। इस विषय पर कई लेख हैं जिनमें आप अधिक विवरण, औचित्य और विशिष्टताओं के लिए परामर्श कर सकते हैं, इनमें शामिल हैं:


@MerMeritology इन महत्वपूर्ण संदर्भों को प्रदान करने के लिए धन्यवाद। मैं उन्हें ASAP पढ़ूंगा!
एडम रॉबिंसन

6

"तो मेरे जैसे आम आदमी को कोई भी पी वैल्यू नहीं मिलने की उम्मीद है, जहाँ कोई परिकल्पना नहीं है।"

स्पष्ट रूप से, ओपी का कहना है कि विशिष्ट तालिका में वह प्रस्तुत करता है, कोई भी परिकल्पना नहीं है जो रिपोर्ट किए गए पी-मूल्यों के साथ है। बस इस छोटे से भ्रम को दूर करने के लिए, निश्चित रूप से अशक्त परिकल्पनाएं हैं, लेकिन वे बल्कि ... अप्रत्यक्ष रूप से उल्लेख किया गया है (अंतरिक्ष की अर्थव्यवस्था के लिए, मुझे लगता है)।

"पी-वैल्यू" एक सशर्त संभावना है, "राइट-टेल" टेस्ट के लिए कहें,

p-valP(Tt(S)H0)=1FT|H0(t(S)H0)

TFT|H0(tH0)TH0t(S)TTH0TH0H0

यदि कोई शून्य परिकल्पना नहीं है , तो एक पी-मूल्य की गणना भी नहीं की जा सकती है , और जब भी हम एक पी-मूल्य की सूचना देते हैं, तो कहीं एक शून्य परिकल्पना लर्क होती है।

प्रश्न में प्रस्तुत तालिका में हम पढ़ते हैं

"WHR टर्टिल्स में अंतर के लिए सभी परीक्षण ..."

अशक्त-परिकल्पना इस वाक्यांश में "छिपी" है: यह "WHR tertiles के बीच कोई अंतर नहीं है", (जो भी "W (R tertile" है) अपने गणितीय रूप में व्यक्त किया गया है जो यहां दो परिमाणों के अंतर के बराबर प्रतीत होता है शून्य।


मैं मानता हूं कि इन विश्लेषणों के पीछे परिकल्पनाएं हो सकती हैं। हालांकि, जो लोग शोध पत्र (जैसे STROBE स्टेटमेंट) के लिए दिशानिर्देशों का विस्तार करते हैं, उन्हें पी मानों की बहुतायत को स्वीकार करना चाहिए। मुझे लगता है कि एपी मूल्य को एक पेपर की मुख्य परिकल्पना के लिए आरक्षित किया जाना चाहिए (जो शायद ही कभी एक से अधिक है)। लेकिन फिर भी, मैं यह नहीं कह सकता कि मैं आपसे असहमत हूं) =
एडम रॉबिंसन

1
@AdamRobinsson हम्म ... मुझे इतना यकीन नहीं है। इस तरह के "आरक्षित" दृष्टिकोण से, (पी) मूल्य परीक्षण के निष्कर्ष पर पहुंचने के लिए वास्तव में जो महत्व है, वह और भी अधिक बढ़ जाएगा। मेरे लिए, यह सिर्फ एक और परिणाम है जिसे कई अन्य पहलुओं, परिणामों, आउट-ऑफ-सैंपल जानकारी, तर्क, आदि के साथ जोड़ा जाना है। दूसरी तरफ, यदि पी-मान सभी जगह बिखरे हुए हैं, तो यह यह महसूस करना आसान है कि वे निष्कर्ष तक पहुंचने के लिए निश्चित मानदंड नहीं हैं।
एलेकोस पापाडोपोलोस

एलेकोस I ने तालिका में कुछ अलग पढ़ा, जो डब्ल्यूआरटी के बजाय डब्ल्यूएचआर (यानी कमर-कूल्हे के अनुपात) के बर्तनों को संदर्भित करता है, जबकि तृतीयक मान हैं जो एक वितरण को 3 भागों में एक ही अर्थ में विभाजित करते हैं जो चतुर्थक मान हैं जो 4 भागों में विभाजित होते हैं और डिकाइल दस भागों में होते हैं।
Glen_b -Reinstate मोनिका

@Glen_b धन्यवाद, जो मेरे हिस्से से सिर्फ एक टाइपो था। ठीक कर दिया।
एलेकोस पापाडोपोलोस

2
उदाहरण के लिए, यहां देखें । लेकिन शायद यहां नहीं ।
Glen_b -Reinstate मोनिका

2

मैं उत्सुक हो गया और उस पेपर को पढ़ा जो ओपी ने एक उदाहरण के रूप में दिया था: पेट के मोटापे से हिप फ्रैक्चर का खतरा बढ़ जाता है । मैं एक चिकित्सा शोधकर्ता नहीं हूं और आम तौर पर दवा के कागजात नहीं पढ़ता हूं।

p

pp

ppp

p

ऐसा लगता है जैसे प्रश्न विशेष रूप से इस तरह के वर्णनात्मक तालिकाओं का उल्लेख कर रहा है। यदि हां, तो यह कुछ अजीब (लेकिन ज्यादातर हानिरहित?) चिकित्सा पत्रिकाओं में प्रथा के कारण जीवित है।


pn=43000


@ यामोइबा प्रथम ने रैंडो में एक लेख का चयन किया; यह उस पत्रिका में महामारी विज्ञान में नवीनतम प्रकाशित लेख था। मुझे यकीन है कि अगर मैंने कुछ और खोजा होता तो मैं कई और व्यर्थ पी मूल्यों के साथ एक लेख प्रदान कर सकता था। जैसा कि आपने देखा है, एक पी-मूल्य है, लेकिन आपके और दूसरे के ऊपर और नीचे दिए गए उत्तर, ऐसा प्रतीत होता है कि अनुसंधान समुदाय इसे संबोधित कर रहा है।
एडम रॉबिंसन

@ अदम, मुझे आपका प्रश्न (+1) और ग्लेन_ब का उत्तर (+1) पसंद है, लेकिन यदि यह "बेतरतीब ढंग से चयनित" पेपर प्रतिनिधि है, तो सबसे अधिक अंक जो ग्लेन_ बी ने बनाए हैं और अधिकांश कागजात जो उन्होंने लिंक किए हैं, वे लागू नहीं होते हैं या संदर्भित नहीं होते हैं चिकित्सा अनुसंधान की स्थिति जिसके बारे में आप पूछ रहे थे। यदि यह प्रतिनिधि नहीं है, तो निश्चित रूप से मैं न्याय नहीं कर सकता।
अमीबा का कहना है कि मोनिका

मुझे वास्तव में आपके उत्तरों से कई बार अपार मदद मिली है। मैंने इस समस्या के बारे में अपनी समझ के आधार पर निर्णय लिया। मेरा मानना ​​है कि प्रदान किए गए सभी उत्तर उपयोगी हैं और वे सामूहिक रूप से प्रश्न का उत्तर देते हैं।
एडम रॉबिंसन

1

सांख्यिकीय सहकर्मी-समीक्षा का स्तर उतना अधिक नहीं है जितना कोई मेरे अनुभव से सोचेगा। मेरे द्वारा काम किए गए सभी लागू कागजात के लिए, सभी सांख्यिकीय टिप्पणियां लागू फ़ील्ड में विशेषज्ञों से आईं, न कि सांख्यिकीविदों से। "शीर्ष" पत्रिकाओं के लिए, हालांकि अधिक से अधिक जांच की जाती है, लेकिन गंभीर दोष वाले परिणामों को देखना असामान्य नहीं है। मुझे लगता है कि यह आंशिक रूप से है क्योंकि आंकड़ों का क्षेत्र कठिन हो सकता है (जैसा कि इसके कई महान दिमागों के बीच असहमति से देखा जा सकता है)।

दूसरे, एक क्षेत्र के पाठक चीजों को एक निश्चित तरीके से देखने की उम्मीद करते हैं। हाल ही के एक अनुभव में, मैंने एक मॉडल से संभावनाएँ बताईं, लेकिन इसे शूट किया गया क्योंकि मेरे सहयोगी ने सही अनुमान लगाया कि यह उनके पाठकों को कच्चे डेटा के एक बारप्लेट के साथ अधिक आरामदायक लगेगा। संक्षेप में, कई पाठकों ने बेसलाइन विशेषताओं की एक तालिका के साथ पी-मूल्यों को देखने की उम्मीद की है।

आपके प्रत्यक्ष प्रश्न से असंबंधित, लेकिन शायद प्रासंगिक: अक्सर पाठ या संभावना तरीकों का उपयोग करके पी-मान लगभग हर पाठ में उपयोग किया जाता है। लेखकों ने अक्सर जबरदस्त योगदान दिया है और आंकड़ों के बारे में गहराई से सोचा है। यद्यपि प्रयोगवादियों द्वारा दुर्व्यवहार किया जाता है, निश्चित रूप से उनके पास सांख्यिकी में एक स्थान है।


इस टिप्पणी के लिए धन्यवाद। मैं आपके कथन को और आगे ले जा सकता था; मुझे लगता है कि प्रकाशित निष्कर्षों के एक अविश्वसनीय बड़े अनुपात में विभिन्न कारणों से सांख्यिकीय खामियां हैं। मेरे पर्यवेक्षक अक्सर कहते हैं "समीक्षा प्रक्रिया एक सज्जन के शब्द पर आधारित है" काफी हास्यास्पद मुझे लगता है।
एडम रॉबिंसन

1

मुझे अक्सर चिकित्सा लेख पढ़ना पड़ता है और मुझे लगता है कि केंद्रीय संतुलित क्षेत्र में रहने के बजाय पेंडुलम एक चरम से दूसरे तक झूलता हुआ प्रतीत होता है।

निम्नलिखित दृष्टिकोण अच्छी तरह से काम करने लगता है। यदि P मान छोटा है, तो मनाया गया अंतर अकेले संयोग से होने की संभावना नहीं है। इसलिए, हमें अंतर के परिमाण को देखना चाहिए और यह तय करना चाहिए कि क्या यह किसी व्यावहारिक महत्व का है। बहुत छोटे P मान बड़े नमूना आकारों के साथ होते हैं, यहां तक ​​कि बहुत छोटे अंतर भी होते हैं जो कि कोई व्यावहारिक प्रासंगिकता नहीं हो सकती है।

बेसलाइन डेटा की तालिका में पी मान शामिल नहीं करना नुकसानदेह हो सकता है। इसलिए यदि एक अध्ययन में दो समूह हैं जिनकी औसत आयु 54 और 59 वर्ष है, तो मैं जानना चाहता हूं कि क्या यह अंतर अकेले संयोग से हो सकता है। यदि पी छोटा है, तो मुझे लगता है कि 2 समूहों में यह 5 साल का अंतर अध्ययन के परिणामों को प्रभावित कर सकता है या नहीं। यदि P छोटा नहीं है, तो मुझे इस प्रश्न का समाधान करने की आवश्यकता नहीं है।

समस्या तब होती है जब कोई केवल P मान पर निर्भर करता है और अंतर की परिमाण की जाँच नहीं करता है (उदाहरण के लिए, साधारण प्रतिशत परिवर्तन)। कुछ को लगता है कि P मान को पूरी तरह से छोड़ दिया जाना चाहिए ताकि केवल अंतर बना रहे और दिखाई दे। एक संतुलित समाधान यह होगा कि इन दोनों का मूल्यांकन करने पर जोर दिया जाए और न केवल पी मूल्य को फेंक दिया जाए, जिसका एक सीमित लेकिन 'महत्वपूर्ण' अर्थ है। प्रभाव का आकार भी P मान के साथ निकटता से संबंध रखने की संभावना है (बस आत्मविश्वास अंतराल की तरह) और यह सांख्यिकीय परिदृश्य से P मानों को पूरी तरह से विस्थापित करने की संभावना नहीं है। जैसा कि निम्नलिखित लेख में उल्लेख किया गया है, अशक्त परिकल्पना परीक्षण के कई गुण हैं जिसके कारण यह लोकप्रिय बना हुआ है:

एंथोनी जी GREENWALD, रिचर्ड गोन्ज़लेज़, रिचर्ड जे। हैरिस, और डोनाल्ड GUTHRIE प्रभाव आकार और पी मान: क्या रिपोर्ट की जानी चाहिए और क्या दोहराया जाना चाहिए? साइकोफिज़ियोलॉजी, 33 (1996)। 175-183।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.