पी <0.001, पी <0.0001 या यहां तक ​​कि कम पी-मूल्यों का उपयोग कर अध्ययन के उदाहरण?


11

मैं सामाजिक विज्ञान से आता हूं, जहां पी <0.05 बहुत अधिक आदर्श है, पी <0.1 और पी <0.01 के साथ भी दिखा रहा है, लेकिन मैं सोच रहा था: अध्ययन के कौन से क्षेत्र, यदि कोई हो, तो सामान्य रूप में कम पी-मान का उपयोग करें मानक?

जवाबों:


9

मेरी राय है कि यह अध्ययन के क्षेत्र पर निर्भर नहीं करता (और करना चाहिए)। उदाहरण के लिए, यदि आप से कम महत्व के स्तर पर काम कर सकते हैं, उदाहरण के लिए, आप ऐतिहासिक या अच्छी तरह से स्थापित परिणामों के साथ एक अध्ययन को दोहराने की कोशिश कर रहे हैं (मैं स्ट्रोप प्रभाव पर कई अध्ययनों के बारे में सोच सकता हूं , जिसके कारण यह हुआ था पिछले कुछ वर्षों में कुछ विवादों के लिए)। परिकल्पना के परीक्षण के लिए शास्त्रीय नेमन-पियर्सन ढांचे के भीतर एक कम "दहलीज" पर विचार करने की मात्रा है। हालांकि, सांख्यिकीय और व्यावहारिक (या मूल) महत्व एक और मामला है।पी<0.001

सिडेनोट । लगता है कि "स्टार सिस्टम" 70 के दशक की शुरुआत में वैज्ञानिक पूछताछ पर हावी था, लेकिन जे। कोहेन ( अमेरिकी मनोवैज्ञानिक , 1994, 49 (12), 997-1003) द्वारा द अर्थ इज़ राउंड (पी <.05 ) देखें, इस तथ्य के बावजूद कि जो हम अक्सर जानना चाहते हैं वह मुझे दिया गया डेटा दिया जाता है, सच होने की संभावना क्या है ? वैसे भी, " क्यों पी = 0.05? " पर एक अच्छी चर्चा है , जेरी दलेल द्वारा।एच0


कृपया मेरे विचारों की ट्रेन को ठीक करें: कुछ क्षेत्रों पर ध्यान केंद्रित किया जा सकता है, कहते हैं, जैव रासायनिक जोखिम, और इसलिए मैं किसी भी प्रकार की त्रुटि को रोकने के लिए p <0.001 का उपयोग करना चाहता हूं जिससे स्वास्थ्य को खतरा हो सकता है। इसके अलावा, इस के साथ लेख से Am साइक , मैं भी में एक महान अध्ययन याद Sociol के एम जे या SOC विज्ञान पत्रिकाओं में से एक है कि मैं का पालन करें। मेरा पसंदीदा, निश्चित रूप से, ज़ीलियाक और मैक्लोस्की है
Fr.

1
यहाँ आप जो वर्णन करते हैं वह पीछे की ओर लगता है। मैं टाइप II त्रुटियों के बारे में चिंतित हूं, यह कहते हुए कि जैव रासायनिक जोखिम के साथ कुछ नहीं है। उस स्थिति में मैं अल्फा को उच्चतर निर्धारित कर सकता हूं, कमतर नहीं।
जॉन

मैं इस धारणा के तहत काम कर रहा था कि परीक्षण फॉर्म का होगा: "आइए आकलन करें कि क्या गर्भावस्था एचआरटी से संबंधित है" (उस स्थिति में, टाइप II त्रुटि एक टाइप II त्रुटि से अधिक गंभीर है, लेकिन शायद यह डिजाइन गैर-मानक है)।
Fr.

7

किसी के लिए 0.01 से कम, पूर्व-निर्दिष्ट अल्फा स्तर का उपयोग करना दुर्लभ हो सकता है, लेकिन यह लगभग उतना दुर्लभ नहीं है कि लोग गलत धारणा में 0.01 से कम के निहित अल्फ़ा का दावा करते हैं कि एक मनाया पी से कम का मान 0.01 0.01 से कम के नेमन-पीयरसन अल्फा के समान है।

फिशर के पी मान, नेमैन-पीयरसन त्रुटि दर के समान या विनिमेय नहीं हैं। अर्थ α = 0.0023 नहीं है जब तक कि किसी ने प्रयोग के लिए महत्वपूर्ण स्तर के रूप में 0.0023 का उपयोग करने का निर्णय नहीं लिया है जब प्रयोग को डिज़ाइन किया गया हो। यदि आपने P = 0.05 को महत्वपूर्ण मान लिया है तो P = 0.0023 का अर्थ है कि झूठे सकारात्मक दावे की 0.05 संभावना है।पी=0.0023α=0.00230.0023पी=0.05पी=0.00230.05

हबर्ड एट अल पर एक नजर है । शास्त्रीय सांख्यिकीय परीक्षण में एविडेंस (पी) के बनाम त्रुटियों (α) के उपायों पर भ्रम। द अमेरिकन स्टेटिस्टिशियन (2003) वॉल्यूम। 57 (3)


मैं भेद को समझता हूं, हालांकि मैं शायद गलती कर रहा हूं। लेकिन मेरा सवाल यह है कि क्या कोई पारंपरिक उपयोग है, उदाहरण के लिए, पी <.0001 का कहीं बाहर है? या, इसे उत्तेजक तरीके से रखने के लिए, क्या पी <.05 पंथ सार्वभौमिक है?
Fr.

पी <0.05 का 'पंथ' लगभग सार्वभौमिक हो सकता है, लेकिन इस बिंदु पर किसी भी दावे के बारे में आश्वस्त होना संभव नहीं है क्योंकि स्पष्ट अपवाद फिशर और नेमन-पीयरसन विधियों के अनजाने संकरण के परिणामस्वरूप होने की काफी संभावना है। बुनियादी औषधीय अनुसंधान पत्रों में नेमन-पीयरसन त्रुटि दर के उपयोग के बारे में लगभग एक स्पष्ट कथन नहीं है।
माइकल ल्यू

उदाहरण के लिए धन्यवाद। मैं औषधीय अनुसंधान से बहुत कम (बहुत सारे वैज्ञानिक कारणों से) प्रभावित नहीं हूं ...
Fr.

1
आपको उस क्षेत्र की विशिष्ट आलोचना के रूप में बुनियादी औषधीय अनुसंधान के बारे में मेरी टिप्पणी नहीं लेनी चाहिए, यह सिर्फ मेरा अपना विशेष अनुशासन है और इस प्रकार वह जिसके साथ मैं सबसे अधिक अनुभवी हूं। मुझे विश्वास है कि आप मूल अनुसंधान में कई क्षेत्रों को हाइब्रिड पी मूल्यों और त्रुटि दर के संबंध में समान कमियों के साथ पाएंगे।
माइकल लुई

कोई चिंता नहीं, मैं आसानी से कल्पना कर सकता हूं कि यह कमी जांच के क्षेत्रों में अच्छी तरह से यात्रा करती है।
Fr.

3

मैं इस साहित्य से बहुत परिचित नहीं हूं लेकिन मेरा मानना ​​है कि कुछ भौतिक विज्ञानी सांख्यिकीय परीक्षणों में बहुत कम सीमा का उपयोग करते हैं लेकिन वे इसके बारे में थोड़ा अलग तरीके से बात करते हैं। उदाहरण के लिए, यदि एक माप सैद्धांतिक भविष्यवाणी से तीन मानक विचलन है, तो इसे "तीन सिग्मा" विचलन के रूप में वर्णित किया गया है। मूल रूप से, इसका मतलब यह है कि ब्याज का पैरामीटर α = .01 के साथ एज़ टेस्ट में अनुमानित मूल्य से सांख्यिकीय रूप से अलग है। दो सिग्मा लगभग α = .05 के बराबर है (वास्तव में यह 1.96 rough होगा)। अगर मैं गलत नहीं हूं, तो भौतिकी में मानक त्रुटि स्तर 5 सिग्मा है, जो α = 5 * 10 ^ -7 होगा

इसके अलावा, तंत्रिका विज्ञान या महामारी विज्ञान में, कई तुलनाओं के लिए कुछ सुधार करना सामान्य रूप से सामान्य लगता है। इसलिए प्रत्येक व्यक्तिगत परीक्षण के लिए त्रुटि स्तर p <.01 से कम हो सकता है


1
α=5×10-8

1

जैसा कि गॉल लॉरन्स ने सांख्यिकीय विश्लेषणों के ऊपर उल्लेख किया है जो कई तुलनात्मक समस्या में चलते हैं वे अधिक रूढ़िवादी थ्रेसहोल्ड का उपयोग करते हैं। हालांकि, संक्षेप में वे 0.05 का उपयोग कर रहे हैं, लेकिन परीक्षणों की संख्या से गुणा किया जाता है। यह स्पष्ट है कि यह प्रक्रिया (बोनफेरोनी सुधार) जल्दी से अविश्वसनीय रूप से छोटे पी-मूल्यों को जन्म दे सकती है। इसीलिए अतीत में लोग (न्यूरोसाइंस में) p <0.001 पर रुक गए। आजकल कई तुलनात्मक सुधारों के अन्य तरीकों का उपयोग किया जाता है (मार्कोव यादृच्छिक क्षेत्र सिद्धांत देखें)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.