क्या p = 5.0% महत्वपूर्ण है?


14

आज मुझसे पूछा गया कि क्या 0.05 (बिल्कुल) का p- मान महत्वपूर्ण माना जाता है (अल्फा = 5%) या नहीं। मुझे उत्तर नहीं पता था और Google ने दोनों उत्तर दिए: (a) परिणाम महत्वपूर्ण है यदि p 5% से कम है और (b) यदि p 5% से कम है या 5% के बराबर है।

बेशक, इनमें से किसी भी वेबसाइट ने किसी का हवाला नहीं दिया। एक क्यों होना चाहिए - यह सामान्य ज्ञान है और 5% वैसे भी, मनमाना है। लेकिन इससे मुझे अपने छात्रों को कुछ याद रखने में मदद नहीं मिलेगी।

इसलिए, यहाँ परिकल्पना के परीक्षण पर मेरे हताश प्रश्न हैं: यदि पी-मूल्य बिल्कुल अल्फा है - क्या मैं परिणाम को महत्वपूर्ण मानता हूं या नहीं? और इस मामले में आधिकारिक प्रशस्ति पत्र क्या है?

आपका बहुत बहुत धन्यवाद

जवाबों:


19

कुछ व्यावहारिक मुद्दों को छोड़कर (जैसे कि किस हद तक α मनमाना है, उदाहरण के लिए), महत्व स्तर और पी-मूल्य की परिभाषाएं इस प्रश्न का उत्तर अस्पष्ट बनाती हैं।

जो कहना है, औपचारिक रूप से, अस्वीकृति नियम यह है कि जब आप पी = α को अस्वीकार करते हैंp=α

यह वास्तव में केवल असतत मामले के लिए मायने रखना चाहिए, लेकिन उस स्थिति में, जब आप को अस्वीकार नहीं करते हैं , तो आपका प्रकार I त्रुटि दर वास्तव में α नहीं होगा !p=αα

(जहाँ तक मेरा सवाल है 'कोई आधिकारिक' प्रशस्ति पत्र नहीं है; आपको वास्तव में नेयमैन-पियरसन और फ़िशरियन दोनों को परिकल्पना परीक्षण के लिए दृष्टिकोण की आवश्यकता है, और यह कुछ ऐसा है जो समय के साथ विकसित हुआ है।)

किसी भी संख्या में अच्छे आँकड़े ग्रंथ हैं जो परिकल्पना परीक्षण का सही वर्णन करते हैं।

पी-मान की परिभाषा प्रासंगिक विकिपीडिया लेख * के पहले वाक्य में सही ढंग से दी गई है :

पी-मान कम से कम एक परीक्षण सांख्यिकीय प्राप्त करने की संभावना है जितना कि वास्तव में मनाया गया था, यह मानते हुए कि शून्य परिकल्पना सच है।

* (और नहीं, विकिपीडिया एक अधिकार नहीं है, मैं सिर्फ यह कह रहा हूं कि परिभाषा सही है)

सादगी के लिए, चलो बिंदु नल के साथ छड़ी करते हैं; यह अतिरिक्त मुद्दों के साथ पानी को मैला किए बिना बिंदु को प्राप्त करने का कार्य करता है।

अब महत्व स्तर, चयनित प्रकार I त्रुटि दर है। यह वह दर है जिसे आप सत्य होने पर शून्य परिकल्पना को अस्वीकार करने के लिए चुनते हैं। यही है, यह उस समय का अनुपात है जब आपको अशक्त को अस्वीकार करना चाहिए। केवल समय एक - अब एक असतत वितरण के साथ एक परीक्षण आंकड़ा पर विचार पी के बिल्कुल ααp α वास्तव में संभव ** है। (यह भी आमतौर पर यही होगा कि वास्तविक अल्फा 5% की तरह कुछ अच्छा और गोल से अलग होगा।)

** अच्छी तरह से मुझे लगता है कि मैं अपनी चर्चा केवल विशुद्ध रूप से असतत- या विशुद्ध रूप से निरंतर-वितरित परीक्षण-आँकड़ों तक सीमित कर रहा हूँ। मिश्रित मामले में, आप यह पता लगा सकते हैं कि मेरी असतत चर्चा कैसे लागू होती है (स्थितियों में यह लागू होने पर)।

उदाहरण के लिए , साथ दो-पूंछ वाले साइन टेस्ट पर विचार करें , कहते हैं। 5% के लिए निकटतम प्राप्त करने का महत्व स्तर 4.904% है। तो चलो α = 4.904 % चुनेंn=17α=4.904%137500217 )।

इसलिए जब सही है, अगर हम p = α को अस्वीकार करते हैं तो अस्वीकृति दर क्या हैH0p=αα

H0p=αα

यही है, हमारे परीक्षण (काफी स्पष्ट रूप से!) वांछित गुण हैं अगर p=α

[अब अपनी स्थिति पर विचार करते हैं। क्या आपका पी-मूल्य वास्तव में 5% है? मुझे यकीन है कि यह बिल्कुल अलग कारणों से नहीं है। लेकिन किसी भी मामले में, आप औपचारिक रूप से यह बता सकते हैं कि,पी=α

यदि आप अपने अस्वीकृति नियम का वर्णन करते हैं और यह दिखाते हैं कि (यदि मान्यताएँ संतुष्ट हैं), इसका वांछित महत्व स्तर है, तो शायद संदर्भों की कोई आवश्यकता नहीं है।

एक अस्वीकृति नियम केवल एक बयान है जिसके बारे में परीक्षण सांख्यिकीय के मूल्य आपको को अस्वीकार करने का कारण बनेंगेएच0 । यह अस्वीकृति क्षेत्र को परिभाषित करने के बराबर है (जिसके लिए कैसला और बर्जर, सांख्यिकीय अनुमान , p346, जो कि सादे शब्दों में अस्वीकृति क्षेत्र को परिभाषित करता है )।

एक ही किताब pik-values ​​(p364) को अलग-अलग शब्दों में विकिपीडिया (लेकिन समान परिणामी अर्थ) को परिभाषित करती है - अर्थात यह इसे (दिए गए डेटा सेट के लिए) के रूप में परिभाषित करता है, सबसे छोटा α

(यदि आपके पास एक भिन्न संस्करण है, तो पृष्ठ संख्याएं बदल सकती हैं, लेकिन इसमें एक सूचकांक है, इसलिए आप शब्दों को देख सकते हैं; ध्यान रखें, आपको 'हाइपोथीसिस परीक्षण' के तहत लिस्टिंग को देखने की आवश्यकता हो सकती है या खोजने के लिए सूचकांक में कुछ समान है। 'अस्वीकृति क्षेत्र')

हम्म, चलो शेल्फ से एक और किताब की कोशिश करो। Wackerly, Mendenhall & Scheaffer गणितीय सांख्यिकी अनुप्रयोगों के साथ, 5 वां संस्करण , p412 पर अस्वीकृति क्षेत्र और p431 पर एक p- मान (C & B के समान) को परिभाषित करता है।


धन्यवाद। कृपया मुझे "आंकड़ों के व्यावहारिक उपयोगकर्ता" के बेवकूफ सवाल की अनुमति दें: विकिपीडिया के अलावा मुझे यह परिभाषा और / या अस्वीकृति नियम कहां मिलेगा, आप देखें? मैंने कुछ सांख्यिकीय पुस्तकों की जांच की, लेकिन मार्ग नहीं मिला। शायद गलत शब्दों की खोज ...
BurninLeo

जवाब के लिए अपडेट देखें
Glen_b -Reinstate Monica

तुम महान हो! यकीन है, आप जानते थे कि, लेकिन कभी-कभी यह वैसे भी राज्य के लायक है। आपका बहुत बहुत धन्यवाद!
BurninLeo

1
(+1) वास्तव में अच्छा जवाब।
chl

2

एक प्रोफेसर से मैंने अपने शुरुआती बायोस्टैटिस्टिक्स वर्ग में एक दिलचस्प स्वीकारोक्ति सीखी है कि 0.05 महत्व स्तर स्वर्ण सत्य के बजाय एक आम सहमति के माध्यम से अधिक आया है। तब से, मैंने साहित्य को देखा है जो 0.05 महत्व स्तर के साथ फ़्लर्ट करता है, जैसे कि "संपर्क करना" अभी भी अध्ययन का एक हड़ताली खोज है और मैंने तर्क दिए हैं कि 0.05 महत्व स्तर अनुसंधान के सभी क्षेत्रों पर लागू नहीं हो सकता है। इसके साथ ही, मैंने कहा कि मुझे अनुमान और विश्वास के अंतराल को महत्व के स्तरों से अधिक जानकारीपूर्ण पाया गया है। यहाँ इस मामले पर एक दिलचस्प लेख है (मेरे लिए वैसे भी)।


संदर्भ @ user2300643 के लिए धन्यवाद। और वित्तीय बाधा से बचने के लिए धन्यवाद!
doug.numbers

यहां 5% आदि के महत्व के स्तरों की उत्पत्ति की एक दिलचस्प चर्चा है
Glen_b -Reinstate मोनिका

0

पी का मान आम तौर पर आम सहमति के लिए निर्धारित होता है जैसा कि पहले (या बल्कि आलस्य) कहा गया है। वास्तव में यह कहने में सक्षम होने के लिए कि कुछ महत्वपूर्ण है हमें पी के मूल्य को खोजना होगा जो प्रभाव आकार, नमूना आकार और आप इसे अपने डेटा के लिए कितना कठोर चाहते हैं। इसे शक्ति विश्लेषण कहा जाता है (यह आँकड़ों के भीतर एक उपक्षेत्र है)। बहुत से लोग या तो जागरूक नहीं हैं या बस इसका उपयोग नहीं करते हैं क्योंकि यह सीधा नहीं है। यह कहना नहीं है यह ठीक है जिस तरह से यह है। हमें हमेशा इस तरह के अध्ययन करना चाहिए कि वास्तव में अर्थपूर्ण हो।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.