मैं पर पढ़ने किया गया है -values, प्रकार 1 त्रुटि दर, महत्व स्तर, शक्ति गणना, प्रभाव आकार और फिशर बनाम Neyman-पियर्सन बहस। इससे मुझे कुछ अटपटा सा लगा। मैं पाठ की दीवार के लिए माफी मांगता हूं, लेकिन मैंने महसूस किया कि इन अवधारणाओं की मेरी वर्तमान समझ का अवलोकन प्रदान करना आवश्यक था, इससे पहले कि मैं अपने वास्तविक प्रश्नों पर चला गया।
मैं क्या एकत्रित की हैं से, एक -value बस आश्चर्य का एक उपाय, चरम रूप में कम से कम एक परिणाम प्राप्त करने की संभावना है, यह देखते हुए कि शून्य परिकल्पना सत्य है। फिशर मूल रूप से इसके लिए एक सतत उपाय होने का इरादा रखता था।
नेमन-पियर्सन फ्रेमवर्क में, आप पहले से एक महत्व स्तर का चयन करते हैं और इसे एक (मनमाना) कट-ऑफ पॉइंट के रूप में उपयोग करते हैं। महत्व स्तर टाइप 1 त्रुटि दर के बराबर है। यह लंबे समय तक चलने वाली आवृत्ति द्वारा परिभाषित किया गया है, अर्थात यदि आप 1000 बार एक प्रयोग को दोहराते हैं और अशक्त परिकल्पना सच है, तो उन प्रयोगों में से लगभग 50 का नमूना परिवर्तनशीलता के कारण एक महत्वपूर्ण प्रभाव होगा । एक महत्व स्तर को चुनकर, हम इन झूठी सकारात्मकता के खिलाफ एक निश्चित संभावना के साथ खुद की रखवाली कर रहे हैं। पारंपरिक रूप से वैल्यू इस ढांचे में दिखाई नहीं देते हैं।
हम एक मिल जाए 0.01 के -value इस करता है नहीं मतलब है कि टाइप 1 त्रुटि दर 0.01 है, प्रकार 1 त्रुटि एक प्रायोरी कहा गया है। मेरा मानना है कि यह फिशर बनाम एनपी बहस में प्रमुख तर्कों में से एक है, क्योंकि अंतराल को अक्सर 0.05 *, 0.01 **, 0.001 *** के रूप में रिपोर्ट किया जाता है। यह कह रही है कि प्रभाव के लिए एक निश्चित में महत्वपूर्ण है में लोगों को गुमराह कर सकता है , -value बजाय एक निश्चित महत्व मूल्य पर की।पी
मुझे यह भी पता चलता है कि व्यू नमूना आकार का एक कार्य है। इसलिए, इसे एक पूर्ण माप के रूप में उपयोग नहीं किया जा सकता है। एक छोटा सा -value एक बड़े नमूना प्रयोग में एक छोटा सा, गैर प्रासंगिक प्रभाव को इंगित कर सकते हैं। इसका मुकाबला करने के लिए, अपने प्रयोग के लिए नमूना आकार का निर्धारण करते समय एक शक्ति / प्रभाव आकार गणना करना महत्वपूर्ण है। -values हमें बताते हैं कि क्या कोई प्रभाव है, न कि यह कितना बड़ा है। सुलिवन 2012 देखें ।
मेरा प्रश्न: मैं उन तथ्यों को कैसे समेट सकता हूं कि पॉवेल आश्चर्य (छोटे = अधिक ठोस) का एक उपाय है, जबकि एक ही समय में इसे एक पूर्ण माप के रूप में नहीं देखा जा सकता है?
निम्नलिखित क्या मैं के बारे में उलझन में हूँ, है: हम एक छोटी सी में और अधिक विश्वास किया जा सकता है एक बड़े एक से -value? फिशरियन अर्थ में, मैं हाँ कहूँगा, हम और अधिक आश्चर्यचकित हैं। एनपी फ्रेमवर्क में, एक छोटे महत्व के स्तर को चुनने का मतलब होगा कि हम झूठी सकारात्मकता के खिलाफ खुद को अधिक मजबूती से रख रहे हैं।
लेकिन दूसरी ओर, नमूने नमूने के आकार पर निर्भर हैं। वे एक पूर्ण उपाय नहीं हैं। इस प्रकार हम केवल यह नहीं कह सकते कि 0.001593 0.0439 से अधिक महत्वपूर्ण है। फिर भी यह फिशर के ढांचे में क्या निहित होगा: हम इस तरह के चरम मूल्य से अधिक आश्चर्यचकित होंगे। इस शब्द के बारे में भी चर्चा है कि अत्यधिक महत्वपूर्ण एक मिथ्या नाम है: क्या परिणामों को "अत्यधिक महत्वपूर्ण" के रूप में संदर्भित करना गलत है?
मैंने सुना है कि विज्ञान के कुछ क्षेत्रों में -values को केवल महत्वपूर्ण माना जाता है जब वे 0.0001 से छोटे होते हैं, जबकि अन्य क्षेत्रों में 0.01 के आसपास मान पहले से ही अत्यधिक महत्वपूर्ण माना जाता है।
संबंधित सवाल:
निचले पी-मान नल के खिलाफ अधिक सबूत क्यों नहीं हैं? जोहानसन 2011 से तर्क (@amoeba द्वारा प्रदान किए गए)