पी-मूल्य के बारे में , मैं सोच रहा हूं कि % और % के लिए सोने का मानक क्यों लगता है । अन्य मान क्यों नहीं, जैसे % या %?"statistical significance"
क्या इसके लिए कोई मौलिक गणितीय कारण है, या यह सिर्फ एक व्यापक रूप से आयोजित सम्मेलन है?
पी-मूल्य के बारे में , मैं सोच रहा हूं कि % और % के लिए सोने का मानक क्यों लगता है । अन्य मान क्यों नहीं, जैसे % या %?"statistical significance"
क्या इसके लिए कोई मौलिक गणितीय कारण है, या यह सिर्फ एक व्यापक रूप से आयोजित सम्मेलन है?
जवाबों:
यदि आप नीचे दिए गए संदर्भों की जांच करते हैं, तो आपको पृष्ठभूमि में काफी भिन्नता मिलेगी, हालांकि कुछ सामान्य तत्व हैं।
वे संख्या कम से कम आंशिक रूप से फिशर की कुछ टिप्पणियों पर आधारित हैं, जहां उन्होंने कहा
(1/20 के स्तर पर चर्चा करते हुए)
इस बिंदु को निर्णय लेने में एक सीमा के रूप में लेना सुविधाजनक है कि क्या विचलन को महत्वपूर्ण माना जाना है या नहीं। दो बार मानक विचलन से अधिक विचलन इस प्रकार औपचारिक रूप से महत्वपूर्ण माना जाता है
फिशर, आरए (1925) सांख्यिकीय वर्कर्स रिसर्च वर्कर्स के लिए , पी। 47
दूसरी ओर, वह कभी-कभी अधिक व्यापक था:
यदि बीस में से एक भी पर्याप्त नहीं लगता है, तो हम, यदि हम इसे पसंद करते हैं, तो लाइन को पचास में से एक (2 प्रतिशत बिंदु), या सौ में से एक (1 प्रतिशत बिंदु) में ड्रा करें। व्यक्तिगत रूप से, लेखक 5 प्रतिशत के बिंदु पर निम्न स्तर के महत्व को निर्धारित करना पसंद करता है, और पूरी तरह से सभी परिणामों को अनदेखा करता है जो इस स्तर तक पहुंचने में विफल होते हैं। एक वैज्ञानिक तथ्य को केवल प्रायोगिक रूप से स्थापित माना जाना चाहिए, यदि ठीक से डिज़ाइन किया गया प्रयोग इस स्तर के महत्व को देने में विफल रहता है।
फिशर, आरए (1926)
क्षेत्र प्रयोगों की व्यवस्था । कृषि मंत्रालय के जर्नल, पी। 504
फिशर ने अपनी पुस्तक की एक तालिका के लिए 5% का भी उपयोग किया - लेकिन उसकी अधिकांश अन्य तालिकाओं में बड़े स्तर के महत्व थे
उनकी कुछ टिप्पणियों ने विभिन्न स्थितियों में कम या ज्यादा सख्त (यानी निम्न या उच्चतर अल्फा स्तर) दृष्टिकोणों का सुझाव दिया है।
इस तरह की चर्चा के कारण किसी भी अन्य 'मानक' मानों का उपयोग करने के लिए 5% और 1% महत्व के स्तर (और कभी-कभी दूसरों के साथ 10%, 2% और 0.5%) पर ध्यान केंद्रित करने की प्रवृत्ति पैदा करने की प्रवृत्ति पैदा हुई।
हालाँकि, इस पत्र में , काउल्स और डेविस का सुझाव है कि 5% का उपयोग - या इसके करीब कुछ कम से कम - फिशर की टिप्पणी से आगे वापस जाता है।
संक्षेप में, 5% (और कुछ हद तक 1%) का हमारा उपयोग बहुत अधिक मनमाना सम्मेलन है, हालांकि स्पष्ट रूप से बहुत से लोगों को लगता है कि कई समस्याओं के लिए वे सही तरीके से बॉलपार्क में हैं।
कोई कारण नहीं है या तो विशेष मूल्य का सामान्य रूप से उपयोग किया जाना चाहिए।
आगे के संदर्भ:
डैलल, जेरार्ड ई। (2012)। सांख्यिकीय अभ्यास की छोटी पुस्तिका। - ०.०५ क्यों?
स्टीगलर, स्टीफन (दिसंबर 2008)। "फिशर और 5% स्तर"। संभावना २१ (४): १२ यहाँ उपलब्ध है
(उन दोनों के बीच, आपको पृष्ठभूमि का एक अच्छा हिस्सा मिलता है - ऐसा लगता है कि उनके बीच कम से कम 5% की सामान्य बॉलपार्क में महत्व के स्तर के बारे में सोचने का एक अच्छा मामला है - 2% और 10% के बीच - कम या ज्यादा में था थोड़ी देर के लिए हवा।)
मुझे एक गैर-उत्तर देना है ( यहाँ जैसा है ):
"... निश्चित रूप से, भगवान .06 से लगभग उतना ही प्यार करते हैं। .05 क्या कोई शक हो सकता है कि भगवान पी के परिमाण के एक निरंतर निरंतर कार्य के रूप में या शून्य के खिलाफ सबूत की ताकत को देखते हैं?" (P.1277)
रोसावे, आरएल, और रोसेंथल, आर। (1989)। सांख्यिकीय प्रक्रियाएं और मनोवैज्ञानिक विज्ञान में ज्ञान का औचित्य। अमेरिकन मनोवैज्ञानिक , 44 (10), 1276-1284। पीडीएफ
पेपर में इस मुद्दे पर कुछ और चर्चा शामिल है।
मेरा मानना है कि 5% के लिए कुछ अंतर्निहित मनोविज्ञान है। मुझे यह कहना है कि मुझे याद नहीं है कि मैंने इसे कहाँ से उठाया था, लेकिन यहाँ अभ्यास मैं हर अंडरग्रेजुएट इंट्रो क्लास के साथ किया करता था।
एक अजनबी की कल्पना करें कि वह एक पब में आपसे संपर्क करता है और आपको बताता है: "मेरे पास एक पक्षपाती सिक्का है जो पूंछ की तुलना में अधिक बार सिर पैदा करता है। क्या आप मुझसे एक खरीदना चाहेंगे, ताकि आप अपने दोस्तों के साथ शर्त लगा सकें और उस पर पैसा कमा सकें?" आप झिझकते हैं कि एक बार देख लें, और 10 बार सिक्का बोलें। प्रश्न : आपको यह समझाने के लिए कितनी बार सिर / पूंछ लैंड करना पड़ता है कि यह पक्षपातपूर्ण है?
फिर मैं हाथों का एक शो लेता हूं: कौन आश्वस्त होगा कि यदि विभाजन 5/5 है तो सिक्का पक्षपाती है? 4/6? 3/7? 2/8? 1/9? 0/10? खैर, पहले दो या तीन किसी को मना नहीं करेंगे, और आखिरी कोई भी सभी को मना लेगा; 2/8 और 1/9 ज्यादातर लोगों को समझाएगा, हालांकि। अब, यदि आप द्विपद तालिका देखते हैं, तो 2/8 5.5% है, और 1/9 1% है। QED।
यदि कोई अभी अंडरग्रेजुएट अंडरग्रेजुएट कोर्स पढ़ा रहा है, तो मैं आपको इस अभ्यास को चलाने के लिए प्रोत्साहित करूंगा, और अपने परिणामों को टिप्पणियों के रूप में पोस्ट करूंगा, ताकि हम मेटा-विश्लेषण परिणामों के एक बड़े निकाय को संचित कर सकें और उन्हें कम से कम अमेरिकी में प्रकाशित कर सकें । स्टेटिस्टिशियन टीचिंग कॉर्नर। और एक तरफा बनाम दो तरफा स्थितियों को अलग करने के लिए स्वतंत्र महसूस करें !
एक अन्य जवाब में, ग्लेन_ बी ने फिशर को इस बारे में चर्चा प्रदान की कि क्या ये जादू संख्याएँ इस बात पर निर्भर करती हैं कि समस्या कितनी गंभीर है, इसलिए कृपया इसे न करें "आपकी बहन की ल्यूकेमिया के लिए एक नया उपचार है, लेकिन यह उसे ठीक कर देगा 3 महीने या उसे 3 दिनों में मार डालो, तो चलो कुछ सिक्के फ्लिप करें "- यह कुख्यात xkcd कॉमिक के रूप में मूर्खतापूर्ण लगेगा जो एंड्रयू जेलमैन को भी पसंद नहीं था।
सिक्कों और गेलमैन की बात करते हुए, TAS के पास गेलमैन और नोलन द्वारा एक बहुत ही जिज्ञासु पेपर था जिसका शीर्षक था "आप एक डाई को लोड कर सकते हैं, लेकिन आप एक सिक्के को बायस नहीं कर सकते हैं" , एक तर्क देते हुए कि सिक्का, हवा में उड़ गया या डॉन पर उछला टेबलटॉप, लगभग आधा समय सिर पर बिताएगा, और दूसरी बार, ऊपर की ओर झुकता है, इसलिए एक सिक्का को गंभीरता से पूर्वाग्रह करने के लिए एक भौतिक तंत्र के साथ आना मुश्किल है। (यह स्पष्ट रूप से एक पब-मूल अनुसंधान था, जैसा कि उन्होंने बीयर की बोतल के कैप्स के साथ प्रयोग किया था।) दूसरी तरफ, एक डाई लोड करना एक अपेक्षाकृत आसान काम है, और मैंने अपने छात्रों को इसमें कुछ 1 सेमी / आधा के साथ एक अभ्यास दिया। -एक स्थानीय शौक की दुकान और सैंडपेपर से लकड़ी के क्यूब्स को मरने को लोड करने के लिए कहें, और मुझे साबित करें कि यह लोड है - जो अनुपात और इसकी शक्ति के लिए पियर्सन परीक्षण में एक अभ्यास था ।
5% लगता है कि फिशर द्वारा 4.56% से गोल किया गया है, जो "औसत से अधिक तीन या शून्य तीन संभावित त्रुटियों से परे वक्र के पूंछ क्षेत्रों" के समान है (हर्लबर्ट और लोम्बार्डी, 2009)।
कहानी का एक अन्य तत्व महत्वपूर्ण vlaues (पियर्सन एट अल।, 1990; लेहमैन, 1993) के साथ तालिकाओं का पुनरुत्पादन प्रतीत होता है। फिशर को पियरसन द्वारा अपनी तालिकाओं का उपयोग करने की अनुमति नहीं दी गई थी (शायद पियर्सन के स्वयं के प्रकाशन के विपणन के कारण (हर्लबर्ट और लोम्बार्डी, 2009) और उनके रिश्ते की समस्याग्रस्त प्रकृति।
हर्लबर्ट, एसएच, और लोम्बार्डी, सीएम (2009, अक्टूबर)। नेयमैन-पियर्सन निर्णय सिद्धांत का अंतिम ढाँचा और नियोफिशियन का उदय। एनलिस ज़ूलोगीसी फेनीसी (वॉल्यूम 46, नंबर 5, पीपी। 311-349) में। फिनिश जूलॉजिकल एंड बॉटनिकल पब्लिशिंग
लेहमैन, ईएल (1993)। फिशर, नेमन-पियर्सन परिकल्पनाओं के परीक्षण के सिद्धांत: एक सिद्धांत या दो ?. जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन, 88 (424), 1242-1249।
पियर्सन, ईएस, गॉसेट, डब्ल्यूएस, प्लैकेट, आरएल, और बरनार्ड, जीए (1990)। छात्र: विलियम सीली गोसेट की एक सांख्यिकीय जीवनी। ऑक्सफोर्ड यूनिवर्सिटी प्रेस, यूएसए।
इसे भी देखें: गिगेरेंजर, जी। (2004) नासमझ आँकड़े। जर्नल ऑफ सोशियो-इकोनॉमिक्स, 33 (5), 587-606।
हबर्ड, आर।, और लिंडसे, आरएम (2008)। क्यों पी मान सांख्यिकीय महत्व परीक्षण में सबूत का एक उपयोगी उपाय नहीं हैं। सिद्धांत और मनोविज्ञान, 18 (1), 69-88।
मुझे लगता है कि इसका जवाब आंकड़ों की तुलना में अनुसंधान के खेल सिद्धांत में अधिक है। सामान्य चेतना में 1% और 5% जलने का मतलब है कि शोधकर्ता महत्त्वपूर्ण स्तर का चयन करने के लिए प्रभावी रूप से स्वतंत्र नहीं हैं जो उनके पूर्वाभास के अनुरूप हो। मान लें कि हमने .055 के पी-मान के साथ एक पेपर देखा और जहां 6% पर महत्व स्तर निर्धारित किया गया था - प्रश्न पूछे जाएंगे। 1% और 5% विश्वसनीय प्रतिबद्धता का एक रूप प्रदान करते हैं।
मेरी व्यक्तिगत परिकल्पना यह है कि 0.05 (या 20 में 1) / z मूल्य के साथ जुड़ा हुआ है (बहुत करीब है) 2. 2 का उपयोग करना अच्छा है, क्योंकि यह बहुत आसान है यदि आपका परिणाम सांख्यिकीय रूप से महत्वपूर्ण है। गोल संख्या के अन्य संगम नहीं हैं।
एकमात्र सही संख्या .04284731 है
... जो कि एक स्पष्ट प्रतिक्रिया है जिसका अर्थ है कि .05 का विकल्प अनिवार्य रूप से मनमाना है। मैं आमतौर पर केवल पी मूल्य की रिपोर्ट करता हूं, बजाय इसके कि पी मूल्य क्या अधिक या उससे कम है।
"महत्व" एक निरंतर परिवर्तनशील है, और, मेरी राय में, इसका विवेक करना अक्सर अच्छे से अधिक नुकसान करता है। मेरा मतलब है, अगर p = .13, अगर आपको p = .21 से अधिक आत्मविश्वास मिला है और यदि p = .003 से कम है
यह परिकल्पना परीक्षण का एक क्षेत्र है जिसने मुझे हमेशा मोहित किया है। विशेष रूप से क्योंकि एक दिन किसी ने कुछ मनमानी संख्या पर निर्णय लिया, जिसने परीक्षण प्रक्रिया को विचलित कर दिया और तब से लोग शायद ही कभी इस पर सवाल उठाते हैं।
मुझे याद है कि एक लेक्चरर ने हमें बताया कि स्टैगर और स्टॉक्स के इंस्ट्रूमेंटल वेरिएबल्स (जहां एफ-स्टेट को पहले स्टेज रिग्रेशन में 10 से ऊपर होना चाहिए, कमजोर इंस्ट्रूमेंट प्रॉब्लम से बचने के लिए) में बहुत ज्यादा विश्वास नहीं करना चाहिए क्योंकि नंबर 10 था पूरी तरह से मनमाना विकल्प। मुझे याद है कि "लेकिन क्या हम नियमित परिकल्पना परीक्षण के साथ ऐसा नहीं करते हैं ?????"
1 और 5 क्यों? क्योंकि वे सही महसूस करते हैं।
मुझे यकीन है कि विशिष्ट संख्याओं के भावनात्मक मूल्य और संज्ञानात्मक नमकीन पर अध्ययन हैं, लेकिन हम शोध का सहारा लिए बिना 1 और 5 की पसंद को समझ सकते हैं।
आज के आँकड़े बनाने वाले लोग एक दशमलव दुनिया में पैदा हुए, उठे और जीवित रहे। बेशक गैर-दशमलव गिनती प्रणालियां हैं, और फालैंग्स का उपयोग करके बारह तक गिनती संभव है और हो गई है, लेकिन यह उसी तरह से स्पष्ट नहीं है जैसे उंगलियों का उपयोग करना (जिसे इसलिए "अंक" कहा जाता है, जैसे संख्याएं )। और जब आप (और फिशर) गैर-दशमलव गिनती प्रणाली के बारे में जान सकते हैं, तो दशमलव प्रणाली पिछले सौ वर्षों में आपकी (और फिशर की दुनिया) प्रमुख गिनती प्रणाली है।
लेकिन अंक पाँच और एक विशेष क्यों हैं? क्योंकि दोनों मूल दस के सबसे स्वाभाविक रूप से नमकीन विभाजन हैं: एक उंगली, एक हाथ (या: आधा)।
आपको दस-से-एक और पाँच से प्राप्त होने वाले भिन्नों को समझने के लिए इतनी दूर जाने की ज़रूरत नहीं है। एक तो वहीं है, जैसे तुम्हारी अंगुली है। और किसी चीज को आधा करना किसी भी अन्य अनुपात में विभाजित करने की तुलना में एक ऑपरेशन बहुत सरल है। किसी भी चीज को दो हिस्सों में काटने के लिए किसी सोच की आवश्यकता नहीं होती है, जबकि तीन या चार से विभाजित करना पहले से ही बहुत जटिल है।
अधिकांश करंसी मुद्रा प्रणालियों में 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000 जैसे मूल्य के सिक्के और बैंक नोट होते हैं। कुछ मुद्रा प्रणालियों में 2, 20 और 200 नहीं हैं, लेकिन लगभग सभी में शुरुआत है 1 और 5 एक ही समय में में, सबसे मुद्रा प्रणाली नहीं है एक सिक्का या नोट है कि 3, 4, 6, 7, 8 या 9 दिलचस्प में शुरू होता है है, है ना? लेकिन ऐसा क्यों है?
क्योंकि आपको अगले बड़े ऑर्डर पर पहुंचने के लिए हमेशा 5s (या 2s में से पांच) के 1 या दो में से दस की जरूरत होती है। पैसे के साथ गणना करना बहुत सरल है: दस बार, या दोगुना। सिर्फ दो तरह के ऑपरेशन। आपके पास मौजूद प्रत्येक सिक्का या तो अगले क्रम के सिक्के का आधा या दसवां हिस्सा है। उन संख्याओं को गुणा और आसानी से और अच्छी तरह से जोड़ें।
तो 1 और 5 को गहराई से, अपने बचपन के बचपन से, फिशर में, और जिसने भी सबसे सरल, सबसे सरल, सबसे बुनियादी विभाजनों के रूप में महत्व का स्तर चुना है, 10. किसी भी अन्य संख्या को इसके लिए एक तर्क की आवश्यकता है, जबकि ये संख्या बस वहाँ हैं।
प्रत्येक व्यक्तिगत डेटा सेट के लिए उपयुक्त महत्व स्तर की गणना करने के लिए एक उद्देश्य के अभाव में, एक और पांच सही लगता है।