इस उद्धरण से फिशर का क्या अर्थ है?


14

मैं इस प्रसिद्ध उद्धरण को हर जगह देखता रहता हूं, लेकिन हर बार जोर देने वाले हिस्से को समझने में विफल रहता हूं।

एक व्यक्ति जो एक परिकल्पना को अनंतिम रूप से 'अस्वीकार' करता है, आदतन अभ्यास के मामले के रूप में, जब महत्व 1% के स्तर या उससे अधिक है, तो निश्चित रूप से इस तरह के 1% से अधिक निर्णयों में गलत नहीं होगा। परिकल्पना सही होने पर उसे इन मामलों में से केवल 1% में गलत किया जाएगा, और जब यह गलत होगा तो उसे कभी भी अस्वीकार नहीं किया जाएगा। [...] हालांकि, गणना बेतुका अकादमिक है, वास्तव में किसी भी वैज्ञानिक कार्यकर्ता के पास एक निश्चित स्तर का महत्व नहीं है, जिस पर साल-दर-साल और सभी परिस्थितियों में, वह परिकल्पना को खारिज करता है; बल्कि वह अपने दिमाग को अपने सबूतों और अपने विचारों के मद्देनजर प्रत्येक विशेष मामले को देता है।यह नहीं भूलना चाहिए कि परीक्षण लागू करने के लिए चुने गए मामले स्पष्ट रूप से एक उच्च चयनित सेट हैं, और यह कि चयन की शर्तों को एक कार्यकर्ता के लिए भी निर्दिष्ट नहीं किया जा सकता है; न ही इस तर्क में कि यह स्पष्ट रूप से किसी एक विशेष परीक्षण द्वारा इंगित महत्व के वास्तविक स्तर का चयन करने के लिए नाजायज होगा, हालांकि यह इस स्तर का उपयोग करने के लिए उसकी आजीवन आदत थी।

(सांख्यिकीय तरीके और वैज्ञानिक आविष्कार, 1956, पी। 42-45)

विशेष रूप से, मुझे समझ में नहीं आता है

  1. परीक्षण "अत्यधिक चयनित" लागू करने के लिए मामलों को क्यों चुना जाता है? आपको आश्चर्य होगा कि क्या किसी क्षेत्र में लोगों की औसत ऊंचाई 165 सेमी से कम है, और एक परीक्षण करने का निर्णय लेते हैं। मानक प्रक्रिया, जहां तक ​​मुझे पता है, क्षेत्र से यादृच्छिक नमूने खींचना और उनकी ऊंचाई को मापना है। इसे अत्यधिक कैसे चुना जा सकता है?
  2. माना कि मामले बहुत चुने गए हैं, लेकिन यह महत्व स्तर की पसंद से कैसे संबंधित है? ऊपर दिए गए उदाहरण पर फिर से विचार करें, यदि आपकी नमूना विधि (जो मुझे लगता है कि फिशर को चयन की शर्तों के रूप में संदर्भित किया जाता है ) तिरछा है और किसी तरह लंबे लोगों का पक्षधर है, तो पूरा शोध बर्बाद हो जाता है, और महत्व स्तर का व्यक्तिपरक निर्धारण इसे बचा सकता है।
  3. वास्तव में, मुझे यह भी पता नहीं है कि "एक विशेष परीक्षण द्वारा इंगित महत्व का वास्तविक स्तर" क्या है। यह है कि प्रयोग के -value, (में) जैसे कुछ पूर्व निर्धारित मूल्य प्रसिद्ध 0.05, या कुछ और?p

जवाबों:


15

यहाँ मेरा बोलबाला है कि फिशर आपके बोल्ड उद्धरण में क्या कहता है। यह नहीं भूलना चाहिए कि परीक्षण करने के लिए क्या परिकल्पना चुनने में बहुत कुछ जाता है, इतना ही नहीं कि एक व्यक्ति के निर्णय के लिए भी, आप यह सब निर्दिष्ट नहीं कर सकते। यह भी नहीं भूलना चाहिए कि, ऊपर बताए गए कारणों के लिए, आप एक विशेष परीक्षण के महत्व के स्तर पर हमेशा उसी तरह से निर्णय नहीं ले सकते हैं, जैसे जीवन भर की आदत।

  1. एक वैज्ञानिक परिकल्पना को कई अन्य प्रतिस्पर्धी परिकल्पनाओं के खिलाफ परीक्षण के लायक के रूप में चुना जाता है क्योंकि शोधकर्ता और उनके ज्ञान की वर्तमान स्थिति के आधार पर। परिकल्पना "अत्यधिक चयनित" कर रहे हैं, नमूने नहीं; परिकल्पना मामलों में जहां हम परीक्षण लागू होते हैं।

  2. परिकल्पनाओं की चयन प्रक्रिया हमारे महत्व स्तर को प्रभावित करती है। यदि हम एक परिकल्पना के बारे में निश्चित हैं, तो इससे खुद को संतुष्ट करने के लिए महत्व का स्तर कम कठोर होना चाहिए। यदि हम अनिश्चित हैं तो प्रमाण का अधिक बोझ है। अन्य कारक भी खेल में आते हैं, जैसे कि टाइप I त्रुटि ड्रग ट्रायल में टाइप II से भी बदतर है।

  3. मुझे लगता है कि जब वह कहता है "संकेत द्वारा" वह बस "के लिए चुना" का मतलब है। हां, यह एक पूर्व निर्धारित मूल्य है जहां हम परिकल्पना को अस्वीकार करते हैं यदि पी-मूल्य अधिक चरम है।


10

जिन मामलों में फिशर का जिक्र है, वे अवलोकन नहीं बल्कि परीक्षण हैं। यही है, हम परीक्षण करने के लिए परिकल्पना का चयन करते हैं। हम केवल यादृच्छिक परिकल्पनाओं का परीक्षण नहीं करते हैं - हम उन्हें अवलोकन, साहित्य, वैज्ञानिक सिद्धांतों और इतने पर आधार बनाते हैं।

यदि आपने यादृच्छिक परिकल्पनाओं का परीक्षण किया है, तो आपके द्वारा गलत किए जाने की संख्या (आपकी बोली के पहले वाक्य में) 1% होगी (या जो भी मूल्य चुना गया है)। जैसे अगर हमने परिकल्पनाओं को परखा

  • किसी व्यक्ति की सामाजिक सुरक्षा संख्या की समानता उसके आईक्यू से संबंधित होती है

  • काले बालों वाले लोगों की तुलना में गोरा बालों वाले लोगों ने फ्रिसबीस को फेंक दिया

  • क्रॉस मान्य पर एक उत्तर प्राप्त करने का समय आपके पहले नाम में अक्षरों की संख्या से संबंधित है।

और 1% पर उनमें से एक पूरे गुच्छा का परीक्षण किया, हम शून्य को समय के लगभग 1% को अस्वीकार कर देंगे, और ऐसा गलत तरीके से करेंगे। (जब तक, निश्चित रूप से, मैं उपरोक्त बकवास के साथ कुछ पर हूं)।

मैंने एक बार बालों के रंग और फ्रिबी को फेंकने के बारे में एक लेख देखा था - और इसमें अंतर पाया गया! तो, मैं इस तरह की बात को "फ्रिसबी अनुसंधान" कहता हूं।

लेकिन मुझे जो हिस्सा सबसे अच्छा लगता है, वह यह है:

क्योंकि वास्तव में किसी भी वैज्ञानिक कार्यकर्ता का कोई निश्चित स्तर नहीं है, जिस पर साल-दर-साल और सभी परिस्थितियों में, वह परिकल्पना को खारिज करता है; बल्कि वह अपने दिमाग को अपने सबूतों और अपने विचारों के मद्देनजर प्रत्येक विशेष मामले को देता है।

वह अपनी कब्र में घूम रहा होगा।


4
यह एक अच्छा जवाब है, लेकिन मैं "फ्रिसबी अनुसंधान" को बुरी चीजों के रूप में देखने में संकोच कर रहा हूं। जब तक कार्यप्रणालियों को ठीक से नियोजित किया जाता है (प्रभाव आकार आदि को ध्यान में रखते हुए), तब तक मैं परिणाम पर विचार करूंगा। मेरा मतलब है, यह माना जाता है कि हेयर कलर का फ्रिस्बी फेंकने से कोई लेना-देना नहीं है, लेकिन यह स्वीकार किया गया कि पृथ्वी सैकड़ों साल पहले तक ब्रह्मांड के केंद्र में है! हम चीजों को गलत करने के लिए लोगों की आलोचना कर सकते हैं, लेकिन हमें सवाल पूछने के लिए किसी को दोष नहीं देना चाहिए। यह कहा जा रहा है, मैं मानता हूं कि कुछ परिकल्पनाएं दूसरों की तुलना में कम उपयोगी हैं, लेकिन फिर भी, वे सही हो सकते हैं ।
नालज़ोक

और वे टाइप I त्रुटियाँ भी हो सकते हैं।
पीटर फ्लोम -

1
संबंधित: xkcd.com/882
jkdev

2

पुस्तक के एक संस्करण में आए उद्धरण की पृष्ठभूमि को देखने की कोशिश कर रहा हूं (मुझे यकीन नहीं है कि कौन सा संस्करण है) जिसमें थोड़ा सा उद्धरण है

https://archive.org/details/in.ernet.dli.2015.134555/page/n47

वैज्ञानिक अनुसंधानों में महत्व के परीक्षणों की संगति की व्याख्या करने के लिए जो प्रयास किए गए हैं, उनके आधार पर संभावित बयानों की काल्पनिक आवृत्तियों के संदर्भ में, सही या गलत होने के कारण, इस तरह के परीक्षणों की आवश्यक प्रकृति याद आती है। एक व्यक्ति जो अनंतिम रूप से एक परिकल्पना को "अस्वीकार" करता है, आदतन अभ्यास के मामले के रूप में, जब महत्व 1% या उच्चतर स्तर पर होता है, तो निश्चित रूप से इस तरह के 1% से अधिक निर्णयों में गलत नहीं होगा। जब परिकल्पना सही होती है, तो उसे इन मामलों में से केवल 1% में गलत किया जाएगा, और जब यह गलत होगा तो उसे कभी भी अस्वीकार नहीं किया जाएगा। इसलिए यह असमानता बयान की जा सकती है। हालांकि, गणना बेतुका अकादमिक है, वास्तव में किसी भी वैज्ञानिक कार्यकर्ता का एक निश्चित स्तर नहीं है, जिस पर साल-दर-साल और सभी परिस्थितियों में, वह परिकल्पना को खारिज करता है; बल्कि वह अपने सबूतों और अपने विचारों के प्रकाश में प्रत्येक विशेष मामले को अपना मन देता है। इसके अलावा, गणना पूरी तरह से एक परिकल्पना पर आधारित है, जो कि सबूतों के आलोक में, अक्सर माना जाता है कि यह सच नहीं है, ताकि गलत निर्णय की वास्तविक संभावना, किसी भी अर्थ के लिए इस तरह के वाक्यांश को दबाने से इसका अर्थ हो सकता है। आवृत्ति की तुलना में बहुत कम महत्व के स्तर को निर्दिष्ट करता है। एक व्यावहारिक व्यक्ति के लिए भी, जो एक परिकल्पना को खारिज कर देता है, यह निश्चित रूप से, इस संभावना के साथ उदासीनता का मामला है कि वह किस संभावना के कारण परिकल्पना को झूठा स्वीकार कर सकता है, क्योंकि उसके मामले में वह इसे स्वीकार नहीं कर रहा है। यह अक्सर सही नहीं माना जाता है, ताकि गलत निर्णय की वास्तविक संभावना, इस तरह के वाक्यांश को किसी भी अर्थ के लिए चुनना, महत्व के स्तर को निर्दिष्ट करने वाली आवृत्ति से बहुत कम हो सकता है। एक व्यावहारिक व्यक्ति के लिए भी, जो एक परिकल्पना को खारिज कर देता है, यह निश्चित रूप से, इस संभावना के साथ उदासीनता का मामला है कि वह किस संभावना के कारण परिकल्पना को झूठा स्वीकार कर सकता है, क्योंकि उसके मामले में वह इसे स्वीकार नहीं कर रहा है। यह अक्सर सही नहीं माना जाता है, ताकि गलत निर्णय की वास्तविक संभावना, इस तरह के वाक्यांश को किसी भी अर्थ के लिए चुनना, महत्व के स्तर को निर्दिष्ट करने वाली आवृत्ति से बहुत कम हो सकता है। एक व्यावहारिक व्यक्ति के लिए भी, जो एक परिकल्पना को खारिज कर देता है, यह निश्चित रूप से, इस संभावना के साथ उदासीनता का मामला है कि वह किस संभावना के कारण परिकल्पना को झूठा स्वीकार कर सकता है, क्योंकि उसके मामले में वह इसे स्वीकार नहीं कर रहा है।

यह मुझे अस्वीकृति की संभावनाओं की गणितीय अभिव्यक्ति का उपयोग करने के लिए एक आलोचना लगता है, टाइप I त्रुटियां, कुछ कठोर तर्क के रूप में। जो अभिव्यक्तियाँ प्रासंगिक हैं उनके लिए प्रायः अच्छी अभिव्यक्ति नहीं है और न ही वे कठोर हैं।

  1. परीक्षण "अत्यधिक चयनित" लागू करने के लिए मामलों को क्यों चुना जाता है?

    यह वाक्य से संबंधित लगता है

    इसके अलावा, गणना पूरी तरह से एक परिकल्पना पर आधारित है, जो साक्ष्य के प्रकाश में, अक्सर माना जाता है कि यह बिल्कुल सच नहीं है

    हम उस परिकल्पना के प्रति उदासीन नहीं हैं जिसका परीक्षण किया जा रहा है, और अक्सर जिस परिकल्पना का परीक्षण किया जा रहा है वह सच नहीं माना जाता है।

  2. यह महत्व स्तर की पसंद से कैसे संबंधित है?

    इससे संबंधित है

    ताकि गलत निर्णय की वास्तविक संभावना, किसी भी अर्थ के लिए इस तरह के वाक्यांश को दबाने से महत्व के स्तर को निर्दिष्ट करने की आवृत्ति से बहुत कम हो सकता है

    पी-वैल्यू केवल एक गलती करने की आवृत्ति है जब अशक्त-परिकल्पना सच होती है। लेकिन गलती करने की वास्तविक आवृत्ति अलग (कम) होगी।

  3. "एक विशेष परीक्षण द्वारा इंगित महत्व का वास्तविक स्तर" क्या है

    मेरा मानना ​​है कि यह भाग किसी प्रकार के पी-मूल्य हैकिंग को संदर्भित करता है। महत्व स्तर को बदलते हुए, अल्फा, अवलोकन किए गए पी-मूल्य से मेल खाने के लिए टिप्पणियों के बाद हुआ है, और यह दिखावा करते हैं कि यह शुरुआत से ही कट-ऑफ मूल्य था।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.