विचार के एक निश्चित स्कूल में मौजूद है जिसके अनुसार सांख्यिकीय परीक्षण के लिए सबसे व्यापक दृष्टिकोण दो दृष्टिकोणों के बीच एक "हाइब्रिड" है: फिशर का और नेमन-पियर्सन का; ये दो दृष्टिकोण, दावा "असंगत" हैं, और इसलिए परिणामी "हाइब्रिड" एक "अविवेकी मिशाश" है। मैं नीचे एक ग्रंथ सूची और कुछ उद्धरण प्रदान करूंगा, लेकिन अब यह कहने के लिए पर्याप्त है कि सांख्यिकीय परिकल्पना परीक्षण पर विकिपीडिया लेख में इसके बारे में बहुत कुछ लिखा गया है । यहाँ CV पर, इस बिंदु को बार-बार @Michael Lew ( यहाँ और यहाँ देखें ) द्वारा बनाया गया था ।
मेरा सवाल है: एफ और एनपी दृष्टिकोणों को असंगत होने का दावा क्यों किया जाता है और हाइब्रिड को असंगत होने का दावा क्यों किया जाता है? ध्यान दें कि मैंने कम से कम छह एंटी-हाइब्रिड पेपर पढ़े (नीचे देखें), लेकिन फिर भी समस्या या तर्क को समझने में विफल। यह भी ध्यान दें, कि मैं बहस करने का सुझाव नहीं दे रहा हूं यदि एफ या एनपी एक बेहतर दृष्टिकोण है; न ही मैं बार-बार होने वाले बनाम बायेसियन फ्रेमवर्क पर चर्चा करने की पेशकश कर रहा हूं। इसके बजाय, सवाल यह है: स्वीकार करना कि एफ और एनपी दोनों वैध और सार्थक दृष्टिकोण हैं, उनके संकर के बारे में इतना बुरा क्या है?
यहां मैं स्थिति को समझता हूं। फिशर का दृष्टिकोण गणना करने के लिए है -value और रिक्त परिकल्पना के खिलाफ एक सबूत के रूप में ले। जितना छोटा होगा , सबूतों को उतना ही पुख्ता किया जाएगा। शोधकर्ता को अपने पृष्ठभूमि ज्ञान के साथ इस सबूत को संयोजित करना है, यह तय करना है कि क्या यह पर्याप्त रूप से आश्वस्त है , और तदनुसार आगे बढ़ें। (ध्यान दें कि फिशर के विचार वर्षों में बदल गए, लेकिन यही वह है जो अंततः रूपांतरित हो गया लगता है।) इसके विपरीत, नेमन-पीयरसन दृष्टिकोण समय से पहले को चुनना है और फिर यह जांचने के लिए कि क्याअल्फा पी ≤ अल्फा; यदि हां, तो इसे महत्वपूर्ण कहें और अशक्त परिकल्पना को अस्वीकार करें (यहां मैं एनपी कहानी के बड़े हिस्से को छोड़ देता हूं जिसकी वर्तमान चर्चा के लिए कोई प्रासंगिकता नहीं है)। फिशर और नेमन-पियर्सन फ्रेमवर्क का उपयोग करने में @gung द्वारा एक उत्कृष्ट उत्तर भी देखें
हाइब्रिड दृष्टिकोण -value की गणना करने के लिए है , इसे रिपोर्ट करें (संक्षेप में यह मानते हुए कि छोटा बेहतर), और परिणाम भी महत्वपूर्ण है अगर (आमतौर पर ) और अन्यथा निरर्थक। यह असंगत माना जाता है। एक साथ दो वैध काम करने के लिए यह कैसे अवैध हो सकता है, मुझे मारता है।p ≤ α α = 0.05
विशेष रूप से बेतुका के रूप में विरोधी hybridists रिपोर्टिंग के व्यापक अभ्यास देखने के रूप में -values , , या (या यहाँ तक कि ), जहां हमेशा सबसे मजबूत असमानता चुना जाता है। इस तर्क से लगता है कि (ए) साक्ष्य की ताकत का सही मूल्यांकन नहीं किया जा सकता है क्योंकि सटीक रिपोर्ट नहीं किया गया है, और (बी) लोग असमानता में दाहिने हाथ की संख्या को रूप में व्याख्या करते हैं और इसे टाइप करते हैं I त्रुटि। दर, और यह गलत है। मैं यहां एक बड़ी समस्या को देखने में विफल हूं। सबसे पहले, सटीक रिपोर्टिंग निश्चित रूप से एक बेहतर अभ्यास है, लेकिन वास्तव में कोई भी परवाह नहीं करता है यदि उदाहरण के लिए या हैपी < 0.05 पी < 0.01 पी < 0.001 पी « 0.0001 पी अल्फा पी पी 0.02 0.03 ~ 0.0001 0.05 अल्फा = 0.05 पी ≠ अल्फा अल्फा , इसलिए इसे लॉग स्केल पर राउंड करना बहुत बुरा नहीं है (और नीचे जाने से का कोई मतलब नहीं है, देखें कि छोटे पी-वैल्यू की रिपोर्ट कैसे की जानी चाहिए? )। दूसरा, यदि सर्वसम्मति से सब कुछ महत्वपूर्ण से नीचे कॉल करना है , तो त्रुटि दर और , क्योंकि @gung हाइपोथीसिस परीक्षण में पी-मूल्य की व्याख्या में बताते हैं । हालांकि यह संभावित रूप से एक भ्रमित करने वाला मुद्दा है, यह मुझे सांख्यिकीय परीक्षण (संकर के बाहर) के अन्य मुद्दों की तुलना में अधिक भ्रमित नहीं करता है। साथ ही, हाइब्रिड पेपर को पढ़ते समय हर पाठक का अपना पसंदीदा हो सकता है, और परिणाम के रूप में उसकी अपनी त्रुटि दर।तो बड़ी बात क्या है?
जिन कारणों से मैं यह सवाल पूछना चाहता हूं, उनमें से एक यह है कि यह शाब्दिक रूप से यह देखने के लिए दर्द होता है कि सांख्यिकीय परिकल्पना परीक्षण पर विकिपीडिया लेख कितना हाइब्रिड हाइब्रिडिंग के लिए समर्पित है। हैल्पिन और स्टैम के बाद, यह दावा करता है कि एक निश्चित लिंडक्विस्ट को दोष देना है (पीले रंग में हाइलाइट की गई "त्रुटियों" के साथ अपनी पाठ्यपुस्तक का एक बड़ा स्कैन भी है), और निश्चित रूप से लिंडक्विस्ट के बारे में विकि लेख स्वयं उसी आरोप के साथ शुरू होता है। लेकिन तब, शायद मुझे कुछ याद आ रहा है।
संदर्भ
Gigerenzer, 1993, The superego, ego, and id in सांख्यिकीय तर्क - "हाइब्रिड" शब्द को पेश किया और इसे "असंगत मिश्मश" कहा।
- Gigerenzer et al। द्वारा हाल के अन्य एक्सपोज़र भी देखें। उदाहरण के लिए माइंडलेस आँकड़े (2004) और द न्यूल रिचुअल। क्या आप हमेशा महत्व परीक्षण के बारे में जानना चाहते थे लेकिन पूछने के लिए डर गए थे (2004)।
कोहेन, 1994, द अर्थ इज़ राउंड ( ) - लगभग 3k उद्धरणों के साथ एक बहुत लोकप्रिय पेपर, ज्यादातर अलग-अलग मुद्दों के बारे में लेकिन कृपापूर्वक गिजेनेर का हवाला देते हुए।
गुडमैन, 1999, साक्ष्य-आधारित चिकित्सा आँकड़े। 1: पी मूल्य परित्याग
हबर्ड एंड बायरी, 2003, शास्त्रीय सांख्यिकीय परीक्षण में साक्ष्य ( ') बनाम त्रुटियों ( ) के उपायों पर भ्रमα - "हाइब्रिड" के खिलाफ बहस करने वाले अधिक स्पष्ट पत्रों में से एक
हैल्पिन और स्टैम, 2006, आगमनात्मक इंजेक्शन या आगमनात्मक व्यवहार: फिशर और नेमन-पीयरसन साइकोलॉजिकल रिसर्च में सांख्यिकीय परीक्षण के लिए दृष्टिकोण (1940-1960) [पंजीकरण के बाद मुक्त] - "हाइब्रिड" दृष्टिकोण को पेश करने के लिए लिंडस्टिस्ट की 1940 की पाठ्यपुस्तक को दोषी मानते हैं।
@ माइकल ली, 2006, फार्माकोलॉजी (और अन्य बुनियादी बायोमेडिकल विषयों) में खराब सांख्यिकीय अभ्यास: आप शायद पी को नहीं जानते हैं - एक अच्छी समीक्षा और अवलोकन
उल्लेख। उद्धरण
गिगेरेंज़र: मनोविज्ञान में हीन सांख्यिकी के रूप में संस्थागत हो गया है, फिशरियन आँकड़े नहीं हैं। यह एक तरफ फिशर के कुछ विचारों का एक असंगत मिश्श्म है, और दूसरी ओर नेमन और ईएस पियर्सन के कुछ विचार हैं। मैं इस मिश्रण को सांख्यिकीय निष्कर्ष के "संकर तर्क" के रूप में संदर्भित करता हूं।
गुडमैन: [नेयमन-पियर्सन] परिकल्पना परीक्षण दृष्टिकोण ने वैज्ञानिकों को एक फौस्टियन सौदा की पेशकश की - लंबे समय में गलत निष्कर्ष की संख्या को सीमित करने के लिए एक उचित स्वचालित तरीका है, लेकिन केवल साक्ष्य को मापने की क्षमता को छोड़ कर [एक ला फिशर] और आकलन करें। एक ही प्रयोग से सत्य।
Hubbard & Bayarri: शास्त्रीय सांख्यिकीय परीक्षण प्रतिस्पर्धा और अक्सर विरोधाभासी दृष्टिकोण का एक गुमनाम संकर है [...]। विशेष रूप से, नेयमैन-पियरसन सांख्यिकीय रूढ़िवादी के प्रकार I त्रुटि दर, साथ फिशर के स्पष्ट मूल्य की असंगति की सराहना करने में व्यापक विफलता है । [...] [यह] मिश्रण [...] से उत्पन्न होने वाली घबराहट के प्रमुख उदाहरण के रूप में, व्यापक रूप से अप्राप्य तथ्य पर विचार करें कि पूर्व का मान असंगत हैα पीनेमन-पियर्सन परिकल्पना परीक्षण के साथ जिसमें यह एम्बेडेड हो गया है। [...] उदाहरण के लिए, गिबन्स और प्रैट [...] त्रुटिपूर्ण रूप से कहा गया है: "पी-मान की रिपोर्टिंग, चाहे वह सटीक हो या एक अंतराल के भीतर, प्रभाव में प्रत्येक व्यक्ति को अधिकतम सहनीय संभाव्यता के रूप में महत्व का अपना स्तर चुनने की अनुमति देता है। एक प्रकार की मैं त्रुटि। "
हैल्पिन और स्टैम: लिंडक्विस्ट का 1940 का पाठ फिशर और नेमन-पियर्सन दृष्टिकोण के संकरण का एक मूल स्रोत था। [...] सांख्यिकीय परीक्षण की किसी विशेष व्याख्या का पालन करने के बजाय, मनोवैज्ञानिकों के बारे में अस्पष्ट बने हुए हैं, और वास्तव में काफी हद तक अनजान हैं, फिशर और नेमन-पियर्सन विवाद द्वारा निहित वैचारिक कठिनाइयों।
ल्यू: हमारे पास एक हाइब्रिड दृष्टिकोण है जो न तो त्रुटि दरों को नियंत्रित करता है और न ही साक्ष्य की ताकत के आकलन की अनुमति देता है।