क्या फिशर और नेमन-पीयरसन के बीच "हाइब्रिड" सांख्यिकीय परीक्षण के लिए वास्तव में एक "अविवेकी मिशाश" है?


56

विचार के एक निश्चित स्कूल में मौजूद है जिसके अनुसार सांख्यिकीय परीक्षण के लिए सबसे व्यापक दृष्टिकोण दो दृष्टिकोणों के बीच एक "हाइब्रिड" है: फिशर का और नेमन-पियर्सन का; ये दो दृष्टिकोण, दावा "असंगत" हैं, और इसलिए परिणामी "हाइब्रिड" एक "अविवेकी मिशाश" है। मैं नीचे एक ग्रंथ सूची और कुछ उद्धरण प्रदान करूंगा, लेकिन अब यह कहने के लिए पर्याप्त है कि सांख्यिकीय परिकल्पना परीक्षण पर विकिपीडिया लेख में इसके बारे में बहुत कुछ लिखा गया है । यहाँ CV पर, इस बिंदु को बार-बार @Michael Lew ( यहाँ और यहाँ देखें ) द्वारा बनाया गया था ।

मेरा सवाल है: एफ और एनपी दृष्टिकोणों को असंगत होने का दावा क्यों किया जाता है और हाइब्रिड को असंगत होने का दावा क्यों किया जाता है? ध्यान दें कि मैंने कम से कम छह एंटी-हाइब्रिड पेपर पढ़े (नीचे देखें), लेकिन फिर भी समस्या या तर्क को समझने में विफल। यह भी ध्यान दें, कि मैं बहस करने का सुझाव नहीं दे रहा हूं यदि एफ या एनपी एक बेहतर दृष्टिकोण है; न ही मैं बार-बार होने वाले बनाम बायेसियन फ्रेमवर्क पर चर्चा करने की पेशकश कर रहा हूं। इसके बजाय, सवाल यह है: स्वीकार करना कि एफ और एनपी दोनों वैध और सार्थक दृष्टिकोण हैं, उनके संकर के बारे में इतना बुरा क्या है?


यहां मैं स्थिति को समझता हूं। फिशर का दृष्टिकोण गणना करने के लिए है -value और रिक्त परिकल्पना के खिलाफ एक सबूत के रूप में ले। जितना छोटा होगा , सबूतों को उतना ही पुख्ता किया जाएगा। शोधकर्ता को अपने पृष्ठभूमि ज्ञान के साथ इस सबूत को संयोजित करना है, यह तय करना है कि क्या यह पर्याप्त रूप से आश्वस्त है , और तदनुसार आगे बढ़ें। (ध्यान दें कि फिशर के विचार वर्षों में बदल गए, लेकिन यही वह है जो अंततः रूपांतरित हो गया लगता है।) इसके विपरीत, नेमन-पीयरसन दृष्टिकोण समय से पहले को चुनना है और फिर यह जांचने के लिए कि क्याpअल्फा पी अल्फाpαpα; यदि हां, तो इसे महत्वपूर्ण कहें और अशक्त परिकल्पना को अस्वीकार करें (यहां मैं एनपी कहानी के बड़े हिस्से को छोड़ देता हूं जिसकी वर्तमान चर्चा के लिए कोई प्रासंगिकता नहीं है)। फिशर और नेमन-पियर्सन फ्रेमवर्क का उपयोग करने में @gung द्वारा एक उत्कृष्ट उत्तर भी देखें

हाइब्रिड दृष्टिकोण -value की गणना करने के लिए है , इसे रिपोर्ट करें (संक्षेप में यह मानते हुए कि छोटा बेहतर), और परिणाम भी महत्वपूर्ण है अगर (आमतौर पर ) और अन्यथा निरर्थक। यह असंगत माना जाता है। एक साथ दो वैध काम करने के लिए यह कैसे अवैध हो सकता है, मुझे मारता है।p α α = 0.05ppαα=0.05

विशेष रूप से बेतुका के रूप में विरोधी hybridists रिपोर्टिंग के व्यापक अभ्यास देखने के रूप में -values , , या (या यहाँ तक कि ), जहां हमेशा सबसे मजबूत असमानता चुना जाता है। इस तर्क से लगता है कि (ए) साक्ष्य की ताकत का सही मूल्यांकन नहीं किया जा सकता है क्योंकि सटीक रिपोर्ट नहीं किया गया है, और (बी) लोग असमानता में दाहिने हाथ की संख्या को रूप में व्याख्या करते हैं और इसे टाइप करते हैं I त्रुटि। दर, और यह गलत है। मैं यहां एक बड़ी समस्या को देखने में विफल हूं। सबसे पहले, सटीक रिपोर्टिंग निश्चित रूप से एक बेहतर अभ्यास है, लेकिन वास्तव में कोई भी परवाह नहीं करता है यदि उदाहरण के लिए या हैपी < 0.05 पी < 0.01 पी < 0.001 पी « 0.0001 पी अल्फा पी पी 0.02 0.03 ~ 0.0001 0.05 अल्फा = 0.05 पी अल्फा अल्फाpp<0.05p<0.01p<0.001p0.0001pαpp0.020.03 , इसलिए इसे लॉग स्केल पर राउंड करना बहुत बुरा नहीं है (और नीचे जाने से का कोई मतलब नहीं है, देखें कि छोटे पी-वैल्यू की रिपोर्ट कैसे की जानी चाहिए? )। दूसरा, यदि सर्वसम्मति से सब कुछ महत्वपूर्ण से नीचे कॉल करना है , तो त्रुटि दर और , क्योंकि @gung हाइपोथीसिस परीक्षण में पी-मूल्य की व्याख्या में बताते हैं । हालांकि यह संभावित रूप से एक भ्रमित करने वाला मुद्दा है, यह मुझे सांख्यिकीय परीक्षण (संकर के बाहर) के अन्य मुद्दों की तुलना में अधिक भ्रमित नहीं करता है। साथ ही, हाइब्रिड पेपर को पढ़ते समय हर पाठक का अपना पसंदीदा हो सकता है, और परिणाम के रूप में उसकी अपनी त्रुटि दर।0.00010.05α=0.05pααतो बड़ी बात क्या है?

जिन कारणों से मैं यह सवाल पूछना चाहता हूं, उनमें से एक यह है कि यह शाब्दिक रूप से यह देखने के लिए दर्द होता है कि सांख्यिकीय परिकल्पना परीक्षण पर विकिपीडिया लेख कितना हाइब्रिड हाइब्रिडिंग के लिए समर्पित है। हैल्पिन और स्टैम के बाद, यह दावा करता है कि एक निश्चित लिंडक्विस्ट को दोष देना है (पीले रंग में हाइलाइट की गई "त्रुटियों" के साथ अपनी पाठ्यपुस्तक का एक बड़ा स्कैन भी है), और निश्चित रूप से लिंडक्विस्ट के बारे में विकि लेख स्वयं उसी आरोप के साथ शुरू होता है। लेकिन तब, शायद मुझे कुछ याद आ रहा है।


संदर्भ

उल्लेख। उद्धरण

गिगेरेंज़र: मनोविज्ञान में हीन सांख्यिकी के रूप में संस्थागत हो गया है, फिशरियन आँकड़े नहीं हैं। यह एक तरफ फिशर के कुछ विचारों का एक असंगत मिश्श्म है, और दूसरी ओर नेमन और ईएस पियर्सन के कुछ विचार हैं। मैं इस मिश्रण को सांख्यिकीय निष्कर्ष के "संकर तर्क" के रूप में संदर्भित करता हूं।

गुडमैन: [नेयमन-पियर्सन] परिकल्पना परीक्षण दृष्टिकोण ने वैज्ञानिकों को एक फौस्टियन सौदा की पेशकश की - लंबे समय में गलत निष्कर्ष की संख्या को सीमित करने के लिए एक उचित स्वचालित तरीका है, लेकिन केवल साक्ष्य को मापने की क्षमता को छोड़ कर [एक ला फिशर] और आकलन करें। एक ही प्रयोग से सत्य।

Hubbard & Bayarri: शास्त्रीय सांख्यिकीय परीक्षण प्रतिस्पर्धा और अक्सर विरोधाभासी दृष्टिकोण का एक गुमनाम संकर है [...]। विशेष रूप से, नेयमैन-पियरसन सांख्यिकीय रूढ़िवादी के प्रकार I त्रुटि दर, साथ फिशर के स्पष्ट मूल्य की असंगति की सराहना करने में व्यापक विफलता है । [...] [यह] मिश्रण [...] से उत्पन्न होने वाली घबराहट के प्रमुख उदाहरण के रूप में, व्यापक रूप से अप्राप्य तथ्य पर विचार करें कि पूर्व का मान असंगत हैα पीpαpनेमन-पियर्सन परिकल्पना परीक्षण के साथ जिसमें यह एम्बेडेड हो गया है। [...] उदाहरण के लिए, गिबन्स और प्रैट [...] त्रुटिपूर्ण रूप से कहा गया है: "पी-मान की रिपोर्टिंग, चाहे वह सटीक हो या एक अंतराल के भीतर, प्रभाव में प्रत्येक व्यक्ति को अधिकतम सहनीय संभाव्यता के रूप में महत्व का अपना स्तर चुनने की अनुमति देता है। एक प्रकार की मैं त्रुटि। "

हैल्पिन और स्टैम: लिंडक्विस्ट का 1940 का पाठ फिशर और नेमन-पियर्सन दृष्टिकोण के संकरण का एक मूल स्रोत था। [...] सांख्यिकीय परीक्षण की किसी विशेष व्याख्या का पालन करने के बजाय, मनोवैज्ञानिकों के बारे में अस्पष्ट बने हुए हैं, और वास्तव में काफी हद तक अनजान हैं, फिशर और नेमन-पियर्सन विवाद द्वारा निहित वैचारिक कठिनाइयों।

ल्यू: हमारे पास एक हाइब्रिड दृष्टिकोण है जो न तो त्रुटि दरों को नियंत्रित करता है और न ही साक्ष्य की ताकत के आकलन की अनुमति देता है।


इस अच्छी तरह से शोध के लिए +1 (भले ही लंबे) सवाल। यह मुझे यह सोचने में मदद करेगा कि संभवतः यह निर्दिष्ट करना जारी है कि वास्तव में भ्रामक क्या है। क्या यह जानना पर्याप्त है कि फिशर के लिए नॉट एक वैकल्पिक परिकल्पना है, जबकि एनपी के लिए संभावनाओं की दुनिया अशक्त और वैकल्पिक दोनों के साथ समाप्त हो गई है? मेरे लिए पर्याप्त समझदार है, लेकिन अफसोस कि मैं हर समय हाइब्रिड चीज करता हूं क्योंकि आप से बच सकते हैं, इसलिए अंतर्धान हो गया है।
मोमो

2
@ मोमो: आप के बारे में सवाल "क्या वास्तव में भ्रामक है" - ठीक है, भ्रामक एंटी-हाइब्रिड बयानबाजी का उन्माद है। "असंगत मिश्मश" मजबूत शब्द हैं, इसलिए मैं एक बहुत बुरा असंगतता देखना चाहूंगा। वैकल्पिक परिकल्पना के बारे में आपने जो कहा है, वह मेरे लिए ठीक नहीं है ( के बगीचे विविधता मामले में वैकल्पिक रूप से , और मुझे असंगति के लिए अधिक जगह नहीं दिखती है) लेकिन अगर मुझे आपकी बात याद आ रही है तो शायद आप इसे एक उत्तर के रूप में प्रदान करना चाहेंगे। एच 1 : μ 0H0:μ=0H1:μ0
अमीबा का कहना है कि मोनिका

2
सिर्फ लेउ को पढ़कर (और मुझे पता चला कि मैं इसे पहले पढ़ूंगा, शायद 2006 के आसपास), मुझे यह काफी अच्छा लगा, लेकिन मुझे नहीं लगता कि यह प्रतिनिधित्व करता है कि मैं पी-वैल्यू का उपयोग कैसे करता हूं। मेरे महत्व के स्तर - दुर्लभ अवसरों पर मैं सभी परिकल्पना परीक्षण का उपयोग करता हूं * - हमेशा सामने रहता हूं, और जहां नमूना आकार पर मेरा कोई नियंत्रण है, शक्ति के विचार के बाद, दो त्रुटि प्रकारों की लागत पर कुछ विचार और इसी तरह - अनिवार्य रूप से नेमन-पीयरसन। मैं अभी भी पी-मान उद्धृत करता हूं, लेकिन फिशर के दृष्टिकोण के ढांचे में नहीं .... (ctd)
ग्लेन_ब

2
(ctd) ... * (मैं अक्सर लोगों को परिकल्पना परीक्षण से दूर कर देता हूं - इसलिए अक्सर उनके वास्तविक प्रश्न प्रभाव मापने से संबंधित होते हैं, और अंतराल का निर्माण करके बेहतर उत्तर दिए जाते हैं)। विशिष्ट समस्या 'हाइब्रिड' प्रक्रिया के लिए उठाया गया लेव कुछ ऐसी चीज़ों पर लागू होता है जो मैं नहीं करता और लोगों को करने के प्रति सावधानी बरतता हूँ। यदि लोग वास्तव में दृष्टिकोण का मिश्रण कर रहे हैं, तो वह ठीक लगता है। पी-मानों के अर्थ और दृष्टिकोणों के इतिहास के पहले की चर्चा उत्कृष्ट लगती है।
Glen_b

1
@ ग्लेन_ बी, ल्यू का ऐतिहासिक अवलोकन बहुत अच्छा और स्पष्ट है, मैं पूरी तरह सहमत हूं। मेरी परेशानी विशेष रूप से हाइब्रिड मुद्दे (अनुभाग "कौन सा दृष्टिकोण सबसे अधिक उपयोग किया जाता है?") के साथ है। निश्चित रूप से वहाँ हैं लोग कर वह वहाँ क्या वर्णन करता है, पी <.001 के सबसे मजबूत रिपोर्टिंग यानी, <.01, या <.05; मैं इसे हर समय न्यूरोसाइंस में देखता हूं। उन मामलों में से एक पर विचार करें जब आप परीक्षण का उपयोग करते हैं। आप उदाहरण के लिए अल्फा = .05 चुनते हैं, और एनपी फ्रेमवर्क का पालन करते हैं। जब आपको p = .00011 मिलता है, तो क्या H1 के बारे में आपकी निश्चितता है और जब आप p = .049 प्राप्त करेंगे, तो शब्दों से अलग होने की आपकी पसंद क्या है? यदि हां, तो यह हाइब्रिड है! यदि नहीं, तो कैसे आए?
अमीबा का कहना है कि मोनिका

जवाबों:


16

मेरा मानना ​​है कि कागजात, लेख, पोस्ट आदि जो आपने परिश्रमपूर्वक एकत्रित किए हैं, उनमें पर्याप्त जानकारी और विश्लेषण है कि दोनों दृष्टिकोण कहां और क्यों भिन्न हैं। लेकिन अलग होने का मतलब असंगत होना नहीं है ।

"हाइब्रिड" के साथ समस्या यह है कि यह एक हाइब्रिड है और एक संश्लेषण नहीं है , और यही कारण है कि इसे कई लोगों द्वारा हाइब्रिस के रूप में माना जाता है , यदि आप शब्द-प्ले का बहाना करते हैं।
एक संश्लेषण नहीं होने के कारण, यह दो दृष्टिकोणों के अंतरों को संयोजित करने का प्रयास नहीं करता है, और या तो एक एकीकृत और आंतरिक रूप से सुसंगत दृष्टिकोण बनाता है, या दोनों वैज्ञानिक दृष्टिकोणों को पूरक विकल्प के रूप में रखता है, ताकि बहुत अधिक जटिल तरीके से और अधिक प्रभावी ढंग से निपट सकें। दुनिया हम सांख्यिकी के माध्यम से विश्लेषण करने की कोशिश करते हैं (शुक्र है, यह आखिरी चीज है जो क्षेत्र के अन्य महान गृह युद्ध, लगातार-बायेसियन एक के साथ हो रहा है)।

इसके बारे में असंतोष मुझे विश्वास है कि इस तथ्य से आता है कि इसने वास्तव में सांख्यिकीय उपकरणों को लागू करने और सांख्यिकीय परिणामों की व्याख्या करने में गलतफहमी पैदा की है , मुख्य रूप से वैज्ञानिक जो सांख्यिकीय नहीं हैं , गलतफहमी जो संभवतः गंभीर और हानिकारक प्रभाव हो सकती हैं (क्षेत्र के बारे में सोच) दवा इस समस्या को उचित नाटकीय स्वर देने में मदद करती है)। यह गलत धारणा, क्या मेरा मानना ​​है, एक तथ्य के रूप में व्यापक रूप से स्वीकार किया गया है और उस अर्थ में, "एंटी-हाइब्रिड" दृष्टिकोण को व्यापक रूप से माना जा सकता है (कम से कम इसके परिणामों के कारण, यदि इसके पद्धतिगत मुद्दों के लिए नहीं)।

मैं इस मामले के विकास अब तक के रूप में एक ऐतिहासिक दुर्घटना देखते हैं (लेकिन मैं एक की जरूरत नहीं है संस्थापकों के बीच दुर्भाग्यपूर्ण लड़ाई की वजह से -value या मेरे परिकल्पना के लिए एक अस्वीकृति क्षेत्र),। फिशर और नेमन / पीयरसन ने दशकों से अपने दृष्टिकोणों के लिए कटु और सार्वजनिक रूप से लड़ाई लड़ी है । इससे यह धारणा बनी कि यहाँ एक द्वंद्वात्मक मामला है: एक दृष्टिकोण "सही" होना चाहिए, और दूसरा "गलत" होना चाहिए।p

हाइब्रिड का उदय हुआ, मेरा मानना ​​है कि इस अहसास से कि ऐसा कोई आसान जवाब मौजूद नहीं था, और यह कि वास्तविक दुनिया की घटनाएं थीं, जिनमें से एक दृष्टिकोण दूसरे की तुलना में बेहतर है ( इस पोस्ट को इस तरह के उदाहरण के लिए देखें, मेरे अनुसार कम से कम, जहां फिशरियन दृष्टिकोण अधिक उपयुक्त लगता है)। लेकिन दोनों को "अलग और अभिनय करने के लिए तैयार" रखने के बजाय, वे एक साथ शानदार रूप से थके हुए थे।

मैं एक स्रोत प्रदान करता हूं जो इस "पूरक विकल्प" दृष्टिकोण को सारांशित करता है: स्पैनोस, ए (1999)। संभाव्यता सिद्धांत और सांख्यिकीय निष्कर्ष: अवलोकन डेटा के साथ अर्थमितीय मॉडलिंग। कैम्ब्रिज यूनिवर्सिटी प्रेस। , ch। 14 , विशेष रूप से धारा 14.5, जहां औपचारिक रूप से और दोनों दृष्टिकोणों को अलग - अलग पेश करने के बाद , लेखक अपने मतभेदों को स्पष्ट रूप से इंगित करने की स्थिति में है, और यह भी तर्क है कि उन्हें पूरक विकल्प के रूप में देखा जा सकता है।


6
(+1) मैं आपकी टिप्पणियों की सराहना करता हूं और उनमें से कई के साथ सहमत हूं। लेकिन मुझे यकीन नहीं है कि आप वास्तव में क्या कह रहे हैं जब आप कहते हैं कि हाइब्रिड "गलतफहमी पैदा करता है" (और इसके अलावा, कि यह "एक तथ्य के रूप में व्यापक रूप से स्वीकार किया गया है")। क्या आप कुछ उदाहरण दे सकते हैं? हाइब्रिड पर हमला करने के लिए, यह गलतफहमी का उदाहरण होना चाहिए जो अकेले एफ या एनपी के दृष्टिकोण में उत्पन्न नहीं होते हैं। क्या आप और बीच संभावित भ्रम की बात कर रहे हैं जिसका मैंने अपने प्रश्न में उल्लेख किया है, या कुछ और? इसके अलावा, मैं पहले से ही स्पैनोस में धारा 14.5 पढ़ रहा हूं, धन्यवाद। αpα
अमीबा का कहना है कि मोनिका

6
स्पष्ट मुद्दा वास्तव में समस्या है। अधिक सूक्ष्म और मैं अधिक महत्वपूर्ण मानता हूं, यह तथ्य है कि हाइपर एनपी के अधिक औपचारिक दृष्टिकोण के साथ फिशर (जो शोधकर्ता के निर्णय के मामले को छोड़ देता है) के खोजपूर्ण स्वाद को मिलाता है। इसलिए शोधकर्ताओं ने फिशरियन स्पिरिट में इस मामले पर संपर्क किया, लेकिन फिर एनपी दृष्टिकोण के मजबूत "अस्वीकृति / स्वीकृति" वजन का दावा किया, जो सिद्धांत रूप में निष्कर्षों को अधिक विश्वसनीयता देता है। Contdpα
Alecos पापाडोपौलोस

6
मेरे लिए कॉन्ट्रा, यह "आपका केक है और इसे भी खाएं" हाइब्रिड दृष्टिकोण का मुद्दा है। उदाहरण के लिए, शक्ति-परीक्षण गणना के बिना एक एनपी दृष्टिकोण अकल्पनीय होना चाहिए, लेकिन हर समय जब हम एनपी ढांचे में परीक्षण को देखते हैं, लेकिन शक्ति गणना के बारे में कोई उल्लेख नहीं करते हैं।
एलेकोस पापाडोपोल्स

ऑफ़ टॉपिक, लेकिन ... चूंकि आप आरिस स्पैनोस का हवाला दे रहे हैं, मुझे आश्चर्य है कि क्या आप इस पद्धति के बारे में इस प्रश्न का उत्तर दे पाएंगे ? (मैंने एक बार सीधे आरिस स्पैनोस से सवाल पूछा था, और उन्होंने कृपया इसका उत्तर देने के लिए कुछ प्रयास किए। दुर्भाग्य से, उनका जवाब उनके पत्रों के रूप में उसी भाषा में था, इस प्रकार इससे मुझे बहुत मदद नहीं मिली।)
रिचर्ड हार्डी

13

मेरे अपने सवाल पर मेरा खुद का मानना ​​है कि हाइब्रिड (यानी स्वीकृत) दृष्टिकोण में कुछ भी खास नहीं है। लेकिन जैसा कि मुझे यकीन नहीं था कि मैं शायद एंटी-हाइब्रिड पेपरों में प्रस्तुत तर्कों की वैधता को समझने में विफल रहा हूं, मुझे इस पेपर के साथ एक साथ प्रकाशित चर्चा पाकर खुशी हुई:

दुर्भाग्य से, एक चर्चा के रूप में प्रकाशित दो उत्तरों को अलग-अलग लेखों के रूप में स्वरूपित नहीं किया गया था और इसलिए इसे ठीक से उद्धृत नहीं किया जा सकता है। फिर भी, मैं उन दोनों से उद्धृत करना चाहूंगा:

बर्क: धारा 2 और 3 का विषय ऐसा लगता है कि फिशर ने नेमन और पियर्सन को पसंद नहीं किया था, और नेमन को फिशर ने जो पसंद किया वह पसंद नहीं आया और इसलिए हमें ऐसा कुछ भी नहीं करना चाहिए जो दोनों दृष्टिकोणों को जोड़ता हो। यहाँ आधार से बचना नहीं है, लेकिन तर्क मुझे बचता है।

कार्लटन:लेखकों ने जोर देकर कहा कि अधिकांश भ्रम फिशरियन और नेमन-पियर्सनियन विचारों के विवाह से उपजा है, कि इस तरह की शादी आधुनिक सांख्यिकीविदों की ओर से एक भयावह त्रुटि है [...] [टी] वह उस मूल्यों को स्थापित करने के इरादे से प्रतीत होती है और टाइप I त्रुटियाँ एक ही ब्रह्मांड में सह-अस्तित्व नहीं कर सकती हैं। यह स्पष्ट नहीं है कि क्या लेखकों ने कोई ठोस कारण दिया है कि हम एक ही वाक्य में "p मान" और "टाइप I त्रुटि" का उच्चारण क्यों नहीं कर सकते हैं। [...] उनके [एफ और एनपी] असंगति का "तथ्य" मेरे लिए आश्चर्यजनक खबर के रूप में आता है, क्योंकि मुझे यकीन है कि यह लेख पढ़ने वाले हजारों योग्य सांख्यिकीविदों के लिए है। लेखकों को यह भी प्रतीत होता है कि कारणों के बीच सांख्यिकीविदों को अब इन दो विचारों को तलाक देना चाहिए कि फिशर और नेमन एक दूसरे के बहुत शौकीन नहीं थे (या एक दूसरे के) परीक्षण पर दर्शन)। मैंने हमेशा अपने वर्तमान अभ्यास को देखा है, जो फिशर और नेमन के दर्शन को एकीकृत करता है और दोनों पी मूल्यों और टाइप I त्रुटियों की चर्चा की अनुमति देता है - हालांकि निश्चित रूप से समानांतर में नहीं - हमारे अनुशासन की अधिक से अधिक विजय के रूप में।

दोनों प्रतिक्रियाएं पढ़ने लायक हैं। मूल लेखकों द्वारा एक हर्षोल्लास भी है, जो मुझे बिल्कुल भी आश्वस्त नहीं करता है ।


1
सह-अस्तित्व के लिए यह एक बात है, यह दूसरे के रूप में माना जाने वाला एक और है। लेकिन वास्तव में, एंटी-हाइब्रिड दृष्टिकोण का यह किनारा "कोई संश्लेषण नहीं हो सकता है" की भावना में है, जो कि मैं दृढ़ता से असहमत हूं। लेकिन मैं वर्तमान संकर को एक सफल विवाह के रूप में नहीं देखता ।
एलेकोस पापाडोपोलस

2
@ लिड, आपकी टिप्पणियों के लिए धन्यवाद, यह दिलचस्प है, लेकिन मैं यहां और चर्चा से बचना चाहूंगा। यदि आप चाहें तो मैं आपको एक नया उत्तर पोस्ट करने के लिए प्रोत्साहित करूंगा। लेकिन अगर आप ऐसा करने का फैसला करते हैं, तो मुख्य मुद्दे पर ध्यान देने की कोशिश करें, जो है: "हाइब्रिड" के बारे में इतना बुरा क्या है, क्योंकि अकेले फिशर और एनपी दोनों की तुलना में। आप महत्व परीक्षण, "शून्य अशांति परिकल्पना", आदि के पूरे दृष्टिकोण से घृणा करते हैं, लेकिन यह वह नहीं है जिसके बारे में यह सवाल है!
अमीबा का कहना है कि मोनिका

1
@ विभाजित: हम्म, क्या आप वास्तव में स्पष्ट कर सकते हैं कि आप ऐसा क्यों कहते हैं कि यह संकर की एक विशिष्ट विशेषता है? शुद्ध फिशर या शुद्ध एनपी में नल क्या होगा? कहते हैं कि आपके पास दो समूह हैं और एक महत्वपूर्ण अंतर ("शून्य नल") के लिए परीक्षण करना चाहते हैं। सभी तीन दृष्टिकोणों के साथ कोई भी इस स्थिति में नहीं जा सकता: शुद्ध फिशर, शुद्ध एनपी, और हाइब्रिड?
अमीबा का कहना है कि मोनिका

2
@ विभाजित, मैं शून्य अशक्त के खिलाफ आपके तर्कों को समझता हूं, मुझे सिर्फ यह लगता है कि यह मुद्दा हाइब्रिड के मुद्दे पर रूढ़िवादी है। मुझे स्मृति में एंटी-हाइब्रिड पेपर्स को रिफ्रेश करना है, लेकिन जहां तक ​​मुझे याद है हाइब्रिड की उनकी समालोचना शून्य नल पर केंद्रित नहीं है। इसके बजाय, यह फिशर और एनपी के संयोजन के बारे में है। फिर, यदि आप इससे सहमत नहीं हैं, तो कृपया उत्तर पोस्ट करने पर विचार करें; फिलहाल, इसे उसी पर छोड़ दें।
अमीबा का कहना है कि मोनिका

2
अपने लिए एक नोट: मुझे इस प्रश्न में इस पेपर के कुछ उद्धरण शामिल करने चाहिए: लेहमैन 1992, द फिशर, नेमन-पीयरसन थ्योरी ऑफ़ टेस्टिंग हाइपोथेसिस: वन थ्योरी या टू?
अमीबा का कहना है कि मोनिका

8

मुझे डर है कि इस उत्कृष्ट प्रश्न के लिए एक वास्तविक प्रतिक्रिया के लिए एक पूर्ण लंबाई के कागज की आवश्यकता होगी। हालाँकि, यहाँ कुछ बिंदु हैं जो प्रश्न या वर्तमान उत्तर में मौजूद नहीं हैं।

  1. त्रुटि दर 'प्रक्रिया' से संबंधित है लेकिन प्रायोगिक परिणामों के लिए सबूत 'संबंधित' है। इस प्रकार यह अनुक्रमिक रोक नियमों के साथ बहु-चरण प्रक्रियाओं के साथ संभव है, अशक्त परिकल्पना के खिलाफ बहुत ही मजबूत सबूत के साथ परिणाम है, लेकिन एक महत्वपूर्ण परिकल्पना परीक्षा परिणाम नहीं है। इसे एक मजबूत असंगति के रूप में सोचा जा सकता है।

  2. यदि आप असंगतताओं में रुचि रखते हैं, तो आपको अंतर्निहित दर्शन में रुचि होनी चाहिए। दार्शनिक कठिनाई लिकेलिहाइड प्रिंसिपल के अनुपालन और दोहराया नमूना सिद्धांत के अनुपालन के बीच एक विकल्प से आती है। एलपी लगभग कहता है कि, एक सांख्यिकीय मॉडल को देखते हुए, ब्याज के पैरामीटर के लिए प्रासंगिक डेटासेट में साक्ष्य पूरी तरह से प्रासंगिक संभावना फ़ंक्शन में निहित है। आरएसपी का कहना है कि किसी को उन परीक्षणों को प्राथमिकता देना चाहिए जो उनके नाममात्र मूल्यों के बराबर लंबे समय में त्रुटि दर देते हैं।


3
जो बर्जर और आरएल वोल्फर्ट का मोनोग्राफ "द लिक्लिएलहुड प्रिंसिपल" (दूसरा संस्करण 1988), मेरी राय में एक शांत, संतुलित और बिंदु 2 का अच्छा प्रदर्शन है।
एलेकोस पापाडोपोलस

5
बर्जर और वोल्फर्ट वास्तव में एक अच्छा प्रदर्शन है, और आधिकारिक भी है। हालांकि, मैं AWF एडवर्ड्स द्वारा अधिक व्यावहारिक रूप से निर्देशित और कम गणितीय पुस्तक "लिकेलिहुड" पसंद करता हूं। फिर भी प्रिंट में, मुझे लगता है। books.google.com.au/books/about/Likelihood.html?id=LL08AAAAIAAJ
माइकल ल्यू

2
@MichaelLew ने समझाया है कि p मानों का एक मान्य उपयोग प्रभाव आकार का सारांश है। उन्होंने इस पत्र को लिखकर एक बड़ा काम किया है: arxiv.org/abs/1311.0081
ज्वलंत

@ लिविड पेपर दिलचस्प है, लेकिन नए पाठक के लिए यह ध्यान देने योग्य है: मुख्य विचार, कि p मान 'इंडेक्स' (संभवतः: एक से एक संबंध में हैं) संभावना कार्यों के साथ, आम तौर पर गलत समझा जाता है क्योंकि ऐसे मामले हैं जहां एक ही संभावना नमूना योजना के आधार पर विभिन्न पी-मूल्यों से मेल खाती है। इस मुद्दे पर कागज में थोड़ी चर्चा की जाती है, लेकिन अनुक्रमण एक बहुत ही असामान्य स्थिति है (जो जरूरी नहीं कि इसे गलत बना दे, निश्चित रूप से)।
कंजुगेटपायर

8

दो दृष्टिकोणों के बीच अक्सर देखा जाने वाला (और माना जाता है) संघ (या बेहतर: "हाइब्रिड") इस प्रकार है:

  1. एक निर्धारित स्तर सेट करेंα
  2. Ho:μ=0H1:μ0
  3. α

    α

    • Ho
    • HoH1
    • 100%(1α)H1

    यदि पी मान काफी छोटा नहीं है, तो आप कहेंगे

    • Ho
    • HoH1

यहाँ, नेमन-पीयरसन के पहलू हैं:

  • तुम कुछ तय करो
  • Ho
  • आप जानते हैं कि मैं किस प्रकार की त्रुटि दर है

मछुआरे पहलू हैं:

  • आप p मान का वर्णन करते हैं। किसी भी पाठक के पास निर्णय के लिए अपने स्वयं के स्तर (उदाहरण के लिए कई परीक्षणों के लिए सख्ती से सही) का उपयोग करने की संभावना है
  • मूलतः, केवल शून्य परिकल्पना की आवश्यकता है क्योंकि विकल्प सिर्फ विपरीत है
  • μ0

ऐड ऑन

जबकि फिशर, एनपी या इस संकर दृष्टिकोण (जैसा कि कुछ लोगों द्वारा लगभग धार्मिक उन्माद में सिखाया गया है) की दार्शनिक समस्याओं के बारे में चर्चा के बारे में पता होना अच्छा है, इसके खिलाफ लड़ने के लिए आंकड़ों में बहुत अधिक प्रासंगिक मुद्दे हैं:

  • बिना सूचना के प्रश्न पूछना (जैसे द्विआधारी हाँ / कोई प्रश्न मात्रात्मक के बजाय "कितना" प्रश्न नहीं है, अर्थात आत्मविश्वास अंतराल के बजाय परीक्षणों का उपयोग करना)
  • डेटा चालित विश्लेषण विधियाँ जो पक्षपाती परिणाम (स्टेप वाइज रिग्रेशन, परीक्षण मान्यताओं आदि) का नेतृत्व करती हैं।
  • गलत परीक्षण या तरीके चुनना
  • दुष्परिणाम
  • गैर-यादृच्छिक नमूनों के लिए क्लासिक आंकड़ों का उपयोग करना

1
(+1) यह हाइब्रिड का एक अच्छा विवरण है (और वास्तव में यह हाइब्रिड क्यों है), लेकिन आपने स्पष्ट रूप से यह नहीं कहा कि आपका मूल्यांकन क्या है। क्या आप इस बात से सहमत हैं कि आपने जो वर्णन किया है वह "असंगत मिश्मश" है? यदि हां, तो क्यों? या क्या आपको लगता है कि यह एक उचित प्रक्रिया है? यदि हां, तो क्या यह दावा करने वाले लोग असंगत हैं या उनकी बात गलत है?
अमीबा का कहना है कि

1
α

4

यह स्वीकार करते हुए कि एफ और एनपी दोनों वैध और सार्थक दृष्टिकोण हैं, उनके संकर के बारे में इतना बुरा क्या है?

संक्षिप्त उत्तर: एक शून्य का उपयोग (कोई अंतर नहीं, कोई सहसंबंध नहीं) संदर्भ की परवाह किए बिना अशक्त परिकल्पना। बाकी सब कुछ उन लोगों द्वारा एक "दुरुपयोग" है, जिन्होंने इस प्रक्रिया के बारे में खुद के लिए मिथकों का निर्माण किया है। मिथकों को उनकी समस्या के लिए प्रक्रिया की अनुपयुक्तता के साथ प्राधिकरण और आम सहमति के आंकड़ों में विश्वास (कभी-कभी उचित) का उपयोग करने का प्रयास करने वाले लोगों से उत्पन्न होता है।

जहां तक ​​मुझे पता है कि गर्ड गिजेनेजर "हाइब्रिड" शब्द के साथ आए थे:

मैंने लेखक से पूछा [एक प्रतिष्ठित सांख्यिकीय पाठ्यपुस्तक लेखक, जिसकी पुस्तक कई संस्करणों से गुज़री, और जिसका नाम कोई फर्क नहीं पड़ता] क्यों उसने बेयस पर अध्याय और साथ ही बाद के सभी संस्करणों से निर्दोष वाक्य को हटा दिया। “क्या आपने आंकड़े पेश किए जैसे कि यह टूलबॉक्स के बजाय केवल एक हथौड़ा था? आपने फिशर और नेमन-पियर्सन के सिद्धांतों को एक असंगत हाइब्रिड में क्यों मिलाया जो हर सभ्य सांख्यिकीविद् अस्वीकार करते हैं? "

उनके श्रेय के लिए, मुझे यह कहना चाहिए कि लेखक ने इस बात से इनकार करने का प्रयास नहीं किया कि उन्होंने यह भ्रम पैदा किया है कि केवल एक उपकरण है। लेकिन उन्होंने मुझे बताया कि इसके लिए किसे दोषी ठहराया जाए। तीन अपराधी थे: उनके साथी शोधकर्ता, विश्वविद्यालय प्रशासन और उनके प्रकाशक। अधिकांश शोधकर्ता, उन्होंने तर्क दिया, वास्तव में सांख्यिकीय सोच में कोई दिलचस्पी नहीं है, लेकिन केवल यह कि कैसे अपने पत्रों को प्रकाशित किया जाए [...]

शून्य अनुष्ठान:

  1. "कोई अंतर नहीं" या "शून्य सहसंबंध" की एक सांख्यिकीय शून्य परिकल्पना स्थापित करें। अपने शोध की परिकल्पना या किसी भी वैकल्पिक मूल परिकल्पना की भविष्यवाणियों को निर्दिष्ट न करें।

  2. p<0.05p<0.01p<0.001p

  3. इस प्रक्रिया को हमेशा करें।

गिगेरेंज़र, जी (नवंबर 2004)। " नासमझ आँकड़े "। जर्नल ऑफ़ सोशियो-इकोनॉमिक्स 33 (5): 587–606। doi: 10.1016 / j.socec.2004.09.033।

संपादित करें: और हमें हमेशा उल्लेख करने की आवश्यकता है, क्योंकि "हाइब्रिड" इतना फिसलन और बीमार-परिभाषित है, कि पी-मूल्य प्राप्त करने के लिए नील नल का उपयोग करना विभिन्न नमूना आकारों को दिए गए प्रभाव आकारों की तुलना करने के तरीके के रूप में पूरी तरह से ठीक है। यह "परीक्षण" पहलू है जो समस्या का परिचय देता है।

संपादित करें 2: @amoeba एक सारांश मूल्य के रूप में एक पी-मान ठीक हो सकता है, इस मामले में शून्य नल परिकल्पना सिर्फ एक मनमाना मील का पत्थर है: http://arxiv.org/abs/1311.0081 । हालाँकि, जैसे ही आप कोई निष्कर्ष निकालने की कोशिश करना शुरू करते हैं या कोई निर्णय लेते हैं (यानी "परिकल्पना" की परिकल्पना "परीक्षण") करना बंद कर देता है। दो समूहों के उदाहरण की तुलना में, हम यह जानना चाहते हैं कि दो समूह कितने भिन्न हैं और विभिन्न परिमाणों के कारण उस परिमाण और प्रकार के अंतर हो सकते हैं।

पी वैल्यू का उपयोग सारांश सांख्यिकीय के रूप में किया जा सकता है जो हमें अंतर की परिमाण बता रहा है। हालाँकि, शून्य अंतर को "अस्वीकृत / अस्वीकार" करने के लिए इसका उपयोग करने का कोई उद्देश्य नहीं है जो मैं बता सकता हूं। इसके अलावा, मुझे लगता है कि इनमें से कई अध्ययन डिजाइन हैं जो एक ही समय बिंदु पर जीवित चीजों के औसत माप की तुलना करते हैं। हमें यह देखना चाहिए कि समय के साथ सिस्टम के अलग-अलग उदाहरण कैसे बदलते हैं, फिर एक ऐसी प्रक्रिया के साथ आते हैं, जिसमें बताया गया है कि पैटर्न (किसी भी अन्य अंतर सहित) को समझाया गया है।


2
+1, आपके उत्तर के लिए और लिंक के लिए धन्यवाद। ऐसा लगता है कि मैंने इस विशेष पेपर को नहीं पढ़ा है, मैं देखूंगा। जैसा कि मैंने पहले कहा था, मैं इस धारणा के तहत था कि "नील नल" "हाइब्रिड" के मुद्दे पर एक मुद्दा है, लेकिन मुझे लगता है कि मुझे जांचने के लिए गीगेरेंज़र के लेखन को फिर से पढ़ना चाहिए। आने वाले दिनों में समय खोजने की कोशिश करेंगे। इसके अलावा: क्या आप कृपया अपने अंतिम पैराग्राफ ("संपादित करें") को स्पष्ट कर सकते हैं? क्या मैंने सही तरीके से समझा है कि आप का मतलब है कि दो प्रभाव आकारों की तुलना करने पर एक शून्य शून्य होना ठीक है, लेकिन शून्य आकार के प्रभाव वाले शून्य की तुलना करना ठीक नहीं है?
अमीबा का कहना है कि मोनिका

1

मैं देखता हूं कि स्वयं से अधिक विशेषज्ञता वाले लोगों ने उत्तर प्रदान किए हैं, लेकिन मुझे लगता है कि मेरे उत्तर में कुछ अतिरिक्त जोड़ने की क्षमता है, इसलिए मैं इसे एक दूसरे के दृष्टिकोण के रूप में पेश करूंगा।

क्या हाइब्रिड दृष्टिकोण असंगत है?   मैं कहता हूं कि यह इस बात पर निर्भर करता है कि शोधकर्ता उन नियमों के साथ असंगत रूप से कार्य कर रहा है या नहीं, जो उनके साथ शुरू हुए थे: विशेष रूप से हाँ / नहीं नियम जो अल्फा मान की सेटिंग के साथ आता है।

बेतुका

Neyman-Pearson से शुरू करें। शोधकर्ता अल्फा = 0.05 सेट करता है, प्रयोग चलाता है, पी = 0.052 की गणना करता है। शोधकर्ता उस पी-वैल्यू को देखता है और फिशरियन इनवेंशन (अक्सर निहितार्थ) का उपयोग करते हुए, परिणाम को परीक्षण की परिकल्पना के साथ पर्याप्त रूप से असंगत मानता है कि वे अभी भी "कुछ" होने का दावा कर रहे हैं। परिणाम किसी तरह "काफी अच्छा" है, भले ही पी-मूल्य अल्फा मूल्य से अधिक था। अक्सर इसे भाषा के साथ जोड़ा जाता है जैसे "लगभग महत्वपूर्ण" या "महत्व की ओर रुझान" या उन पंक्तियों के साथ कुछ शब्द।

हालांकि, प्रयोग को चलाने से पहले एक अल्फा मान सेट करने का मतलब है कि किसी ने नेमन-पियर्सन आगमनात्मक व्यवहार के दृष्टिकोण को चुना है। पी-वैल्यू की गणना के बाद उस अल्फा वैल्यू को अनदेखा करने का चयन करना, और इस तरह से कुछ का दावा करना अभी भी किसी तरह दिलचस्प है, उस पूरे दृष्टिकोण को कमजोर करता है जिसकी शुरुआत किसी ने की थी। यदि एक शोधकर्ता पथ ए (नेमन-पियर्सन) को शुरू करता है, लेकिन फिर एक और पथ (फिशर) में कूद जाता है एक बार वे जिस रास्ते पर हैं, वह पसंद नहीं करते हैं, मैं उस असंगत पर विचार करता हूं। वे (निहित) नियमों के अनुरूप नहीं हैं जो उन्होंने शुरू किया था।

सुसंगत (संभवतः)

एनपी से शुरू करें। शोधकर्ता अल्फा = 0.05 सेट करता है, प्रयोग चलाता है, पी = 0.0014 की गणना करता है। शोधकर्ता उस पी <अल्फ़ा को देखता है, और इस तरह परीक्षण परिकल्पना को खारिज कर देता है (आमतौर पर कोई प्रभाव नहीं होता है) और वैकल्पिक परिकल्पना (प्रभाव वास्तविक है) को स्वीकार करता है। इस बिंदु पर शोधकर्ता, में इसके अलावा कोई वास्तविक प्रभाव (एनपी) के रूप में परिणाम के इलाज के लिए तय करने के लिए, अनुमान लगाने के लिए (फिशर) है कि प्रयोग बहुत मजबूत सबूत है कि प्रभाव असली है प्रदान करता है का फैसला किया। उन्होंने उस दृष्टिकोण के लिए बारीकियों को जोड़ा है जो उन्होंने शुरू किया था, लेकिन शुरुआत में एक अल्फा मान का चयन करके जगह में निर्धारित नियमों का खंडन नहीं किया है।

सारांश

यदि कोई अल्फा वैल्यू चुनकर शुरू करता है, तो किसी ने नेमैन-पियरसन पथ लेने का फैसला किया है और उस दृष्टिकोण के लिए नियमों का पालन किया है। यदि वे किसी बिंदु पर, उचितता के रूप में फिशरियन इंजेक्शन का उपयोग करते हुए उन नियमों का उल्लंघन करते हैं, तो उन्होंने असंगत / असंगत रूप से कार्य किया है।

मुझे लगता है कि कोई एक कदम आगे बढ़ सकता है और घोषणा कर सकता है कि क्योंकि संकर का उपयोग करना संभव है, इसलिए दृष्टिकोण स्वाभाविक रूप से असंगत है, लेकिन यह दार्शनिक पहलुओं में गहरा हो रहा है, जिसे मैं खुद के लिए भी योग्य नहीं मानता। एक राय पेश करें।

माइकल ल्यू को हैट टिप। उनके 2006 के लेख ने मुझे इन मुद्दों को किसी अन्य संसाधन से बेहतर समझने में मदद की।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.