ज़िलक (2011) ने पी-वैल्यू के उपयोग का विरोध किया और कुछ विकल्पों का उल्लेख किया; वे क्या हैं?


25

हाल ही में एक कहा जाता सांख्यिकीय निष्कर्ष के लिए पी-मूल्य, पर भरोसा करने की दोष पर चर्चा लेख में "।। Matrixx वी Siracusano और छात्र वी परीक्षण पर फिशर सांख्यिकीय महत्व" (DOI: 10.1111 / j.1740-9713.2011.00511.x), स्टीफन टी। ज़िलीक पी-मूल्यों के उपयोग का विरोध करते हैं। समापन पैराग्राफ में वे कहते हैं:

डेटा एक ऐसी चीज है जिसे हम पहले से ही जानते हैं, और निश्चित रूप से। हम वास्तव में जो जानना चाहते हैं वह कुछ अलग है: एक परिकल्पना के सही होने की संभावना (या कम से कम व्यावहारिक रूप से उपयोगी), हमारे पास मौजूद डेटा को देखते हुए। हम इस संभावना को जानना चाहते हैं कि दोनों दवाएं अलग-अलग हैं, और उपलब्ध प्रमाणों को देखते हुए कितना अलग है। महत्व परीक्षण - जैसा कि यह प्रत्यारोपित सशर्त की गिरावट पर है, फिशर जो जाल में गिर गया - वह नहीं करता है और हमें उस संभावना को नहीं बता सकता है। पावर फंक्शन, अपेक्षित हानि फ़ंक्शन, और कई अन्य निर्णय-सिद्धांत और बेयसियन विधियां जो कि स्टूडेंट और जेफ्रीज़ के वंशज हैं, अब व्यापक रूप से उपलब्ध हैं और मुफ्त ऑन-लाइन करते हैं।

पावर फ़ंक्शन, अपेक्षित हानि फ़ंक्शन और "अन्य निर्णय-सिद्धांत और बेयसियन तरीके" क्या है? क्या इन विधियों का व्यापक रूप से उपयोग किया जाता है? वे आर में उपलब्ध हैं? इन नए सुझाए गए तरीकों को कैसे लागू किया जाता है? उदाहरण के लिए, क्या मैं इन विधियों का उपयोग कर किसी डेटासेट में अपनी परिकल्पना का परीक्षण करने के लिए उपयोग करूंगा।


अकेले के उपयोग के खिलाफ बहस करने वाले बहुत सारे कागज हैं, लेकिन यह वास्तव में संदर्भ पर निर्भर करता है, आईएमओ। क्या आप उस चीज़ पर अधिक जानकारी जोड़ सकते हैं जिसमें आप रुचि रखते हैं (cf. आपका अंतिम वाक्य)? पी
chl

2
मेरे पास लेख तक पहुंच नहीं है, लेकिन यह तर्क क्या चल रहा है की एक त्रुटिपूर्ण समझ को इंगित करता है। एक त्रुटिपूर्ण समझ के बावजूद, यह निष्कर्ष कि अन्य आँकड़े विचार योग्य हैं, उचित है। अपेक्षित हानि फ़ंक्शन केवल हानि फ़ंक्शन (जैसे चुकता त्रुटि, लॉजिस्टिक, आदि) के अपेक्षित मूल्य का एक अनुमान है ।
इटरेटर

जवाबों:


17

यह एक भ्रमित व्यक्ति द्वारा एक और स्पष्ट कागज की तरह लगता है। फिशर ऐसे किसी भी जाल में नहीं फंसे, हालांकि आंकड़ों के कई छात्र ऐसा करते हैं।

परिकल्पना परीक्षण एक निर्णय सिद्धांत समस्या है। आम तौर पर, आप दो निर्णयों (परिकल्पना सच या परिकल्पना झूठी) के बीच दिए गए दहलीज के साथ एक परीक्षण समाप्त करते हैं। यदि आपके पास एक परिकल्पना है जो एक बिंदु से मेल खाती है, जैसे कि , तो आप अपने डेटा की संभावना की गणना कर सकते हैं जब यह सत्य हो। लेकिन आप क्या करते हैं अगर यह एक बिंदु नहीं है? आपको एक का फंक्शन मिलता है । परिकल्पना इस तरह की परिकल्पना है, और आपके द्वारा देखे गए डेटा के उत्पादन की प्रायिकता के लिए ऐसा कार्य मिलता है जिसे देखते हुए यह सत्य है। वह फ़ंक्शन पावर फ़ंक्शन है। यह बहुत शास्त्रीय है। फिशर को इसके बारे में सब पता था।θ θ 0θ=0θθ0

अपेक्षित हानि निर्णय सिद्धांत की मूल मशीनरी का एक हिस्सा है। आपके पास प्रकृति के विभिन्न राज्य हैं, और उनसे उत्पन्न विभिन्न संभावित डेटा, और कुछ संभावित निर्णय जो आप कर सकते हैं, और आप डेटा से निर्णय तक एक अच्छा कार्य खोजना चाहते हैं। आप अच्छे को कैसे परिभाषित करते हैं? आपके द्वारा प्राप्त किए गए डेटा, और उस प्रक्रिया द्वारा किए गए निर्णय के आधार पर प्रकृति की एक विशेष स्थिति को देखते हुए, आपका अपेक्षित नुकसान क्या है? यह व्यवसाय की समस्याओं में सबसे सरल रूप से समझा जाता है (यदि मैं पिछले तीन तिमाहियों में देखी गई बिक्री के आधार पर ऐसा करता हूं, तो मौद्रिक नुकसान क्या है?)।

बायेसियन प्रक्रियाएं निर्णय सिद्धांत प्रक्रियाओं का एक सबसेट हैं। सभी लेकिन तुच्छ मामलों में विशिष्ट सर्वोत्तम प्रक्रियाओं को निर्दिष्ट करने के लिए अपेक्षित नुकसान अपर्याप्त है। यदि एक प्रक्रिया राज्य ए और बी दोनों में दूसरे से बेहतर है, तो जाहिर है आप इसे पसंद करेंगे, लेकिन यदि राज्य ए में बेहतर है और राज्य बी में एक बेहतर है, तो आप किसे चुनते हैं? यह वह जगह है जहां बेयस प्रक्रियाओं, न्यूनतमता और निष्पक्षता जैसे सहायक विचार दर्ज होते हैं।

टी αटीटीαβपीαपी

मुझे इस बात पर भी थोड़ी उलझन है कि वह स्टूडेंट और जेफ्री का नाम एक साथ क्यों रखता है, यह देखते हुए कि फिशर छात्र के काम के व्यापक प्रसार के लिए जिम्मेदार था।

मूल रूप से, पी-वैल्यू का अंधा उपयोग एक बुरा विचार है, और वे एक सूक्ष्म अवधारणा हैं, लेकिन यह उन्हें बेकार नहीं बनाता है। क्या हमें गरीब गणितीय पृष्ठभूमि वाले शोधकर्ताओं द्वारा उनके दुरुपयोग पर आपत्ति जताई जानी चाहिए? बिल्कुल, लेकिन आइए याद करते हैं कि फिशर ने जिस तरह का उपयोग करने के लिए क्षेत्र में आदमी के लिए कुछ नीचे करने की कोशिश की थी , उससे पहले यह कैसा दिखता था


5
+1 वास्तव में प्रश्न का उत्तर देने के लिए, और उद्धरण को चुनौती देने के लिए एक अतिरिक्त (लेकिन आभासी) +1, जो उत्तेजक लेकिन समस्याग्रस्त है। मैं देख रहा हूं कि आप यहां एक हालिया प्रतिभागी हैं, लेकिन पहले ही कई उत्तरों में योगदान कर चुके हैं: हमारी साइट पर बहुत धन्यवाद और स्वागत (थोड़ा विश्वासपूर्वक)!
whuber

आपके विस्तृत उत्तर के लिए बहुत बहुत धन्यवाद। यह उन वैकल्पिक रणनीतियों के बारे में सोचने में मदद करता है जो उस पत्र में गंभीर रूप से सुझाए गए हैं। मैंने यह सवाल इसलिए पूछा क्योंकि कुछ सहयोगियों ने इस पेपर का उपयोग यह कहने के लिए किया था कि हमें पी-वैल्यूज़ को बिल्कुल भी नहीं देखना चाहिए और मुझे एहसास हुआ कि मुझे समझ नहीं आया कि इन विकल्पों का वास्तव में क्या मतलब है। अपना स्पष्टीकरण के लिए धन्यवाद!
एरियल

@ जब भी मुझे नहीं लगता कि यह सवाल का जवाब है। ओपी उन विकल्पों के बारे में पूछ रहा था, जो ज़िलैक सुझाव दे रहे हैं, और यह जवाब उन्हें संबोधित नहीं करता है। उदाहरण के लिए, ज़ीलियाक की समालोचना इस बात पर निर्भर करती है कि लोग 5% या 1% महत्व का उपयोग क्यों करते हैं। वहाँ वास्तव में कोई ठोस कारण नहीं है, और वह फिशर के कागजात को इन स्तरों को ट्रैक करने में सक्षम था। यह सिर्फ कुछ मनमाना, सुविधाजनक संख्या है। जैसा कि "वैकल्पिक" दृष्टिकोणों के विरोध के कारण पेक्यूनेरी लाभ, डॉलर के मूल्यों पर आधारित है।
अक्कल

1
@ अक्षल मेरा मानना ​​है कि एक महत्वपूर्ण योगदान एक निर्णय-सिद्धांत समस्या के लिए परिकल्पना परीक्षण से संबंधित बातचीत से और स्पष्ट रूप से पी-मान को एक संभावित जोखिम (0-1 नुकसान फ़ंक्शन के आधार पर) से जोड़कर किया जाता है।
whuber

6

मैं विश्वास अंतराल और मॉडल-जाँच जैसी चीजों पर ध्यान केंद्रित करने की सलाह देता हूं। एंड्रयू जेलमैन ने इस पर बहुत अच्छा काम किया है। मैं उनकी पाठ्यपुस्तकों की सिफारिश करता हूं, लेकिन उनके द्वारा ऑनलाइन डाले गए सामान की भी जांच कर सकता हूं, जैसे http://andrewgelman.com/2011/06/the_holes_in_my/


5

ईज़ी जब आप का उपयोग पैकेज संभावना अनुपात प्रदान करता है ezMixed()मिश्रित प्रभाव मॉडलिंग करने के लिए कार्य करते हैं। संभावना अनुपात दो मॉडल की संभावना (देखे गए डेटा) की तुलना करके एक घटना के लिए सबूत की मात्रा निर्धारित करना है: एक "प्रतिबंधित" मॉडल जो घटना के प्रभाव को शून्य तक सीमित करता है और एक "अप्रतिबंधित" मॉडल गैर-शून्य प्रभाव की अनुमति देता है घटना। मॉडल की अंतर जटिलता के लिए मनाया संभावना को सही करने के बाद (Aike की सूचना मानदंड के माध्यम से, जो कि समान रूप से क्रॉस-सत्यापन के बराबर है), अनुपात घटना के लिए सबूत की मात्रा निर्धारित करता है।


4

वे सभी तकनीकें R में उसी अर्थ में उपलब्ध हैं, जो आपके बीजगणित में बीजगणित के सभी उपलब्ध हैं। यहां तक ​​कि पी-वैल्यू आर में कई अलग-अलग कार्यों के माध्यम से उपलब्ध हैं, जो तय करते हैं कि पी-वैल्यू प्राप्त करने के लिए किस फ़ंक्शन का उपयोग करना है या बायसेनियर पोस्टीरियर एक फ़ंक्शन या पैकेज के लिए सूचक की तुलना में अधिक जटिल है।

एक बार जब आप उन तकनीकों के बारे में जान लेते हैं और तय करते हैं कि आप वास्तव में किस प्रश्न का उत्तर चाहते हैं तो आप देख सकते हैं (या हम अधिक सहायता प्रदान कर सकते हैं) आर (या अन्य उपकरण) का उपयोग करके इसे कैसे करें। केवल यह कहते हुए कि आप अपने नुकसान को कम करना चाहते हैं, या बाद में वितरण प्राप्त करना उतना ही उपयोगी है जितना कि "भोजन" का उत्तर देना, जब आपसे पूछा जाए कि आप रात के खाने के लिए क्या खाना चाहते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.