परिकल्पना परीक्षण में पी-मूल्य की व्याख्या


36

मैं हाल ही में "द इनसिग्निफिकेंस ऑफ नाल हाइपोथीसिस सिग्नेचर टेस्टिंग", जेफ गिल (1999) के पेपर पर आया था । लेखक ने परिकल्पना परीक्षण और पी-मूल्यों के बारे में कुछ सामान्य गलतफहमियाँ उठाईं, जिनके बारे में मेरे दो विशिष्ट प्रश्न हैं:

  1. पी-मूल्य तकनीकी रूप से है है, जो, कागज द्वारा उठाई बाहर के रूप में, आम तौर पर हमारे बारे में कुछ नहीं बताता है पी ( एच 0 | बी एस आर v a t i o n )पी(रोंआरvटीमैंn|एच0)पी(एच0|रोंआरvटीमैंn), जब तक कि हम सीमांत वितरणों को जानने के लिए नहीं होते हैं, जो शायद ही कभी "रोजमर्रा की" परिकल्पना परीक्षण में होता है। जब हम एक छोटे से पी-वैल्यू प्राप्त करते हैं और "अशक्त परिकल्पना को अस्वीकार करते हैं," वास्तव में हम जो संभाव्य कथन कर रहे हैं, वह क्या है क्योंकि हम बारे में कुछ नहीं कह सकते हैं। ?पी(एच0|रोंआरvटीमैंn)
  2. दूसरा प्रश्न पत्र के पृष्ठ ६ (६५२) से एक विशेष कथन से संबंधित है:

चूंकि पी-वैल्यू, या सितारों द्वारा इंगित पी-वैल्यू की सीमा, एक प्राथमिकता निर्धारित नहीं की जाती है, इसलिए यह टाइप I त्रुटि बनाने की लंबे समय तक चलने वाली संभावना नहीं है लेकिन आमतौर पर इस तरह के रूप में व्यवहार किया जाता है।

क्या कोई यह समझाने में मदद कर सकता है कि इस कथन का क्या मतलब है?


कागज के संदर्भ के लिए
टीआई

@ezbentley: हो सकता है कि मेरे उत्तर पर एक लोलक डालना दिलचस्प हो: आंकड़े.stackexchange.com/questions/166323/…

जवाबों:


33

(तकनीकी रूप से, पी-मूल्य डेटा को कम से कम चरम रूप से देखने की संभावना है, जो वास्तव में मनाया गया है, जिसे परिकल्पना दी गई है।)

Q1। एक छोटे पी-मूल्य के आधार पर अशक्त परिकल्पना को अस्वीकार करने का निर्णय आम तौर पर 'फिशर की अस्वीकृति' पर निर्भर करता है: या तो एक दुर्लभ घटना हुई है या अशक्त परिकल्पना झूठी है। वास्तव में, यह घटना की दुर्लभता है जो कि पी-मूल्य आपको संभावना के बजाय बताता है कि अशक्त झूठ है।

संभावना है कि अशक्त झूठी है प्रयोगात्मक डेटा से केवल बेयस प्रमेय के माध्यम से प्राप्त किया जा सकता है, जिसमें शून्य परिकल्पना की 'पूर्व' संभावना की विशिष्टता की आवश्यकता होती है (संभवतः गिल जो "सीमांत वितरण" के रूप में संदर्भित है)।

Q2। आपके प्रश्न का यह भाग जितना प्रतीत हो सकता है, उससे कहीं अधिक कठिन है। पी-मूल्यों और त्रुटि दरों के बारे में बहुत भ्रम है, जो संभवतः, गिल के साथ "का संदर्भ है, लेकिन आमतौर पर इस तरह के रूप में व्यवहार किया जाता है।" नेमैन-पीयर्सोनियन त्रुटि दरों के साथ फिशरियन पी-मूल्यों के संयोजन को एक असंगत मिश्माश कहा गया है, और यह दुर्भाग्य से बहुत व्यापक है। कोई संक्षिप्त उत्तर यहां पूरी तरह से पर्याप्त नहीं है, लेकिन मैं आपको कुछ अच्छे कागजात (हां, एक मेरा है) की ओर इशारा कर सकता है। दोनों आपको गिल पेपर की समझ बनाने में मदद करेंगे।

हर्लबर्ट, एस।, और लोम्बार्डी, सी। (2009)। नेयमैन-पियर्सन निर्णय सिद्धांत का अंतिम ढाँचा और नियोफिशियन का उदय। एनलस ज़ूलोगीसी फेनिकी, 46 (5), 311-349। (कागज से लिंक करें)

ल्यू, एमजे (2012)। फार्माकोलॉजी (और अन्य बुनियादी बायोमेडिकल विषयों) में खराब सांख्यिकीय अभ्यास: आप शायद पी। ब्रिटिश जर्नल ऑफ फार्माकोलॉजी, 166 (5), 1559-1567 नहीं जानते हैं। doi: 10.1111 / j.1476-5381.2012.01931.x (कागज पर लिंक)


स्पष्टीकरण के लिए धन्यवाद। क्या इस तरह का बयान देना तकनीकी रूप से गलत है "the small p-value indicates that the sample mean(or regression coefficient, etc) is significantly different from zero"? भ्रम का स्रोत यह प्रतीत होता है कि जब हम कहते हैं कि अशक्त परिकल्पना के लिए कोई वास्तविक संभाव्य दावा नहीं किया जा रहा है।

2
@ezbentley, यह वास्तव में इस बात पर निर्भर करता है कि आपका क्या मतलब है। यह शब्द वास्तव में अधिकांश संदर्भों में बहुत सार्थक नहीं है क्योंकि यह फिशर-नेमन-पियर्सन संकर द्वारा दूषित किया गया है। यदि आपने बहुत छोटा पी-मूल्य प्राप्त किया है, तो यह कहना उचित है कि सही मतलब शायद शून्य नहीं है, लेकिन यह कहना महत्वपूर्ण है कि मनाया गया मतलब क्या था, और इसकी परिवर्तनशीलता (एसईएम या आत्मविश्वास अंतराल), और डॉन को इंगित करें ' नमूना आकार क्या था कहना न भूलें। एक पी-मूल्य मनाया प्रभाव आकार के विनिर्देश के लिए एक विकल्प नहीं है।
माइकल लुईस

विवरण के लिए आपका धन्यवाद। मुझे फिशर और नेमन-पीयरसन प्रतिमान में गहराई से खुदाई करने की आवश्यकता है।

@ मिचेल ल्यू: शायद मेरे जवाब पर एक नज़र डालना दिलचस्प हो सकता है: आंकड़े.stackexchange.com/questions/166323/…

Q1 के तहत आपका पैराग्राफ शायद उस मुद्दे का सबसे अच्छा स्पष्टीकरण है जो मैंने अब तक देखा है। धन्यवाद।
मैक्सिम.कं।

22

+1 से @MichaelLew, जिसने आपको एक अच्छा उत्तर प्रदान किया है। शायद मैं अभी भी Q2 के बारे में सोचने का एक तरीका प्रदान करके योगदान कर सकता हूं। निम्नलिखित स्थिति पर विचार करें:

  • पी
  • α0.05
  • पी0.01

पीपी0.02पी0.049¯पीα

पी


1
एक क्षेत्र (एपीआई) में काम करना जहां अक्सर यह मानना ​​बेहद मुश्किल होता है कि परिकल्पना H_0 = 0 वास्तव में सच है, मुझे लगता है कि यह बिंदु अनदेखी है और बहुत अधिक ध्यान देने योग्य है।
बोसोविच

1
α

1
+1, लेकिन सुझाव है कि नल के गलत होने पर P- मान का अर्थ स्पष्ट नहीं है। पी-मूल्य जितना छोटा होगा अशक्त और मनाया के बीच विसंगति। नमूना आकार जितना बड़ा होगा, उतना ही यह माना जा सकता है कि सही प्रभाव आकार अवलोकन प्रभाव आकार का है। यह ध्यान रखना बहुत महत्वपूर्ण है कि महत्व परीक्षण आकलन के अनुरूप है।
माइकल ल्यू

3
@MichaelLew, मुझे यकीन नहीं है कि पी-वैल्यू का मतलब है कि ये चीजें अपने आप हैं। संयोजन में w / N (और विशेष रूप से, N स्थिरांक को पकड़े हुए) एक छोटा p एक बड़े विसंगति b / t के अशक्त और अनुरूप होगा। फिर भी, यह कुछ ऐसा है जो पी के बजाय कुछ पी से मतलब किया जा सकता है । यह भी सच है कि डब्ल्यू / बड़ा एन मनाया प्रभाव आकार सच ईएस के करीब होना चाहिए, लेकिन यह मेरे लिए कम स्पष्ट है कि पी क्या भूमिका निभाता है। ईजी, डब्ल्यू / एक झूठे अशक्त, सही प्रभाव अभी भी बहुत छोटा हो सकता है, और डब्ल्यू / बड़े एन हम उम्मीद करेंगे कि ईएस के करीब होने की उम्मीद है, लेकिन पी अभी भी बड़े हो सकते हैं।
गूँग - मोनिका

1
...this fallacy shows up in statistics textbooks, as when Canavos and Miller (1999, p.255) stipulate: "If the null hypothesis is true, then a type I error occurs if (due to sampling error) the P-value is less than or equal to $alpha$"α

8

मैं "अशक्त परिकल्पना महत्व परीक्षण के महत्व" से संबंधित एक टिप्पणी करना चाहता हूं, लेकिन जो ओपी के सवाल का जवाब नहीं देता है।

पीएच0एच0:{θ=0}θ=εεε0ε0


3
+1 हां, पारंपरिक परिकल्पना परीक्षण के साथ वास्तविक समस्या यह है कि यह एक सवाल का जवाब देता है कि आप वास्तव में उत्तर देने में रुचि नहीं रखते हैं, अर्थात "क्या एक अंतर के महत्वपूर्ण सबूत हैं?", बजाय "एक महत्वपूर्ण अंतर के सबूत हैं?" "। बेशक, जो वास्तव में वांछित है वह आम तौर पर "क्या संभावना है कि मेरी शोध परिकल्पना सच है?", लेकिन इसका उत्तर अक्सर रूपरेखा के भीतर नहीं दिया जा सकता है। गलत व्याख्या आम तौर पर बायेसियन शब्दों में बार-बार होने वाले परीक्षण के इलाज के प्रयासों से उत्पन्न होती है।
डिक्रान मार्सुपियल

1
पी-मूल्यों और नमूना आकार के अर्थ को अलग करना एक अच्छा विचार नहीं है। एक छोटा पी-मूल्य किसी भी विशेष नमूना आकार में एक बड़ा प्रभाव आकार इंगित करता है, और किसी भी विशेष पी-मूल्य के लिए एक बड़ा नमूना आकार इंगित करता है कि सही प्रभाव आकार संभवतः मनाया प्रभाव आकार के करीब है। महत्वपूर्ण परीक्षणों को अनुमान के संदर्भ में सोचा जाना चाहिए, न कि त्रुटियों के बारे में। एक बड़ा नमूना हमेशा अधिक जानकारी देता है - यह कैसे व्याख्या करना है यह प्रयोगकर्ता पर निर्भर है। बड़े नमूना नगण्य प्रभाव की शिकायत केवल नेमन-पियर्सनियन परिकल्पना परीक्षण के लिए एक समस्या है।
माइकल ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.