वास्तव में एक पुराने प्रश्न का उत्तर देने जैसा कुछ भी नहीं है, लेकिन यहाँ जाता है ...।
पी-वैल्यू लगभग वैध परिकल्पना परीक्षण हैं। यह Jaynes की 2003 प्रायिकता सिद्धांत पुस्तक (दोहराए गए प्रयोगों: प्रायिकता और आवृत्ति) से लिया गया एक थोड़ा अनुकूलित अंश है। मान लें कि हमारे पास एक शून्य परिकल्पना जिसे हम परीक्षण करना चाहते हैं। हम डेटा है और पूर्व जानकारी । मान लीजिए कि कुछ अनिर्दिष्ट परिकल्पना जो हम खिलाफ परीक्षण करेंगे । खिलाफ पीछे का अनुपात फिर निम्न द्वारा दिया जाता है: डी मैं एच ए एच 0 एच ए एच 0H0DIHAH0HAH0
P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)
अब दाहिने हाथ की ओर पहला शब्द डेटा से स्वतंत्र है, इसलिए डेटा केवल दूसरे शब्द के माध्यम से परिणाम को प्रभावित कर सकता है। अब, हम हमेशा एक वैकल्पिक परिकल्पना आविष्कार कर सकते हैं जैसे कि - एक "सही फिट" परिकल्पना। इस प्रकार हम उपयोग कर सकते हैं कि डेटा कितनी अच्छी तरह से नल पर किसी भी वैकल्पिक परिकल्पना का समर्थन कर सकता है। इस बात की कोई वैकल्पिक परिकल्पना नहीं है कि डेटा से अधिक समर्थन कर सकता है । हम विकल्पों के वर्ग को भी प्रतिबंधित कर सकते हैं, और परिवर्तन यह है कि को उस वर्ग के भीतर अधिकतम संभावना (सामान्यीकृत स्थिरांक सहित) द्वारा प्रतिस्थापित किया जाता है। यदि P ( D | H A I ) = 1 1HAP(D|HAI)=1 H01 |1P(D|H0I)H0 1P(D|H0I)H0HAt(D)>t0t(D)Dt(D)1P(D|H0I)1P(D|H0I)बहुत छोटा होने लगता है, फिर हम अशक्त होने लगते हैं, क्योंकि और बीच विकल्पों की संख्या बढ़ती है (कुछ गैर-नगण्य पूर्व संभावनाओं के साथ)। लेकिन यह बहुत अधिक है जो पी-मूल्यों के साथ किया जाता है, लेकिन एक अपवाद के साथ: हम कुछ सांख्यिकीय लिए और सांख्यिकीय के कुछ "खराब" क्षेत्र के लिए संभावना की गणना नहीं करते हैं। हम लिए संभाव्यता की गणना करते हैं - हमारे पास वास्तव में जानकारी है, इसके बजाय कुछ सबसेट के अलावा, ।H0HAt(D)>t0t(D)Dt(D)
एक और कारण है कि लोग पी-वैल्यू का उपयोग करते हैं, वे अक्सर "उचित" परिकल्पना परीक्षण के लिए राशि लेते हैं, लेकिन गणना करना आसान हो सकता है। हम सामान्य विचरण के साथ सामान्य माध्य के परीक्षण के बहुत सरल उदाहरण के साथ इसे दिखा सकते हैं। हम डेटा है एक ग्रहण मॉडल के साथ (पहले जानकारी के भाग )। हम का परीक्षण करना चाहते हैं । फिर हमारे पास, थोड़ी गणना के बाद:एक्स मैं ~ एन ओ आर एम एक एल ( μ , σ 2 ) मैं एच 0 : μ = μ 0D≡{x1,…,xN}xi∼Normal(μ,σ2)IH0:μ=μ0
P(D|H0I)=(2πσ2)−N2exp(−N[s2+(x¯¯¯−μ0)2]2σ2)
जहाँ पर और । इससे पता चलता है कि का अधिकतम मूल्य तब प्राप्त होगा जब । अधिकतम मूल्य है:x¯¯¯=1N∑Ni=1xis2=1N∑Ni=1(xi−x¯¯¯)2P(D|H0I)μ0=x¯¯¯
P(D|HAI)=(2πσ2)−N2exp(−Ns22σ2)
इसलिए हम इन दोनों का अनुपात लेते हैं, और हम प्राप्त करते हैं:
P(D|HAI)P(D|H0I)=(2πσ2)−N2exp(−Ns22σ2)(2πσ2)−N2exp(−Ns2+N(x¯¯¯−μ0)22σ2)=exp(z22)
जहाँ "Z-आँकड़ा" है। के बड़े मूल्यअशक्त परिकल्पना पर संदेह करना, सामान्य अर्थ के बारे में परिकल्पना के सापेक्ष जो डेटा द्वारा सबसे अधिक मजबूती से समर्थित है। हम यह भी देख सकते हैं कि डेटा की जरूरत का एकमात्र हिस्सा है, और इस प्रकार यह परीक्षण के लिए पर्याप्त आँकड़ा है।z=N−−√x¯¯¯−μ0σ|z|x¯¯¯
इस समस्या के लिए पी-मूल्य दृष्टिकोण लगभग समान है, लेकिन रिवर्स में। हम पर्याप्त सांख्यिकीय साथ शुरू करते हैं , और हम इसके नमूने वितरण को शांत करते हैं, जो आसानी से को दिखाया जाता है। - जहाँ मैंने चर को प्रेक्षित मान से अलग करने के लिए एक बड़े अक्षर का उपयोग किया है । अब हमें एक ऐसा क्षेत्र खोजने की जरूरत है जो अशक्त परिकल्पना पर संदेह करता है: यह आसानी से उन क्षेत्रों में देखा जाता है जहांबड़ा है। इसलिए हम इस संभावना की गणना कर सकते हैं किx¯¯¯X¯¯¯¯∼Normal(μ,σ2N)X¯¯¯¯x¯¯¯|X¯¯¯¯−μ0||X¯¯¯¯−μ0|≥|x¯¯¯−μ0|निरूपित परिकल्पना से कितनी दूर देखा गया डेटा का एक उपाय है। पहले की तरह, यह एक सरल गणना है, और हम प्राप्त करते हैं:
p-value=P(|X¯¯¯¯−μ0|≥|x¯¯¯−μ0||H0)
=1−P[−N−−√|x¯¯¯−μ0|σ≤N−−√X¯¯¯¯−μ0σ≤N−−√|x¯¯¯−μ0|σ|H0]
=1−P(−|z|≤Z≤|z||H0)=2[1−Φ(|z|)]
अब, हम देख सकते हैं कि p- मान एक घटता हुआ फ़ंक्शन है, जिसका अर्थ है कि हम अनिवार्य रूप से "उचित" परिकल्पना परीक्षण के समान उत्तर प्राप्त करते हैं। जब पी-मान एक निश्चित सीमा से नीचे होता है, तो अस्वीकार करना, जब पीछे की ओर एक निश्चित सीमा से ऊपर होता है, तो अस्वीकार करना एक ही बात है। हालाँकि, ध्यान दें कि उचित परीक्षण करने में, हमें विकल्पों की श्रेणी को परिभाषित करना था, और हमें उस वर्ग पर एक संभावना को अधिकतम करना था। पी-वैल्यू के लिए, हमें एक आँकड़ा खोजना होगा, और इसके सैंपलिंग वितरण की गणना करनी होगी, और अवलोकन किए गए मूल्य पर इसका मूल्यांकन करना होगा। कुछ अर्थों में एक आंकड़ा चुनना एक वैकल्पिक परिकल्पना को परिभाषित करने के बराबर है, जिस पर आप विचार कर रहे हैं।|z|
यद्यपि वे दोनों इस उदाहरण में आसान चीजें हैं, लेकिन वे हमेशा अधिक जटिल मामलों में इतने आसान नहीं होते हैं। कुछ मामलों में इसका नमूना वितरण का उपयोग करने और गणना करने के लिए सही आंकड़ा चुनना आसान हो सकता है। दूसरों में यह विकल्प की श्रेणी को परिभाषित करना आसान हो सकता है, और उस वर्ग को अधिकतम कर सकता है।
पी-मूल्य आधारित परीक्षण की एक बड़ी मात्रा के लिए यह सरल उदाहरण खाता है, बस इसलिए कि कई परिकल्पना परीक्षण "अनुमानित सामान्य" विविधता के हैं। यह आपके सिक्के की समस्या का एक अनुमानित उत्तर भी प्रदान करता है (द्विपद के लिए सामान्य सन्निकटन का उपयोग करके)। यह यह भी दर्शाता है कि इस मामले में पी-मूल्य आपको भटक नहीं सकते हैं, कम से कम एक एकल परिकल्पना का परीक्षण करने के मामले में। इस मामले में, हम कह सकते हैं कि पी-मान अशक्त परिकल्पना के खिलाफ सबूत का एक उपाय है।
हालांकि, पी-वैल में बेयस फैक्टर की तुलना में कम व्याख्यात्मक पैमाने हैं - पी-मूल्य और नल के खिलाफ सबूत की "राशि" के बीच की कड़ी जटिल है। पी-वैल्यू बहुत जल्दी छोटा हो जाता है - जिससे उन्हें ठीक से उपयोग करना मुश्किल हो जाता है। वे डेटा द्वारा प्रदान किए गए नल के खिलाफ समर्थन को ओवरस्टैट करते हैं। यदि हम n- के विपरीत संभावनाओं के रूप में p- मानों की व्याख्या करते हैं - बाधाओं के रूप में , जब वास्तविक साक्ष्य , और बाधाओं के रूप में जब वास्तविक साक्ष्य । या इसे दूसरे तरीके से रखने के लिए, एक संभावना के रूप में पी-मूल्य का उपयोग करते हुए कि नल यहां झूठा है, पूर्व बाधाओं को स्थापित करने के बराबर है। तो पी-मूल्य के लिए0.193.870.05196.830.1शून्य के खिलाफ निहित पूर्व बाधाओं और के पी-मूल्य के लिए शून्य के खिलाफ निहित पूर्व बाधाओं ।2.330.052.78