पी-मानों को समान रूप से शून्य परिकल्पना के तहत क्यों वितरित किया जाता है?


115

हाल ही में, मैंने एक में पाया है Klammer, et al द्वारा पेपर । एक बयान कि पी-मूल्यों को समान रूप से वितरित किया जाना चाहिए। मैं लेखकों पर विश्वास करता हूं, लेकिन समझ नहीं पाता कि ऐसा क्यों है।

क्लैमर, एए, पार्क, सीवाई और स्टाफ़र्ड नोबल, डब्लू। (2009) स्टैक्चुएशन कैलिब्रेशन ऑफ़ सीक्वेस्ट एक्सकोर फंक्शनजर्नल ऑफ़ प्रोटीन रिसर्च । 8 (4): 2106-2113।


24
यह पी-मान की परिभाषा के रूप में तत्काल है क्योंकि अशक्त परिकल्पना के तहत वितरण का उपयोग करके परीक्षण सांख्यिकीय का संभावित अभिन्न परिवर्तन है। निष्कर्ष की आवश्यकता है कि वितरण निरंतर हो। जब वितरण असतत होता है (या उसमें परमाणु होते हैं), पी-वैल्यू का वितरण असतत होता है, और इसलिए केवल लगभग समान हो सकता है।
whuber

1
@whuber ने जवाब दिया जो कुछ मुझे संदेह था। मैंने मूल संदर्भ को केवल यह सुनिश्चित करने के लिए कहा कि अनुवाद में कुछ खोया नहीं था। आमतौर पर इससे कोई फर्क नहीं पड़ता है कि लेख विशिष्ट है या नहीं, सांख्यिकीय सामग्री हमेशा के माध्यम से पता चलता है :)
mpiktas

10
केवल जब सच हैH0 ! ... और अधिक सख्ती से, केवल जब निरंतर (हालांकि ऐसा कुछ गैर-निरंतर मामले में सच है; मैं सबसे सामान्य मामले के लिए सही शब्द नहीं जानता; यह एकरूपता नहीं है)। फिर यह पी-वैल्यू की परिभाषा से चलता है।
Glen_b

2
इसे मौलिक सांख्यिकीय यांत्रिकी सिद्धांत के एक प्रकार के रूप में देखा जा सकता है (छात्रों को अक्सर स्वीकार करने में समान कठिनाई होती है) कि एक भौतिक प्रणाली के सभी सूक्ष्म राज्यों में समान संभावना है।
DWIN

5
इस लेख में दावे के बारे में कैसे: plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0076010 ?

जवाबों:


83

थोड़ा स्पष्ट करने के लिए। पी-मान समान रूप से वितरित किया जाता है जब अशक्त परिकल्पना सच होती है और अन्य सभी धारणाएं पूरी होती हैं। इसका कारण वास्तव में अल्फा की परिभाषा है I एक प्रकार की त्रुटि की संभावना। हम एक सच्चे शून्य परिकल्पना को अस्वीकार करने की संभावना चाहते हैं कि हम अल्फा हैं, जब हम देखे गए पी-मान < α को अस्वीकार करते हैंp-value<α , के किसी भी मान के लिए यह एकमात्र तरीका होता है जब p- मान एक समान आता है वितरण। सही वितरण (सामान्य, t, f, chisq, आदि) का उपयोग करने का पूरा बिंदु परीक्षण सांख्यिकीय से एक समान पी-मूल्य में बदलना है। यदि शून्य परिकल्पना झूठी है, तो पी-वैल्यू का वितरण (उम्मीद) 0 के प्रति अधिक भारित होगा।

Pvalue.norm.simऔर Pvalue.binom.simमें कार्यों TeachingDemos आर के लिए पैकेज कई डेटा सेट अनुकरण, गणना पी मूल्यों और उन्हें साजिश इस विचार को प्रदर्शित करने के होगा।

और देखें:

मर्डोक, डी, त्साई, वाई और एडकॉक, जे (2008)। पी-वैल्यू रैंडम वेरिएबल्स हैं। द अमेरिकन स्टेटिस्टिशियन , 62 , 242-245।

कुछ और जानकारी के लिए।

संपादित करें:

चूँकि लोग अभी भी इस उत्तर को पढ़ रहे हैं और टिप्पणी कर रहे हैं, मैंने सोचा कि मैं @ व्हिबर की टिप्पणी को संबोधित करूंगा।

यह सच है कि जब तरह एक समग्र अशक्त परिकल्पना का उपयोग किया जाता है, तो पी-मान केवल समान रूप से वितरित किया जाएगा जब 2 साधन बिल्कुल समान होंगे और एक समान नहीं होगा यदि किसी से कम है। । यह आसानी से फ़ंक्शन का उपयोग करते हुए और एक पक्षीय परीक्षण करने के लिए इसे सेट करने और सिमुलेशन के साथ अनुकरण करने के लिए देखा जा सकता है और परिकल्पित का अर्थ अलग होता है (लेकिन अशक्त को सच बनाने की दिशा में)।μ 1 μ 2μ1μ2μ1μ2Pvalue.norm.sim

जहां तक ​​सांख्यिकीय सिद्धांत जाता है, इससे कोई फर्क नहीं पड़ता। गौर कीजिए कि क्या मैंने दावा किया है कि मैं आपके परिवार के हर सदस्य से लंबा हूँ, इस दावे का परीक्षण करने का एक तरीका यह होगा कि आप एक समय में अपने परिवार के प्रत्येक सदस्य की ऊँचाई की तुलना करें। एक और विकल्प यह होगा कि आप अपने परिवार के उस सदस्य को खोजें जो सबसे लंबा है और उनकी ऊंचाई की तुलना खान से करें। अगर मैं उस एक व्यक्ति से लंबा हूं तो मैं बाकी लोगों से भी लंबा हूं और मेरा दावा सही है, अगर मैं उस एक व्यक्ति से लंबा नहीं हूं तो मेरा दावा झूठा है। एक समग्र प्रक्रिया का परीक्षण एक समान प्रक्रिया के रूप में देखा जा सकता है, जहां सभी संभव संयोजनों का परीक्षण करने के बजाय जहां हम सिर्फ समानता वाले भाग का परीक्षण कर सकते हैं क्योंकि यदि हम उस को अस्वीकार कर सकते हैंμ 1 = μ 2 μ 1 > μ 2 μ 1 < μ 2 μ 1 < μ 2 अल्फा μ 1 μ 2 अल्फाμ1μ2μ1=μ2 के पक्ष मेंμ1>μ2तब हम जानते हैं कि हम की सभी संभावनाओं को भी अस्वीकार कर सकते हैं । यदि हम उन मामलों के लिए p-मानों के वितरण को देखते हैं, जहां तो वितरण पूरी तरह से समान नहीं होगा, लेकिन 1 से 0 के करीब अधिक मान होंगे, जिसका अर्थ है कि एक प्रकार की त्रुटि से मैं कम हो सकता है चयनित मान इसे एक रूढ़िवादी परीक्षण बनाता है। वर्दी रूप में सीमित वितरण बन जाती हैμ1<μ2μ1<μ2αμ1 के करीब हो जाता हैμ2(जो लोग स्टेट-थ्योरी की शर्तों पर अधिक वर्तमान हैं, संभवतः वितरण वर्चस्व या इस तरह की चीज के मामले में यह बेहतर हो सकता है)। इसलिए हमारे परीक्षण का निर्माण नल के बराबर भाग को मानते हुए भी जब अशक्त समग्र है, तो हम अपने परीक्षण को एक प्रकार की त्रुटि की संभावना होने के लिए डिज़ाइन कर रहे हैं जो कि किसी भी स्थिति के लिए अधिकांश जहां शून्य सत्य है।α


मेरे द्वारा शुरू किए गए टाइपो के लिए क्षमा करें ( \leqTeX में पढ़ना चाहिए )!
CHL

1
लेख "पी-वैल्यूज़ रैंडम वेरिएबल्स हैं" वास्तव में दिलचस्प है, क्या कोई परिचयात्मक पुस्तक है जो लेख में वर्णित सिद्धांतों का पालन करती है?
एलेसेंड्रो जैकोसन

8
इस टिप्पणी के बावजूद कि मैंने इस प्रश्न को पोस्ट किया है, मैंने तब से महसूस किया है कि निष्कर्ष विशेष मामलों को छोड़कर सच नहीं है । समस्या, जैसे समग्र परिकल्पना के साथ होता है । "अशक्त परिकल्पना सत्य है" अब कई संभावनाओं को समाहित करती है, जैसे कि केस μ 1 = μ 2 - 10 6 । ऐसे मामले में, पी-मूल्यों को समान रूप से वितरित नहीं किया जाएगा । मुझे संदेह है कि कोई भी (कुछ कृत्रिम) स्थितियों का निर्माण कर सकता है, इसमें कोई फर्क नहीं पड़ता कि अशक्त परिकल्पना का क्या तत्व है, पी-मूल्यों का वितरण वर्दी के पास कभी भी नहीं होगा। μ1μ2μ1=μ2106
व्हीबर

1
@ ग्रेग स्नो: मुझे लगता है कि पी-वैल्यू का वितरण हमेशा एक समान नहीं होता है, यह एक समान वितरण से गणना करने पर समान होता है, लेकिन तब नहीं जब वे असतत वितरण से गणना किए जाते हैं

1
मैंने @whuber द्वारा टिप्पणी को संबोधित करने के लिए ऊपर दिए गए उत्तर का विस्तार किया है।
ग्रेग स्नो

26

अशक्त परिकल्पना के तहत, आपके परीक्षण सांख्यिकीय में वितरण एफ ( टी ) (जैसे, मानक सामान्य) है। हम दिखाने के पी-मूल्य है कि पी = एफ ( टी ) है एक प्रायिकता वितरण पीआर ( पी < पी ) = पीआर ( एफ - 1 ( पी ) < एफ - 1 ( पी ) ) = पीआर ( टी < टी ) पी ; TF(t)P=F(T)

Pr(P<p)=Pr(F1(P)<F1(p))=Pr(T<t)p;
दूसरे शब्दों में,एफ ( ) टीPसमान रूप से वितरित किया जाता है। यह तब तक धारण करता है जब तक उलटा नहीं हो जाता, इसकी एक आवश्यक शर्त यह है कि असतत रैंडम वैरिएबल नहीं है।F()T

यह परिणाम सामान्य है: एक यादृच्छिक चर के एक औंधा CDF का वितरण पर समान है ।[0,1]


8
आप अपनी पिछली टिप्पणी को फिर से लिखना चाह सकते हैं, जो थोड़ा भ्रमित करने वाला है। निरंतर सीडीएफ में जरूरी (उचित) उलटा नहीं होता है। (क्या आप एक प्रतिरूप के बारे में सोच सकते हैं?) इसलिए आपके प्रमाण को धारण करने के लिए अतिरिक्त परिस्थितियों की आवश्यकता होती है। इसके चारों ओर आने का मानक तरीका छद्म बिंदु F को परिभाषित करना है। तर्क और भी सूक्ष्म हो जाता है। F(y)=inf{x:F(x)y}
कार्डिनल

1
सामान्यीकृत व्युत्क्रमों के साथ काम करने के संबंध में, देखें लिंक। Springer.com/article/10.1007%2Fs00186-013-0436-7 (विशेष रूप से, F निरंतर है - F केवल समान है - कोई फर्क नहीं पड़ता कि एफ उलटा है या नहीं नहीं)। पी-मान की अपनी परिभाषा के बारे में: मुझे नहीं लगता कि यह हमेशा 'एफ (टी)' है। यह अवलोकन की तुलना में अधिक चरम मूल्य पर लेने की संभावना (शून्य के तहत) है , इसलिए यह उत्तरजीविता फ़ंक्शन (यहां सटीक होने के लिए) हो सकता है।
मारियस हॉफर्ट

ना CDF? F(t)
zyxue

@zyxue हाँ, cdf को कभी-कभी "वितरण" के रूप में जाना जाता है।
मिकारियो

6

चलो संचयी बंटन फ़ंक्शन के साथ यादृच्छिक चर निरूपित एफ ( टी ) पीआर ( टी < टी ) सभी के लिए टी । यह मानते हुए कि F उलटा है, हम यादृच्छिक p- मान P = F ( T ) के वितरण को निम्न प्रकार से प्राप्त कर सकते हैं :TF(t)Pr(T<t)tFपी=एफ(टी)

Pr(P<p)=Pr(F(T)<p)=Pr(T<F1(p))=F(F1(p))=p,

जिससे हम यह निष्कर्ष निकाल सकते हैं कि का वितरण समान है [ 0 , 1 ] परP[0,1]

यह उत्तर चार्ली के समान है, लेकिन को परिभाषित करने से बचा जाता है ।t=F1(p)


जैसा कि आपने एफ को परिभाषित किया है, पी = एफ (टी) = पीआर (टी <टी) = 0 नहीं है?
TrynnaDoStat

बिल्कुल नहीं, का "वाक्यविन्यास प्रतिस्थापन" कुछ भ्रामक है। औपचारिक रूप से कहा जाए तो एफ ( टी ) है यादृच्छिक चर द्वारा परिभाषित ( एफ ( टी ) ) ( ω ) = एफ ( टी ( ω ) ) : = पीआर ( टी < टी ( ω ) )F(T)=Pr(T<T)F(T)(F(T))(ω)=F(T(ω)):=Pr(T<T(ω))
jii

4

दो स्वतंत्र चर के बीच रैखिक प्रतिगमन के मामले में पी-मूल्यों के वितरण का सरल अनुकरण:

# estimated model is: y = a0 + a1*x + e

obs<-100                # obs in each single regression
Nloops<-1000            # number of experiments
output<-numeric(Nloops) # vector holding p-values of estimated a1 parameter from Nloops experiments

for(i in seq_along(output)){

x<-rnorm(obs) 
y<-rnorm(obs)

# x and y are independent, so null hypothesis is true
output[i] <-(summary(lm(y~x)) $ coefficients)[2,4] # we grab p-value of a1

if(i%%100==0){cat(i,"from",Nloops,date(),"\n")} # after each 100 iteration info is printed

}

plot(hist(output), main="Histogram of a1 p-values")
ks.test(output,"punif") # Null hypothesis is that output distr. is uniform

7
क्या आप इस बारे में विस्तार से बता सकते हैं कि यह प्रश्न का उत्तर कैसे देता है? हालांकि इसका आउटपुट अभिकथन के एक विशेष मामले को दर्शाता है, लेकिन कोड की कोई भी मात्रा इस सवाल का जवाब देने में सक्षम नहीं होगी कि क्यों ? इसके लिए अतिरिक्त स्पष्टीकरण की आवश्यकता है।
whuber

-1

मुझे नहीं लगता कि इनमें से अधिकांश उत्तर वास्तव में सामान्यता में प्रश्न का उत्तर देते हैं। वे इस मामले में प्रतिबंधित हैं जब एक साधारण अशक्त परिकल्पना होती है और जब परीक्षण सांख्यिकीय में एक उलटा सीडीएफ होता है (जैसा कि एक सतत यादृच्छिक चर में होता है जिसमें सख्ती से बढ़ती हुई सीडीएफ होती है)। ये मामले ऐसे मामले हैं जिनके बारे में ज्यादातर लोग जेड-टेस्ट और टी-टेस्ट की परवाह करते हैं, हालांकि एक द्विपद माध्य (उदाहरण के लिए) के परीक्षण के लिए ऐसा सीडीएफ नहीं है। ऊपर जो प्रदान किया गया है वह इन प्रतिबंधित मामलों के लिए मेरी आँखों के लिए सही लगता है।

यदि अशक्त परिकल्पना समग्र हैं तो चीजें थोड़ी अधिक जटिल होती हैं। इस तथ्य का सबसे सामान्य प्रमाण मैंने देखा है कि रिहाइमन क्षेत्रों के संबंध में कुछ मान्यताओं का उपयोग करते हुए लेहमैन और रोमनो के "टेस्टिंग स्टेटिसिटिकल हाइपोथेसिस" पृष्ठ 63-64 में दिए गए हैं। मैं नीचे दिए गए तर्क को पुन: पेश करने की कोशिश करूंगा ...

हम एक परीक्षण परिकल्पना के आधार पर एक वैकल्पिक परिकल्पना H 1 बनाम एक शून्य परिकल्पना H0 परीक्षण करते हैं, जिसे हम यादृच्छिक चर X के रूप में निरूपित करेंगे । परीक्षण आंकड़ा कुछ पैरामीट्रिक वर्ग, यानी, से आने के लिए माना जाता है एक्स ~ पी θ , जहां पी θ संभाव्यता वितरण के परिवार का एक तत्व है पी{ पी θ | θ Θ } , और Θ एक पैरामीटर जगह नहीं है। शून्य परिकल्पना H 0 : esis esis esis 0H1XXPθPθP{PθθΘ}ΘH0:θΘ0और वैकल्पिक परिकल्पना H1:θΘ1 के विभाजन के रूप में Θ कि में

Θ=Θ0Θ1
जहां
Θ0Θ1=.

परीक्षण के परिणाम निरूपित किया जा सकता है

ϕα(X)=1Rα(X)
जहां के लिए किसी भी सेट S हम परिभाषित
1S(X)={1,XS,0,XS.
यहाँ α हमारा महत्व स्तर है, और Rα महत्व स्तर α के लिए परीक्षण के अस्वीकृति क्षेत्र को दर्शाता है ।α

RαRα
α<αα
p^=p^(X)inf{αXRα},
XH0

XPθθΘH0:θΘ0Rα

  1. supθΘ0Pθ(XRα)α0<α<1θΘ0

    Pθ(p^u)ufor all0u1.

  2. θΘ0Pθ(XRα)=α0<α<1θΘ0

    Pθ(p^u)=ufor all0u1.

uu

प्रमाण इस प्रकार है:

  1. θΘ0supθΘ0Pθ(XRα)α0<α<1p^{p^u}{XRv}u<vPθ(p^u)Pθ(XRv)vu<vvuPθ(p^u)u

  2. θΘ0Pθ(XRα)=α0<α<1{XRu}{p^(X)u}u=Pθ(XRu)Pθ(p^u)Pθ(p^(X)u)=u

XBinom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(XRα)=ααθ=0.5Pr(XRα)=1/1024α


स्पष्ट करना चाहिए कि लेहमैन और रोमानो में प्रदान की जाने वाली सामान्यता सामान्य अस्वीकृति क्षेत्रों के लिए है। अभी भी आपके पास समग्र नल और गैर-निरंतर परीक्षण आँकड़ों के लिए "मान्य" पी-मान हैं।
अदम

-12

यदि पी मानों को समान रूप से H0 के तहत वितरित किया जाता है, जिसका अर्थ है कि यह .0 के पी-मान के रूप में .05 के पी-मूल्य को देखने की संभावना है, लेकिन यह सच नहीं है, क्योंकि यह पी का निरीक्षण करने की संभावना कम है- .05 के p- मान की तुलना में .05 का मान, क्योंकि यह सामान्य वितरण की परिभाषा है जिससे पी-मूल्य लिया जाता है। परिभाषा के अनुसार, इसके बाहर सामान्यता की सीमा में अधिक नमूने गिरेंगे। इसलिए, छोटे लोगों की तुलना में बड़े पी-मान मिलने की अधिक संभावना है।


3
-1। यह पूरी तरह से गलत है। मुझे आश्चर्य है कि यह किसने उखाड़ा। बिंदु H0 के तहत पी-मान समान रूप से वितरित किए जाते हैं।
अमीबा

1
-1। यह गलत होने का पर्याप्त अर्थ भी नहीं देता है: "सामान्यता की सीमा" अर्थहीन है और पी-मानों का स्वाभाविक रूप से पहली जगह में सामान्य वितरण के साथ कोई लेना-देना नहीं है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.