संदर्भित पृष्ठ पर स्पष्टीकरण है
शून्य परिकल्पना के तहत प्रायिकता बिल्कुल जब डेटा में यादृच्छिकता और सिमुलेशन में यादृच्छिकता दोनों को ध्यान में रखा जाता है।Pr(P≤k/nsim)k/nsim
इसे समझने के लिए, हमें कोड को देखना चाहिए, जिनमें से प्रमुख रेखाएं (काफी संक्षिप्त) हैं
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
मुख्य समस्या यह है कि कोड उद्धरण से मेल नहीं खाता है। हम उन्हें कैसे समेट सकते हैं? एक प्रयास उद्धरण के अंतिम आधे हिस्से से शुरू होता है। हम निम्नलिखित चरणों को शामिल करते हुए प्रक्रिया की व्याख्या कर सकते हैं:
स्वतंत्र रूप से और समान रूप से वितरित डेटा को कुछ प्रायिकता कानून अनुसार । संख्या का उत्पादन करने के लिए परीक्षण प्रक्रिया (कोड के रूप में कार्यान्वित ) लागू करें ।X1,X2,…,XnGtfred
T0=t(X1,…,Xn)
संभावना कानून साथ एक अशक्त परिकल्पना के अनुसार कंप्यूटर तुलनीय डेटासेट, प्रत्येक आकार माध्यम से उत्पन्न करें । नंबर का उत्पादन करने के लिए प्रत्येक ऐसे डेटासेट पर लागू करें ।N=nsimnFtNT1,T2,…,TN
कंप्यूट
P=(∑i=1NI(Ti>T0)+1)/(N+1).
( " " सूचक वेक्टर-मान तुलना द्वारा कार्यान्वित समारोह है कोड में।) दाहिने हाथ की ओर के आधार पर यादृच्छिक समझा जाता है एक साथ की अनियमितता (वास्तविक परीक्षण आंकड़ा) और की अनियमितता ( नकली परीक्षण आँकड़े)। Id.star > d.hat
T0Ti
यह कहना कि डेटा अशक्त परिकल्पना के अनुरूप है कि को मुखर करना है । एक परीक्षण आकार , । द्वारा दोनों पक्षों को गुणा करने और घटाकर से पता चलता है कि संभावना है कि किसी भी संख्या के लिए मौका है कि कोई तुलना में अधिक है का से अधिक । यह केवल यह कहता है कि सभी परीक्षण आँकड़ों के क्रमबद्ध सेट के शीर्ष के भीतर है । चूंकि (निर्माण से)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0सभी से स्वतंत्र है , जब एक निरंतर वितरण है , तो यह मौका पूर्णांक अंश द्वारा दर्शाए गए कुल का अंश होगा ; वह है, और यह इसके बराबर होगा जो प्रदान किया गया एक पूरी संख्या ; वह है, जब ।TiF⌊(N+1)α⌋
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
यह निश्चित रूप से उन चीजों में से एक है जिन्हें हम किसी भी मात्रा में सही होना चाहते हैं जिसे "पी-वैल्यू" कहा जाना चाहिए: यह पर एक समान वितरण होना चाहिए । बशर्ते काफी बड़ा हो, ताकि कोई भी फॉर्म के कुछ अंश के करीब हो , यह एक वर्दी के करीब होगा वितरण। (पी-वैल्यू के लिए आवश्यक अतिरिक्त स्थितियों के बारे में जानने के लिए, कृपया पी-वैल्यू के विषय पर पोस्ट किया गया संवाद पढ़ें । )[0,1]N+1αk/(N+1)=k/(nsim+1)P
जाहिर है उद्धरण का उपयोग करना चाहिए " " के बदले " " यह जहाँ भी दिखाई देता है।nsim+1nsim