संदर्भित पृष्ठ पर स्पष्टीकरण है
शून्य परिकल्पना के तहत प्रायिकता बिल्कुल जब डेटा में यादृच्छिकता और सिमुलेशन में यादृच्छिकता दोनों को ध्यान में रखा जाता है।Pr(P≤k/nsim)k/nsim
इसे समझने के लिए, हमें कोड को देखना चाहिए, जिनमें से प्रमुख रेखाएं (काफी संक्षिप्त) हैं
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
मुख्य समस्या यह है कि कोड उद्धरण से मेल नहीं खाता है। हम उन्हें कैसे समेट सकते हैं? एक प्रयास उद्धरण के अंतिम आधे हिस्से से शुरू होता है। हम निम्नलिखित चरणों को शामिल करते हुए प्रक्रिया की व्याख्या कर सकते हैं:
स्वतंत्र रूप से और समान रूप से वितरित डेटा को कुछ प्रायिकता कानून अनुसार । संख्या का उत्पादन करने के लिए परीक्षण प्रक्रिया (कोड के रूप में कार्यान्वित ) लागू करें ।X1,X2,…,XnGtfredT0=t(X1,…,Xn)
संभावना कानून साथ एक अशक्त परिकल्पना के अनुसार कंप्यूटर तुलनीय डेटासेट, प्रत्येक आकार माध्यम से उत्पन्न करें । नंबर का उत्पादन करने के लिए प्रत्येक ऐसे डेटासेट पर लागू करें ।N=nsimnFtNT1,T2,…,TN
कंप्यूट
P=(∑i=1NI(Ti>T0)+1)/(N+1).
( " " सूचक वेक्टर-मान तुलना द्वारा कार्यान्वित समारोह है कोड में।) दाहिने हाथ की ओर के आधार पर यादृच्छिक समझा जाता है एक साथ की अनियमितता (वास्तविक परीक्षण आंकड़ा) और की अनियमितता ( नकली परीक्षण आँकड़े)। Id.star > d.hatT0Ti
यह कहना कि डेटा अशक्त परिकल्पना के अनुरूप है कि को मुखर करना है । एक परीक्षण आकार , । द्वारा दोनों पक्षों को गुणा करने और घटाकर से पता चलता है कि संभावना है कि किसी भी संख्या के लिए मौका है कि कोई तुलना में अधिक है का से अधिक । यह केवल यह कहता है कि सभी परीक्षण आँकड़ों के क्रमबद्ध सेट के शीर्ष के भीतर है । चूंकि (निर्माण से)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0सभी से स्वतंत्र है , जब एक निरंतर वितरण है , तो यह मौका पूर्णांक अंश द्वारा दर्शाए गए कुल का अंश होगा ; वह है, और यह इसके बराबर होगा जो प्रदान किया गया एक पूरी संख्या ; वह है, जब ।TiF⌊(N+1)α⌋
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
यह निश्चित रूप से उन चीजों में से एक है जिन्हें हम किसी भी मात्रा में सही होना चाहते हैं जिसे "पी-वैल्यू" कहा जाना चाहिए: यह पर एक समान वितरण होना चाहिए । बशर्ते काफी बड़ा हो, ताकि कोई भी फॉर्म के कुछ अंश के करीब हो , यह एक वर्दी के करीब होगा वितरण। (पी-वैल्यू के लिए आवश्यक अतिरिक्त स्थितियों के बारे में जानने के लिए, कृपया पी-वैल्यू के विषय पर पोस्ट किया गया संवाद पढ़ें । )[0,1]N+1αk/(N+1)=k/(nsim+1)P
जाहिर है उद्धरण का उपयोग करना चाहिए " " के बदले " " यह जहाँ भी दिखाई देता है।nsim+1nsim