यहाँ 1 जोड़ने के साथ यह चाल क्या है?


11

मैं इस पृष्ठ को Lillefors परीक्षण के मोंटे कार्लो कार्यान्वयन पर देख रहा था । मैं इस वाक्य को नहीं समझता:

सिमुलेशन से इस गणना में यादृच्छिक त्रुटि है। हालाँकि, P- मान की गणना में अंश और हर में 1 जोड़ने की चाल के कारण इसे यादृच्छिकता की परवाह किए बिना सीधे इस्तेमाल किया जा सकता है।

अंश और हर में 1 जोड़ने की चाल से उनका क्या अर्थ है?

कोड का प्रासंगिक टुकड़ा यहाँ है:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

क्या आप यहां प्रासंगिक संदर्भ जोड़ सकते हैं?
गूँज - मोनिका

4
संभावना के मोंटे कार्लो अनुमानक के लिए लाप्लास चौरसाई की तरह दिखता है, जो इसे 1/2 की ओर सिकोड़ता है; मुख्य प्रभाव शायद 0 के पी-मान प्राप्त करने से बचने के लिए है, जैसा कि @Tim ने उल्लेख किया है (हालांकि 0 से विभाजित होने का कोई जोखिम नहीं है क्योंकि उन्होंने कहा कि जब तक आप 0 सिमुलेशन नहीं कर रहे हैं)। मैं वास्तव में यह नहीं देखता कि यह आपको "यादृच्छिकता के संबंध के बिना" का उपयोग करने की अनुमति क्यों देता है।
डगल

2
क्या आपने यह पूछने के लिए सीधे गेयर लिखा है कि वाक्य का क्या अर्थ है?
एलेक्सिस

@ एलेक्सिस, नहीं, लेकिन यह एक अच्छा विचार है।
अक्कल

@ डगल, हाँ, यह लाप्लास स्मूथिंग जैसा दिखता है। यह स्पष्ट नहीं है कि वह इसे यहां क्यों लागू कर रहा है।
अक्कल

जवाबों:


6

संदर्भित पृष्ठ पर स्पष्टीकरण है

शून्य परिकल्पना के तहत प्रायिकता बिल्कुल जब डेटा में यादृच्छिकता और सिमुलेशन में यादृच्छिकता दोनों को ध्यान में रखा जाता है।Pr(Pk/nsim)k/nsim

इसे समझने के लिए, हमें कोड को देखना चाहिए, जिनमें से प्रमुख रेखाएं (काफी संक्षिप्त) हैं

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

मुख्य समस्या यह है कि कोड उद्धरण से मेल नहीं खाता है। हम उन्हें कैसे समेट सकते हैं? एक प्रयास उद्धरण के अंतिम आधे हिस्से से शुरू होता है। हम निम्नलिखित चरणों को शामिल करते हुए प्रक्रिया की व्याख्या कर सकते हैं:

  1. स्वतंत्र रूप से और समान रूप से वितरित डेटा को कुछ प्रायिकता कानून अनुसार । संख्या का उत्पादन करने के लिए परीक्षण प्रक्रिया (कोड के रूप में कार्यान्वित ) लागू करें ।X1,X2,,XnGtfredT0=t(X1,,Xn)

  2. संभावना कानून साथ एक अशक्त परिकल्पना के अनुसार कंप्यूटर तुलनीय डेटासेट, प्रत्येक आकार माध्यम से उत्पन्न करें । नंबर का उत्पादन करने के लिए प्रत्येक ऐसे डेटासेट पर लागू करें ।N=nsimnFtNT1,T2,,TN

  3. कंप्यूट

    P=(i=1NI(Ti>T0)+1)/(N+1).

    ( " " सूचक वेक्टर-मान तुलना द्वारा कार्यान्वित समारोह है कोड में।) दाहिने हाथ की ओर के आधार पर यादृच्छिक समझा जाता है एक साथ की अनियमितता (वास्तविक परीक्षण आंकड़ा) और की अनियमितता ( नकली परीक्षण आँकड़े)। Id.star > d.hatT0Ti

यह कहना कि डेटा अशक्त परिकल्पना के अनुरूप है कि को मुखर करना है । एक परीक्षण आकार , । द्वारा दोनों पक्षों को गुणा करने और घटाकर से पता चलता है कि संभावना है कि किसी भी संख्या के लिए मौका है कि कोई तुलना में अधिक है का से अधिक यह केवल यह कहता है कि सभी परीक्षण आँकड़ों के क्रमबद्ध सेट के शीर्ष के भीतर है । चूंकि (निर्माण से)F=Gα0<α<1N+11Pαα(N+1)α1TiT0T0(N+1)αN+1T0सभी से स्वतंत्र है , जब एक निरंतर वितरण है , तो यह मौका पूर्णांक अंश द्वारा दर्शाए गए कुल का अंश होगा ; वह है, और यह इसके बराबर होगा जो प्रदान किया गया एक पूरी संख्या ; वह है, जब ।TiF(N+1)α

Pr(Pα)=(N+1)αN+1α
(N+1)αkα=k/(N+1)

यह निश्चित रूप से उन चीजों में से एक है जिन्हें हम किसी भी मात्रा में सही होना चाहते हैं जिसे "पी-वैल्यू" कहा जाना चाहिए: यह पर एक समान वितरण होना चाहिए । बशर्ते काफी बड़ा हो, ताकि कोई भी फॉर्म के कुछ अंश के करीब हो , यह एक वर्दी के करीब होगा वितरण। (पी-वैल्यू के लिए आवश्यक अतिरिक्त स्थितियों के बारे में जानने के लिए, कृपया पी-वैल्यू के विषय पर पोस्ट किया गया संवाद पढ़ें )[0,1]N+1αk/(N+1)=k/(nsim+1)P

जाहिर है उद्धरण का उपयोग करना चाहिए " " के बदले " " यह जहाँ भी दिखाई देता है।nsim+1nsim


5

मेरा मानना ​​है कि यहां 1 को दोनों में जोड़ा गया है क्योंकि प्रेक्षित वितरण में संदर्भ सांख्यिकीय शामिल है; यदि यह मामला है, तो यह पी-मान की परिभाषा के "कम से कम बड़े" भाग के कारण है।

मुझे यकीन नहीं है क्योंकि पाठ कुछ अलग कह रहा है, लेकिन ऐसा लगता है कि मैं ऐसा क्यों करूंगा।


1
@ जब भी मैं देखूं कि मैं कैसे सहमत हो सकता हूं। सभी परीक्षण संभावना अनुपात परीक्षण नहीं हैं; जब वे LRTs नहीं होते हैं, तो क्या संभावना है कि संभावना अनुपात के संदर्भ में इसकी व्याख्या कर सकते हैं?
Glen_b -Reinstate मोनिका

1
@ जब यह निश्चित रूप से कर सकता है। लेकिन विचार करें, उदाहरण के लिए, एक विलकॉक्सन-मैन-व्हिटनी (या वास्तव में, क्रमपरिवर्तन परीक्षण अधिक व्यापक रूप से)। व्यापक उपयोग में पूरी तरह से उचित परीक्षणों में से कोई भी संख्या है जो न तो एक Lilliefors परीक्षण और न ही एक संभावना अनुपात परीक्षण कर रहे हैं। जब कोई स्पष्ट विकल्प होता है कि किस शक्ति के खिलाफ वांछित है, तो अक्सर एक सार्थक परीक्षण सांख्यिकीय का निर्माण करना संभव होता है, जहां परीक्षण सांख्यिकीय द्वारा दिए गए नमूना स्थान पर क्रम सही अर्थ बनाता है और विकल्प की एक विस्तृत श्रृंखला में उचित गुण होते हैं।
Glen_b -Reinstate मोनिका

1
निश्चित रूप से जब एक टेस्ट स्टैटिस्टिक के साथ आते हैं जो (अधिक चरम मूल्यों को लेने के अर्थ में, चाहे बड़ा हो, छोटा हो या दोनों) जिस तरह का विकल्प होता है, उसमें से एक में रुचि रखता है, "वैकल्पिक के प्रकार में रुचि रखता है" "- लेकिन यहां तक ​​कि अगर कोई एक अनजाने (वास्तव में, यहां तक ​​कि एक बेकार परीक्षण) का उपयोग कर रहा था, तो जिस सिद्धांत को मैं अपने जवाब में अनुकरणीय परिणामों में शामिल नमूने को शामिल करने की रूपरेखा तैयार करता हूं वह अभी भी लागू होगा। एक बार आपके पास ऑर्डर करने के बावजूद, भले ही यह सबसे अच्छा एक न हो, जब पी-मानों की गणना करते हैं, तो देखा गया मामला अभी भी गिनती में होगा।
Glen_b -Reinstate मोनिका

2
@ जब तक हम अब तक अलग नहीं हो जाते। एक उचित परीक्षण आँकड़ा चुनने में हम निश्चित रूप से कुछ करना चाहते हैं । लेकिन एक बार जब हमारे पास एक परीक्षण आँकड़ा होता है (जैसा कि हमारे पास शून्य के नीचे अनुकरण करने के समय तक होना चाहिए), हम पहले ही ऐसा कर चुके हैं। और एक बार हमारे पास, यही कारण है कि हम पी-वैल्यू की हमारी गणना में देखे गए मामले को शामिल करेंगे, क्योंकि पी-वैल्यू क्या है।
Glen_b -Reinstate मोनिका

1
मुझे नहीं लगता कि हमारे बीच कोई मतभेद है। (ध्यान दें कि मेरा स्वयं का उत्तर यह स्पष्ट करता है कि गिनती में देखे गए नमूने सहित उपयुक्त है।) मेरी टिप्पणी आपके प्रश्न के उत्तर में निर्देशित नहीं की गई थी (जिसके साथ मैं सहमत हूं और उत्तोलन किया गया था), लेकिन केवल समस्याग्रस्त वाक्यांश पर "कम से कम जितना बड़ा। " मैं इस साइट (और दूसरी जगहों) पर कई जगहों पर उस वाक्यांश का गलत अर्थ निकालता हूं जो मैं पाठकों का ध्यान आकर्षित करना चाहता था कि इसका वास्तव में क्या मतलब होना चाहिए ।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.