यहाँ 1 जोड़ने के साथ यह चाल क्या है?

मैं इस पृष्ठ को Lillefors परीक्षण के मोंटे कार्लो कार्यान्वयन पर देख रहा था । मैं इस वाक्य को नहीं समझता:

सिमुलेशन से इस गणना में यादृच्छिक त्रुटि है। हालाँकि, P- मान की गणना में अंश और हर में 1 जोड़ने की चाल के कारण इसे यादृच्छिकता की परवाह किए बिना सीधे इस्तेमाल किया जा सकता है।

अंश और हर में 1 जोड़ने की चाल से उनका क्या अर्थ है?

कोड का प्रासंगिक टुकड़ा यहाँ है:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

monte-carlo lilliefors

— Aksakal
स्रोत

क्या आप यहां प्रासंगिक संदर्भ जोड़ सकते हैं?

— गूँज - मोनिका

संभावना के मोंटे कार्लो अनुमानक के लिए लाप्लास चौरसाई की तरह दिखता है, जो इसे 1/2 की ओर सिकोड़ता है; मुख्य प्रभाव शायद 0 के पी-मान प्राप्त करने से बचने के लिए है, जैसा कि @Tim ने उल्लेख किया है (हालांकि 0 से विभाजित होने का कोई जोखिम नहीं है क्योंकि उन्होंने कहा कि जब तक आप 0 सिमुलेशन नहीं कर रहे हैं)। मैं वास्तव में यह नहीं देखता कि यह आपको "यादृच्छिकता के संबंध के बिना" का उपयोग करने की अनुमति क्यों देता है।

— डगल

क्या आपने यह पूछने के लिए सीधे गेयर लिखा है कि वाक्य का क्या अर्थ है?

— एलेक्सिस

@ एलेक्सिस, नहीं, लेकिन यह एक अच्छा विचार है।

— अक्कल

@ डगल, हाँ, यह लाप्लास स्मूथिंग जैसा दिखता है। यह स्पष्ट नहीं है कि वह इसे यहां क्यों लागू कर रहा है।

— अक्कल

जवाबों:

संदर्भित पृष्ठ पर स्पष्टीकरण है

शून्य परिकल्पना के तहत प्रायिकता बिल्कुल जब डेटा में यादृच्छिकता और सिमुलेशन में यादृच्छिकता दोनों को ध्यान में रखा जाता है। $\Pr(P \le k / n_\text{sim})$ $k / n_\text{sim}$

इसे समझने के लिए, हमें कोड को देखना चाहिए, जिनमें से प्रमुख रेखाएं (काफी संक्षिप्त) हैं

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

मुख्य समस्या यह है कि कोड उद्धरण से मेल नहीं खाता है। हम उन्हें कैसे समेट सकते हैं? एक प्रयास उद्धरण के अंतिम आधे हिस्से से शुरू होता है। हम निम्नलिखित चरणों को शामिल करते हुए प्रक्रिया की व्याख्या कर सकते हैं:

स्वतंत्र रूप से और समान रूप से वितरित डेटा को कुछ प्रायिकता कानून अनुसार । संख्या का उत्पादन करने के लिए परीक्षण प्रक्रिया (कोड के रूप में कार्यान्वित ) लागू करें । $X_1, X_2, \ldots, X_n$ $G$ $t$ fred $T_0=t(X_1, \ldots, X_n)$
संभावना कानून साथ एक अशक्त परिकल्पना के अनुसार कंप्यूटर तुलनीय डेटासेट, प्रत्येक आकार माध्यम से उत्पन्न करें । नंबर का उत्पादन करने के लिए प्रत्येक ऐसे डेटासेट पर लागू करें । $N=n_\text{sim}$ $n$ $F$ $t$ $N$ $T_1,T_2,\ldots,T_N$
कंप्यूट
$P = (\sum_{i = 1}^{N} I (T_{i} > T_{0}) + 1) / (N + 1) .$ $P = \left(\sum_{i=1}^N I(T_i \gt T_0) + 1\right) / (N+1).$
( " " सूचक वेक्टर-मान तुलना द्वारा कार्यान्वित समारोह है कोड में।) दाहिने हाथ की ओर के आधार पर यादृच्छिक समझा जाता है एक साथ की अनियमितता (वास्तविक परीक्षण आंकड़ा) और की अनियमितता ( नकली परीक्षण आँकड़े)। $I$ d.star > d.hat $T_0$ $T_i$

यह कहना कि डेटा अशक्त परिकल्पना के अनुरूप है कि को मुखर करना है । एक परीक्षण आकार , । द्वारा दोनों पक्षों को गुणा करने और घटाकर से पता चलता है कि संभावना है कि किसी भी संख्या के लिए मौका है कि कोई तुलना में अधिक है का से अधिक । यह केवल यह कहता है कि सभी परीक्षण आँकड़ों के क्रमबद्ध सेट के शीर्ष के भीतर है । चूंकि (निर्माण से) $F=G$ $\alpha$ $0 \lt \alpha \lt 1$ $N+1$ $1$ $P\le \alpha$ $\alpha$ $(N+1)\alpha - 1$ $T_i$ $T_0$ $T_0$ $(N+1)\alpha$ $N+1$ $T_0$ सभी से स्वतंत्र है , जब एक निरंतर वितरण है , तो यह मौका पूर्णांक अंश द्वारा दर्शाए गए कुल का अंश होगा ; वह है, और यह इसके बराबर होगा जो प्रदान किया गया एक पूरी संख्या ; वह है, जब । $T_i$ $F$ $\lfloor (N+1)\alpha\rfloor$

Pr (P \leq α) = \frac{⌊ (N + 1) α ⌋}{N + 1} \approx α

$\Pr(P\le \alpha)=\frac{\lfloor(N+1)\alpha\rfloor}{N+1} \approx \alpha$

(N + 1) α

$(N+1)\alpha$

k

$k$

α = k / (N + 1)

$\alpha = k/(N+1)$

यह निश्चित रूप से उन चीजों में से एक है जिन्हें हम किसी भी मात्रा में सही होना चाहते हैं जिसे "पी-वैल्यू" कहा जाना चाहिए: यह पर एक समान वितरण होना चाहिए । बशर्ते काफी बड़ा हो, ताकि कोई भी फॉर्म के कुछ अंश के करीब हो , यह एक वर्दी के करीब होगा वितरण। (पी-वैल्यू के लिए आवश्यक अतिरिक्त स्थितियों के बारे में जानने के लिए, कृपया पी-वैल्यू के विषय पर पोस्ट किया गया संवाद पढ़ें । ) $[0,1]$ $N+1$ $\alpha$ $k/(N+1) = k/(n_\text{sim}+1)$ $P$

जाहिर है उद्धरण का उपयोग करना चाहिए " " के बदले " " यह जहाँ भी दिखाई देता है। $n_\text{sim}+1$ $n_\text{sim}$

— व्हीबर
स्रोत

मेरा मानना है कि यहां 1 को दोनों में जोड़ा गया है क्योंकि प्रेक्षित वितरण में संदर्भ सांख्यिकीय शामिल है; यदि यह मामला है, तो यह पी-मान की परिभाषा के "कम से कम बड़े" भाग के कारण है।

मुझे यकीन नहीं है क्योंकि पाठ कुछ अलग कह रहा है, लेकिन ऐसा लगता है कि मैं ऐसा क्यों करूंगा।

— Glen_b -Reinstate मोनिका
स्रोत

@ जब भी मैं देखूं कि मैं कैसे सहमत हो सकता हूं। सभी परीक्षण संभावना अनुपात परीक्षण नहीं हैं; जब वे LRTs नहीं होते हैं, तो क्या संभावना है कि संभावना अनुपात के संदर्भ में इसकी व्याख्या कर सकते हैं?

— Glen_b -Reinstate मोनिका

@ जब यह निश्चित रूप से कर सकता है। लेकिन विचार करें, उदाहरण के लिए, एक विलकॉक्सन-मैन-व्हिटनी (या वास्तव में, क्रमपरिवर्तन परीक्षण अधिक व्यापक रूप से)। व्यापक उपयोग में पूरी तरह से उचित परीक्षणों में से कोई भी संख्या है जो न तो एक Lilliefors परीक्षण और न ही एक संभावना अनुपात परीक्षण कर रहे हैं। जब कोई स्पष्ट विकल्प होता है कि किस शक्ति के खिलाफ वांछित है, तो अक्सर एक सार्थक परीक्षण सांख्यिकीय का निर्माण करना संभव होता है, जहां परीक्षण सांख्यिकीय द्वारा दिए गए नमूना स्थान पर क्रम सही अर्थ बनाता है और विकल्प की एक विस्तृत श्रृंखला में उचित गुण होते हैं।

— Glen_b -Reinstate मोनिका

निश्चित रूप से जब एक टेस्ट स्टैटिस्टिक के साथ आते हैं जो (अधिक चरम मूल्यों को लेने के अर्थ में, चाहे बड़ा हो, छोटा हो या दोनों) जिस तरह का विकल्प होता है, उसमें से एक में रुचि रखता है, "वैकल्पिक के प्रकार में रुचि रखता है" "- लेकिन यहां तक कि अगर कोई एक अनजाने (वास्तव में, यहां तक कि एक बेकार परीक्षण) का उपयोग कर रहा था, तो जिस सिद्धांत को मैं अपने जवाब में अनुकरणीय परिणामों में शामिल नमूने को शामिल करने की रूपरेखा तैयार करता हूं वह अभी भी लागू होगा। एक बार आपके पास ऑर्डर करने के बावजूद, भले ही यह सबसे अच्छा एक न हो, जब पी-मानों की गणना करते हैं, तो देखा गया मामला अभी भी गिनती में होगा।

— Glen_b -Reinstate मोनिका

@ जब तक हम अब तक अलग नहीं हो जाते। एक उचित परीक्षण आँकड़ा चुनने में हम निश्चित रूप से कुछ करना चाहते हैं । लेकिन एक बार जब हमारे पास एक परीक्षण आँकड़ा होता है (जैसा कि हमारे पास शून्य के नीचे अनुकरण करने के समय तक होना चाहिए), हम पहले ही ऐसा कर चुके हैं। और एक बार हमारे पास, यही कारण है कि हम पी-वैल्यू की हमारी गणना में देखे गए मामले को शामिल करेंगे, क्योंकि पी-वैल्यू क्या है।

— Glen_b -Reinstate मोनिका

मुझे नहीं लगता कि हमारे बीच कोई मतभेद है। (ध्यान दें कि मेरा स्वयं का उत्तर यह स्पष्ट करता है कि गिनती में देखे गए नमूने सहित उपयुक्त है।) मेरी टिप्पणी आपके प्रश्न के उत्तर में निर्देशित नहीं की गई थी (जिसके साथ मैं सहमत हूं और उत्तोलन किया गया था), लेकिन केवल समस्याग्रस्त वाक्यांश पर "कम से कम जितना बड़ा। " मैं इस साइट (और दूसरी जगहों) पर कई जगहों पर उस वाक्यांश का गलत अर्थ निकालता हूं जो मैं पाठकों का ध्यान आकर्षित करना चाहता था कि इसका वास्तव में क्या मतलब होना चाहिए ।

— whuber