जिन चीजों की 0 संभावना होने की संभावना है, उनके बारे में एक अस्पष्ट दार्शनिक चर्चा करना मुश्किल है। इसलिए मैं आपको कुछ उदाहरण दिखाऊंगा जो आपके प्रश्न से संबंधित हैं।
यदि आपके पास समान वितरण से दो विशाल स्वतंत्र नमूने हैं, तो दोनों नमूनों में अभी भी कुछ परिवर्तनशीलता होगी, पूल किए गए 2-नमूना टी स्टेटिस्टिक पास होंगे, लेकिन बिल्कुल 0 नहीं , पी-मान को रूप में वितरित किया जाएगा
और 95% विश्वास अंतराल बहुत ही कम और पास केंद्रित होगाUnif(0,1),0.
इस तरह के डेटासेट और टी टेस्ट का एक उदाहरण:
set.seed(902)
x1 = rnorm(10^5, 100, 15)
x2 = rnorm(10^5, 100, 15)
t.test(x1, x2, var.eq=T)
Two Sample t-test
data: x1 and x2
t = -0.41372, df = 2e+05, p-value = 0.6791
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1591659 0.1036827
sample estimates:
mean of x mean of y
99.96403 99.99177
यहाँ 10,000 ऐसी स्थितियों से संक्षेप में परिणाम दिए गए हैं। सबसे पहले, पी-मूल्यों का वितरण।
set.seed(2019)
pv = replicate(10^4,
t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$p.val)
mean(pv)
[1] 0.5007066 # aprx 1/2
hist(pv, prob=T, col="skyblue2", main="Simulated P-values")
curve(dunif(x), add=T, col="red", lwd=2, n=10001)
अगला परीक्षण आँकड़ा:
set.seed(2019) # same seed as above, so same 10^4 datasets
st = replicate(10^4,
t.test(rnorm(10^5,100,15),rnorm(10^5,100,15),var.eq=T)$stat)
mean(st)
[1] 0.002810332 # aprx 0
hist(st, prob=T, col="skyblue2", main="Simulated P-values")
curve(dt(x, df=2e+05), add=T, col="red", lwd=2, n=10001)
और इसलिए सीआई की चौड़ाई के लिए।
set.seed(2019)
w.ci = replicate(10^4,
diff(t.test(rnorm(10^5,100,15),
rnorm(10^5,100,15),var.eq=T)$conf.int))
mean(w.ci)
[1] 0.2629603
निरंतर डेटा के साथ एक सटीक परीक्षण करने वाली एकता का पी-मूल्य प्राप्त करना लगभग असंभव है, जहां धारणाएं पूरी होती हैं। इतना तो है, कि एक बुद्धिमान सांख्यिकीविद् विचार करेगा कि 1 के पी-मूल्य को देखकर क्या गलत हुआ है।
उदाहरण के लिए, आप सॉफ़्टवेयर को दो समान बड़े नमूने दे सकते हैं। प्रोग्रामिंग इस तरह से होगी जैसे कि ये दो स्वतंत्र नमूने हैं, और अजीब परिणाम देते हैं। लेकिन तब भी CI 0 चौड़ाई का नहीं होगा।
set.seed(902)
x1 = rnorm(10^5, 100, 15)
x2 = x1
t.test(x1, x2, var.eq=T)
Two Sample t-test
data: x1 and x2
t = 0, df = 2e+05, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.1316593 0.1316593
sample estimates:
mean of x mean of y
99.96403 99.96403