विश्लेषण
क्योंकि यह एक वैचारिक प्रश्न है, सादगी के लिए आइए उस स्थिति पर विचार करें, जिसमें आत्मविश्वास अंतराल का उपयोग मीन जाता है। यादृच्छिक नमूना आकार और दूसरा यादृच्छिक नमूना आकार से लिया जाता है , सभी एक ही सामान्य वितरण से। (यदि आप चाहें, तो आप छात्र को स्वतंत्रता के डिग्री के वितरण से मूल्यों द्वारा जगह ले सकते हैं ; निम्नलिखित विश्लेषण नहीं बदलेगा।)[ ˉ x ( 1 ) + Z α / 2 s ( 1 ) / ˉ1−αμएक्स(1)एनएक्स(2)मीटर(μ,σ2)जेडटीएन-1
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1)nx(2)m(μ,σ2)Ztn−1
मौका है कि पहले से निर्धारित सीआई के भीतर दूसरे नमूने का मतलब है
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
क्योंकि पहला नमूना माध्य पहले नमूने मानक विचलन से स्वतंत्र है (यह सामान्यता की आवश्यकता है) और दूसरा नमूना पहले से स्वतंत्र है, नमूना में अंतर का मतलब है से स्वतंत्र है । इसके अलावा, इस सममित अंतराल के लिए । इसलिए, रैंडम वेरिएबल लिए लिखना और दोनों असमानताओं को समझना, प्रश्न में संभावना समान हैx¯(1)s(1)U=x¯(2)−x¯(1)s(1)Zα/2=−Z1−α/2Ss(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
अपेक्षा के कानूनों का अर्थ है कि का मतलब और इसमें भिन्नता हैU0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
चूंकि सामान्य चर का एक रैखिक संयोजन है, इसलिए इसका एक सामान्य वितरण भी है। इसलिए है टाइम्स a चर। हम पहले से ही जानते थे कि is बार a चर। नतीजतन, है बार एक साथ एक चर वितरण। F वितरण द्वारा आवश्यक संभाव्यता दी गई हैUU2σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)
F1,n−1(Z21−α/21+n/m).(1)
विचार-विमर्श
एक दिलचस्प मामला तब है जब दूसरा नमूना पहले के समान आकार है, इसलिए और केवल और संभावना को निर्धारित करते हैं। यहाँ लिए विरुद्ध प्लॉट किए गए मान हैं ।n/m=1nα(1)αn=2,5,20,50
ग्राफ़ रूप में प्रत्येक पर एक सीमित मूल्य तक बढ़ जाता है। पारंपरिक परीक्षण आकार एक ऊर्ध्वाधर ग्रे लाइन द्वारा चिह्नित है। के बड़े-बड़े मूल्यों के लिए, लिए सीमित मौका लगभग ।αnα=0.05n=mα=0.0585%
इस सीमा को समझने से, हम छोटे नमूना आकारों के विवरणों को याद करेंगे और मामले के क्रूस को बेहतर ढंग से समझेंगे। जैसे ही बड़ा होता है, वितरण a वितरण के पास पहुंचता है । मानक सामान्य वितरण संदर्भ में , संभावना तब अनुमानित होती हैn=mFχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
उदाहरण के लिए, , और । नतीजतन पर घटता द्वारा प्राप्त सीमित मूल्य के रूप में बढ़ जाती हो जाएगा । आप देख सकते हैं कि यह लगभग तक पहुँच गया है (जहाँ मौका ।)α=0.05Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
छोटे , और पूरक संभावना के बीच संबंध - जोखिम जो सीआई दूसरे मतलब को कवर नहीं करता है - लगभग पूरी तरह से एक बिजली कानून है। αα इसे व्यक्त करने का एक और तरीका यह है कि लॉग सप्लीमेंटरी प्रायिकता का एक रैखिक कार्य है । सीमित संबंध लगभग हैlogα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
दूसरे शब्दों में, बड़े और कहीं भी के पारंपरिक मूल्य के पास , करीब होगाn=mα0.05(1)
1−0.166(20α)0.557.
(यह मुझे /stats//a/18259/919 पर पोस्ट किए गए अतिव्याप्त विश्वास अंतराल के विश्लेषण की बहुत याद दिलाता है । वास्तव में, वहाँ जादू की शक्ति, , जादू शक्ति के लगभग पारस्परिक है। यहाँ, । इस बिंदु पर आपको प्रयोगों के प्रतिलिपि प्रस्तुत करने की क्षमता के संदर्भ में उस विश्लेषण को फिर से व्याख्या करने में सक्षम होना चाहिए।)1.910.557
प्रयोगात्मक परिणाम
इन परिणामों की पुष्टि एक सीधे अनुकरण के साथ की जाती है। निम्नलिखित R
कोड कवरेज की आवृत्ति, साथ गणना किए गए अवसर , और एक जेड-स्कोर का आकलन करता है कि वे कितने भिन्न हैं। Z- स्कोर आमतौर पर (या यहां तक कि या CI की गणना होती है) की परवाह किए बिना आकार में से कम होता है , सूत्र की शुद्धता का संकेत देता है ।(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))