मेरे पास एक कोर्स के लिए निम्नलिखित प्रश्न हैं:
मानक सामान्य बूटस्ट्रैप विश्वास अंतराल और बुनियादी बूटस्ट्रैप आत्मविश्वास अंतराल की कवरेज संभावनाओं का अनुमान लगाने के लिए एक मोंटे कार्लो अध्ययन का संचालन करें। एक सामान्य आबादी से नमूना और नमूना मतलब के लिए अनुभवजन्य कवरेज दरों की जाँच करें।
सामान्य सामान्य बूटस्ट्रैप CI के लिए कवरेज संभावनाएं आसान हैं:
n = 1000;
alpha = c(0.025, 0.975);
x = rnorm(n, 0, 1);
mu = mean(x);
sqrt.n = sqrt(n);
LNorm = numeric(B);
UNorm = numeric(B);
for(j in 1:B)
{
smpl = x[sample(1:n, size = n, replace = TRUE)];
xbar = mean(smpl);
s = sd(smpl);
LNorm[j] = xbar + qnorm(alpha[1]) * (s / sqrt.n);
UNorm[j] = xbar + qnorm(alpha[2]) * (s / sqrt.n);
}
mean(LNorm < 0 & UNorm > 0); # Approximates to 0.95
# NOTE: it is not good enough to look at overall coverage
# Must compute separately for each tail
इस पाठ्यक्रम के लिए मुझे जो सिखाया गया है, उससे बुनियादी बूटस्ट्रैप विश्वास अंतराल की गणना इस तरह की जा सकती है:
# Using x from previous...
R = boot(data = x, R=1000, statistic = function(x, i){ mean(x[i]); });
result = 2 * mu - quantile(R$t, alpha, type=1);
यह समझ आता है। मुझे समझ में नहीं आता है कि बुनियादी बूटस्ट्रैप CI के लिए कवरेज संभावनाओं की गणना कैसे करें । मैं समझता हूं कि कवरेज संभावना उस समय की संख्या का प्रतिनिधित्व करेगी जिसमें CI का सही मूल्य (इस मामले में mu
) है। क्या मैं केवल boot
कई बार फ़ंक्शन चलाता हूं ?
मैं इस प्रश्न को अलग तरीके से कैसे बता सकता हूं?
smpl = x[sample(1:n, size = 100, replace = TRUE)];
सरलीकृत किया जा सकता है smpl = sample(x, size=100, replace=TRUE)
।
mu
0. एक ही होने के साथ सामान्य सीआई ठीक काम करता है, यह मूल बूटस्ट्रैप सीआई है जिसके साथ मुझे कठिनाई है।
size=100
टाइपो है? मुझे विश्वास नहीं है कि जब आप लूप में अपने CI की गणना करते हैं (जब से आपsqrt.n
गणना में उपयोग करते हैं) की गणना करने के बाद अंतर्निहित नमूना आकार 1000 प्रतीत होता है, तो आप सही ऊपरी और निचले सीमा प्राप्त कर रहे हैं । इसके अलावा, आपmu
0 की तुलना क्यों कर रहे हैं और सीधे नहीं कर रहे हैं (बाद वाला सही अर्थ है)?