बस एक और संस्करण जो कुछ हद तक सरलीकृत है, लेकिन मुझे लगता है bootकि पुस्तकालय का उपयोग किए बिना स्पष्ट रूप से संदेश वितरित करें जो कुछ लोगों को वाक्यविन्यास के उपयोग के साथ भ्रमित कर सकता है।
हमारे पास एक रैखिक मॉडल है: y= एक्सβ+ ϵ, ε ~ एन( 0 ,σ2)
निम्नलिखित उस रैखिक मॉडल के लिए एक पैरामीट्रिक बूटस्ट्रैप है, जिसका अर्थ है कि हम अपने मूल डेटा को फिर से नहीं बनाते हैं लेकिन वास्तव में हम अपने फिट किए गए मॉडल से नया डेटा उत्पन्न करते हैं। इसके अतिरिक्त, हम मानते हैं कि प्रतिगमन गुणांक का बूटस्ट्रैप्ड वितरणβसममित है और वह अनुवाद अपरिवर्तनीय है। (बहुत मोटे तौर पर बोलना कि हम इसके गुणों को प्रभावित करने के साथ इसकी धुरी को स्थानांतरित कर सकते हैं) इसके पीछे का विचार यह है कि इसमें उतार-चढ़ावβ के कारण हैं εऔर इसलिए पर्याप्त नमूनों के साथ उन्हें सही वितरण का एक अच्छा अनुमान प्रदान करना चाहिएβ'है। जैसा कि पहले हम फिर से परीक्षण करते हैंएच0: 0 =βजेऔर हमने अपने पी-मानों को "संभाव्यता के रूप में परिभाषित किया है, डेटा की संभाव्यता वितरण के लिए एक अशक्त परिकल्पना दी है, कि परिणाम अवलोकन परिणाम की तरह चरम या अधिक चरम होगा," (जहां इस मामले में देखे गए परिणाम हैं) हैंβहम अपने मूल मॉडल के लिए मिल गए)। तो यहाँ जाता है:
# Sample Size
N <- 2^12;
# Linear Model to Boostrap
Model2Boot <- lm( mpg ~ wt + disp, mtcars)
# Values of the model coefficients
Betas <- coefficients(Model2Boot)
# Number of coefficents to test against
M <- length(Betas)
# Matrix of M columns to hold Bootstraping results
BtStrpRes <- matrix( rep(0,M*N), ncol=M)
for (i in 1:N) {
# Simulate data N times from the model we assume be true
# and save the resulting coefficient in the i-th row of BtStrpRes
BtStrpRes[i,] <-coefficients(lm(unlist(simulate(Model2Boot)) ~wt + disp, mtcars))
}
#Get the p-values for coefficient
P_val1 <-mean( abs(BtStrpRes[,1] - mean(BtStrpRes[,1]) )> abs( Betas[1]))
P_val2 <-mean( abs(BtStrpRes[,2] - mean(BtStrpRes[,2]) )> abs( Betas[2]))
P_val3 <-mean( abs(BtStrpRes[,3] - mean(BtStrpRes[,3]) )> abs( Betas[3]))
#and some parametric bootstrap confidence intervals (2.5%, 97.5%)
ConfInt1 <- quantile(BtStrpRes[,1], c(.025, 0.975))
ConfInt2 <- quantile(BtStrpRes[,2], c(.025, 0.975))
ConfInt3 <- quantile(BtStrpRes[,3], c(.025, 0.975))
जैसा कि पूरे विचार में बताया गया है कि आपके पास वितरण का बूटस्ट्रैप है βउनके सच एक अनुमान है। (स्पष्ट रूप से यह कोड गति के लिए लेकिन पठनीयता के लिए अनुकूलित है। :))