(अक्सर) बूटस्ट्रैप डेटा को अज्ञात जनसंख्या वितरण के लिए एक उचित सन्निकटन के रूप में लेता है। इसलिए, सांख्यिकी के वितरण (डेटा का एक फंक्शन) को बार-बार बदलने और प्रत्येक नमूने के लिए स्टेटिस्टिक की गणना करने के साथ टिप्पणियों को फिर से नमूना करके अनुमानित किया जा सकता है।
चलो मूल डेटा को निरूपित करते हैं। (दिए गए उदाहरण में, n = 5। ) y b = ( y b 1 , … , y b n ) एक बूटस्ट्रैप नमूने को दर्शाते हैं। इस तरह के नमूने की संभावना है कि एक या अधिक बार दोहराए गए कुछ अवलोकन होंगे और अन्य अवलोकन अनुपस्थित होंगे। बूटस्ट्रैप नमूने का अर्थ m b = 1 द्वारा दिया गया हैy=(y1,…,yn)n=5yb=(yb1,…,ybn)
mb=1n∑i=1nybi.
यह का वितरण है
बूटस्ट्रैप अनुकरण कि अज्ञात आबादी से नमूना वितरण अनुमान लगाने के लिए प्रयोग किया जाता है की एक संख्या से अधिक।
mb
बार-बार बूटस्ट्रैप और बेयसियन बूटस्ट्रैप के बीच संबंध को समझने के लिए, यह देखने के लिए शिक्षाप्रद है कि एक अलग दृष्टिकोण से गणना कैसे करें ।mb
प्रत्येक बूटस्ट्रैप नमूना , प्रत्येक अवलोकन y मैं 0 से n समय तक कहीं भी होता है । चलो ज ख मैं समय की संख्या को निरूपित y मैं में होता है y ख , और ज ख = ( ज ख 1 , ... , ज ख n ) । इस प्रकार ज ख मैं ∈ { 0 , 1 , ... , n - 1 , n }ybyinhbiyiybhb=(hb1,…,hbn)hbi∈{0,1,…,n−1,n}और । H b को देखते हुए , हम nonnegative वेट के एक संग्रह का निर्माण कर सकते हैं जो एक राशि: w b = h b / n , जहाँ w b i = h b i / n है । इस अंकन के साथ हम के रूप में बूटस्ट्रैप नमूना की औसत reexpress कर सकते हैं
मीटर ख = n Σ मैं = 1 w ख मैं∑ni=1hbi=nhbwb=hb/nwbi=hbi/n
mb=∑i=1nwbiyi.
जिस तरह से बूटस्ट्रैप नमूने के लिए टिप्पणियों को चुना जाता है, वह लिए संयुक्त वितरण को निर्धारित करता है । विशेष रूप से, एच बी में एक बहुराष्ट्रीय वितरण है और इस प्रकार ( एनwbhbइसलिए, हमइसके वितरण से डब्ल्यू बी ड्राइंग करकेऔर वाई के साथ डॉट उत्पाद कीगणनाकरके एम बी की गणना कर सकते हैं। इस नए दृष्टिकोण से, ऐसा प्रतीत होता है कि अवलोकननिश्चित हैंजबकि भार भिन्न हो रहे हैं।
(nwb)∼Multinomial(n,(1/n)ni=1).
mbwby
बायेसियन निष्कर्ष में, अवलोकन वास्तव में तय किए गए हैं, इसलिए यह नया दृष्टिकोण बायेसियन दृष्टिकोण के लिए जन्मजात लगता है। वास्तव में, बायेसियन बूटस्ट्रैप के अनुसार माध्य की गणना केवल भार के वितरण में भिन्न होती है। (फिर भी, एक वैचारिक दृष्टिकोण से बायेसियन बूटस्ट्रैप लगातार संस्करण से काफी अलग है।) डेटा तय हो गया है और वजन w अज्ञात पैरामीटर हैं। हम कुछ में रुचि हो सकती कार्यात्मक : डेटा है कि अज्ञात मापदंडों पर निर्भर करता है की
μ = n Σ मैंyw
μ=∑i=1nwiyi.
यहाँ बायेसियन बूटस्ट्रैप के पीछे मॉडल का एक थंबनेल स्केच है: अवलोकनों के लिए नमूना वितरण बहुपद है और वज़न के लिए पूर्व एक सीमित Dirichlet वितरण है जो अपने सभी वजन को सिम्प्लेक्स के कोने पर रखता है। (कुछ लेखक इस मॉडल को बहुराष्ट्रीय संभावना मॉडल के रूप में संदर्भित करते हैं ।)
: इस मॉडल वजन के लिए निम्नलिखित पिछला वितरण का उत्पादन
(यह वितरण सिंप्लेक्स के ऊपर सपाट है।) वज़न (लगातार और बायेसियन) के लिए दो वितरण काफी समान हैं: उनके पास समान साधन और समान सहसंयोजक हैं। ड्यूरिलेट वितरण बहुराष्ट्रीय वितरण की तुलना में 'चिकना' है, इसलिए बेयसियन बूटस्ट्रैप को स्मूद बूटस्ट्रैप कहा जा सकता है। हम लगातार बूटस्ट्रैप की व्याख्या बायेसियन बूटस्ट्रैप के एक अनुमान के रूप में कर सकते हैं।
w∼Dirichlet(1,…,1).
वजन के लिए पिछला वितरण देखते हुए, हम कार्यात्मक का पिछला वितरण का अनुमान लगा सकता दोहराया नमूना द्वारा डब्ल्यू अपने Dirichlet वितरण से और साथ डॉट उत्पाद कंप्यूटिंग y ।μwy
हम के ढांचे के गोद ले सकते हैं का आकलन समीकरणों
∑i=1nwig(yi,θ)=0–,
g(yi,θ)θ0–θywwअनुभवजन्य संभावना और क्षणों (जीएमएम) की सामान्यीकृत विधि के साथ।
∑i=1nwi(yi−μ)=0.
θ=(μ,v)g(yi,θ)=(yi−μ(yi−μ)2−v).