मैं @ziggystar से सहमत हूं। बूटस्ट्रैप नमूनों की संख्या के रूप मेंकरेखीय मॉडल के अनन्तता, बैगेड अनुमान में परिवर्तित होता है, पूरे नमूने पर चलने वाले रैखिक मॉडल के OLS (साधारण जानवर वर्ग) का अनुमान लगाता है। यह साबित करने का तरीका यह है कि बूटस्ट्रैप "दिखावा" करता है कि जनसंख्या वितरण समान अनुभवजन्य वितरण है। जैसा कि आप इस अनुभवजन्य वितरण से अधिक से अधिक डेटा सेट का नमूना लेते हैं, अनुमानित हाइपरप्लेन का औसत ऑर्डिनरी लेस्टर वर्गों के स्पर्शोन्मुखी गुणों द्वारा "सच्चे हाइपरप्लेन" (जो पूरे डेटा पर ओएलएस अनुमान रन होता है) में परिवर्तित हो जाएगा।
इसके अलावा, बैगिंग हमेशा एक अच्छी बात नहीं है। इतना ही नहीं यह पूर्वाग्रह से नहीं लड़ता है, यह कुछ अजीबोगरीब मामलों में पूर्वाग्रह को बढ़ा सकता है । उदाहरण:
एक्स1, एक्स2, । । । , एक्सn~ बी ई ( पी )
(बर्नौली परीक्षण जो प्रायिकता के साथ मान 1 लेते हैं
पी और मान 0 संभावना के साथ
1 - पी)। इसके अलावा, हम पैरामीटर को परिभाषित करते हैं
θ = 1{ p > 0 }
और इसका अनुमान लगाने की कोशिश करें। स्वाभाविक रूप से, यह एक एकल डेटा बिंदु को देखने के लिए पर्याप्त है
एक्समैं= 1 इसको जानने के लिए
θ = 1। पूरे नमूने में ऐसा डेटा बिंदु हो सकता है और हमें अनुमान लगाने की अनुमति देता है
θबिना किसी त्रुटि के। दूसरी ओर, किसी भी बूटस्ट्रैप नमूने में ऐसा डेटा बिंदु नहीं हो सकता है और हमें गलत अनुमान लगाने के लिए प्रेरित कर सकता है
θ0 के साथ (हम यहाँ कोई बायेसियन फ्रेमवर्क नहीं अपनाते हैं, अधिकतम संभावना की पुरानी पुरानी विधि को पूरा करता है)। दूसरे शब्दों में,
B मैं एक एस b a g g i n g= पी आर ओ बी ( मैं n एक ख ओ ओ टी एस टी आर एक पी एस एक मीटर पी एल ई एक्स ( 1 )= = । । । = एक्स( एन )= 0 ) >0,
सशर्त
θ = 1।
a_0 + a_1 * x_1 + ... + a_d * x_d
, तो परिणामी औसतन रैखिक फ़ंक्शन (बूटस्ट्रैप एग्रीगेटिंग के बाद) में अभी भी वही रैखिक कार्यात्मक रूप होता है, जिसे आप शुरू करते हैं (यानी 'बेस लर्नर')।