मशीन लर्निंग शब्दजाल के संदर्भ में @ ज़िग्सिस्टार की प्रतिक्रिया: बूटस्ट्रैप एकत्रीकरण तकनीकों (जैसे रैंडम फ़ॉरेस्ट) के पीछे का विचार "यादृच्छिकता" या "अस्थिरता" के कुछ तत्व के साथ डेटा के लिए कई निम्न-पूर्वाग्रह, उच्च-विचरण मॉडल फिट करना है। यादृच्छिक जंगलों के मामले में, अस्थिरता बूटस्ट्रैपिंग के माध्यम से और पेड़ के प्रत्येक नोड को विभाजित करने के लिए सुविधाओं का एक यादृच्छिक सेट चुनकर जोड़ा जाता है। इन शोरगुल, लेकिन कम पूर्वाग्रह के कारण, पेड़ किसी भी व्यक्तिगत पेड़ के उच्च विचरण को कम करते हैं।
जबकि प्रतिगमन / वर्गीकरण पेड़ "कम-पूर्वाग्रह, उच्च-विचरण" मॉडल हैं, रैखिक प्रतिगमन मॉडल आमतौर पर विपरीत होते हैं - "उच्च-पूर्वाग्रह, कम-विचरण"। इस प्रकार, समस्या अक्सर रैखिक मॉडल के साथ सामना करती है, पूर्वाग्रह को कम कर रही है, विचरण को कम नहीं कर रही है। बूटस्ट्रैप एकत्रीकरण बस ऐसा करने के लिए नहीं बना है।
एक अतिरिक्त समस्या यह है कि बूटस्ट्रैपिंग एक ठेठ रैखिक मॉडल में पर्याप्त "यादृच्छिकता" या "अस्थिरता" प्रदान नहीं कर सकती है। मैं एक प्रतिगमन वृक्ष को बूटस्ट्रैप नमूनों की यादृच्छिकता के प्रति अधिक संवेदनशील होने की उम्मीद करूंगा, क्योंकि प्रत्येक पत्ती में आमतौर पर केवल एक मुट्ठी भर डेटा बिंदु होते हैं। इसके अलावा, प्रतिगमन पेड़ प्रत्येक नोड पर चर के यादृच्छिक सबसेट पर पेड़ को विभाजित करके stochastically उगाया जा सकता है। यह महत्वपूर्ण क्यों है के लिए यह पिछला प्रश्न देखें: रैंडम फ़ॉरेस्ट को m यादृच्छिक विशेषताओं के आधार पर क्यों विभाजित किया जाता है?
कहा जा रहा है कि सभी, आप निश्चित रूप से रैखिक मॉडल [लिंक] पर बूटस्ट्रैपिंग का उपयोग कर सकते हैं , और यह कुछ संदर्भों में बहुत सहायक हो सकता है। हालांकि, प्रेरणा बूटस्ट्रैप एकत्रीकरण तकनीकों से बहुत अलग है।
a_0 + a_1 * x_1 + ... + a_d * x_d
, तो परिणामी औसतन रैखिक फ़ंक्शन (बूटस्ट्रैप एग्रीगेटिंग के बाद) में अभी भी वही रैखिक कार्यात्मक रूप होता है, जिसे आप शुरू करते हैं (यानी 'बेस लर्नर')।