यदि हम पूर्ण विकसित निर्णय वृक्ष (यानी एक अप्रत्याशित निर्णय वृक्ष) पर विचार करते हैं तो इसमें उच्च विचरण और निम्न पूर्वाग्रह होते हैं।
बैगिंग और रैंडम फ़ॉरेस्ट इन उच्च विचरण मॉडल का उपयोग करते हैं और विचरण को कम करने के लिए उन्हें एकत्र करते हैं और इस प्रकार भविष्यवाणी सटीकता को बढ़ाते हैं। बैगिंग और रैंडम फ़ॉरेस्ट दोनों बूटस्ट्रैप नमूने का उपयोग करते हैं, और जैसा कि "सांख्यिकीय शिक्षा के तत्वों" में वर्णित है, यह एकल पेड़ में पूर्वाग्रह बढ़ाता है।
इसके अलावा, चूंकि रैंडम फ़ॉरेस्ट विधि प्रत्येक नोड पर विभाजित होने के लिए अनुमत चर को सीमित करती है, इसलिए एकल रैंडम फ़ॉरेस्ट ट्री के लिए पूर्वाग्रह और भी अधिक बढ़ जाता है।
इस प्रकार, भविष्यवाणी की सटीकता केवल तभी बढ़ जाती है, जब बैगिंग और रैंडम फ़ॉरेस्ट में एकल पेड़ों के पूर्वाग्रह में वृद्धि विचरण में कमी को "ओवरशाइन" नहीं करती है।
यह मुझे निम्नलिखित दो प्रश्नों की ओर ले जाता है: 1) मुझे पता है कि बूटस्ट्रैप नमूने के साथ, हम (लगभग हमेशा) बूटस्ट्रैप नमूने में कुछ समान अवलोकन करेंगे। लेकिन ऐसा क्यों होता है कि बगिंग / रैंडम फ़ॉरेस्ट में व्यक्तिगत पेड़ों के पूर्वाग्रह में वृद्धि हुई है? 2) इसके अलावा, प्रत्येक वनों में विभाजित करने के लिए उपलब्ध चर पर सीमा यादृच्छिक जंगलों में व्यक्तिगत पेड़ों में उच्च पूर्वाग्रह की ओर क्यों ले जाती है?