मोटे तौर पर, कुछ संभावित ओवर-फिटिंग जो कि एक ही पेड़ में हो सकती हैं (जो एक कारण है कि आप आमतौर पर प्रूनिंग करते हैं) एक यादृच्छिक वन में दो चीजों से कम होती है:
- यह तथ्य कि व्यक्तिगत पेड़ों को प्रशिक्षित करने के लिए इस्तेमाल किए गए नमूने "बूटस्ट्रैप्ड" हैं।
- तथ्य यह है कि आप यादृच्छिक सुविधाओं का उपयोग कर यादृच्छिक पेड़ों की एक भीड़ है और इस प्रकार व्यक्तिगत पेड़ मजबूत हैं, लेकिन एक दूसरे के साथ सहसंबद्ध नहीं हैं।
संपादित करें: नीचे ओपी की टिप्पणी पर आधारित:
ओवर-फिटिंग के लिए निश्चित रूप से अभी भी संभावित है। जहां तक लेख है, आप ब्रीमन द्वारा "बैगिंग" के लिए प्रेरणा के बारे में पढ़ सकते हैं और सामान्य रूप से एफ्रॉन और टिबशिरानी द्वारा "बूटस्ट्रैपिंग" कर सकते हैं। जहाँ तक 2., Brieman सामान्यीकरण त्रुटि पर एक ढीला बँधा हुआ है जो कि पेड़ की ताकत और व्यक्तिगत क्लासिफायर के सह-संबंध से संबंधित है। कोई भी बाउंड (सबसे अधिक संभावना) का उपयोग नहीं करता है, लेकिन यह इस बारे में अंतर्ज्ञान देने के लिए है कि पहनावा के तरीकों में कम सामान्यीकरण त्रुटि में मदद करता है। यह रैंडम फॉरेस्ट पेपर में ही है। मेरी पोस्ट आपको इन रीडिंग और मेरे अनुभव / कटौती के आधार पर सही दिशा में धकेलने की थी।
- ब्रिमन, एल।, बैगिंग प्रेडिक्टर्स, मशीन लर्निंग, 24 (2), पीपी .23-140, 1996।
- एफ्रॉन, बी।; टिबशिरानी, आर। (1993)। बूटस्ट्रैप का एक परिचय। बोका रैटन, एफएल
- ब्रिमन, लियो (2001)। "यादृच्छिक वन"। मशीन लर्निंग 45 (1): 5–32।