यादृच्छिक वन पेड़ों के लिए छंटाई की आवश्यकता क्यों नहीं है?


20

ब्रीमन का कहना है कि पेड़ों को छंटाई के साथ उगाया जाता है। क्यों? मेरे कहने का तात्पर्य यह है कि इस बात का ठोस कारण होना चाहिए कि बेतरतीब जंगल में पेड़ क्यों नहीं उगते हैं। दूसरी ओर, एक एकल निर्णय पेड़ को अधिक फिटिंग से बचने के लिए prune करना बहुत महत्वपूर्ण माना जाता है। क्या इस कारण से पढ़ने के लिए कुछ साहित्य उपलब्ध है? बेशक पेड़ों को सहसंबद्ध नहीं किया जा सकता है, लेकिन अभी भी अधिक फिटिंग की संभावना होगी।


आपको यहां संदर्भ के बारे में और अधिक कहने की जरूरत है। @ChrisA। ने एक उल्लेखनीय प्रयास किया है, लेकिन यह जानना कठिन है कि क्या आपके प्रश्न का वास्तव में उत्तर दिया गया है, क्योंकि आपके प्रश्न के बारे में बहुत कुछ जानना मुश्किल है।
गंग -

2
इससे अधिक क्या कहा जा सकता है? प्रश्न बहुत स्पष्ट है।
सीनोसैपियन

जवाबों:


20

मोटे तौर पर, कुछ संभावित ओवर-फिटिंग जो कि एक ही पेड़ में हो सकती हैं (जो एक कारण है कि आप आमतौर पर प्रूनिंग करते हैं) एक यादृच्छिक वन में दो चीजों से कम होती है:

  1. यह तथ्य कि व्यक्तिगत पेड़ों को प्रशिक्षित करने के लिए इस्तेमाल किए गए नमूने "बूटस्ट्रैप्ड" हैं।
  2. तथ्य यह है कि आप यादृच्छिक सुविधाओं का उपयोग कर यादृच्छिक पेड़ों की एक भीड़ है और इस प्रकार व्यक्तिगत पेड़ मजबूत हैं, लेकिन एक दूसरे के साथ सहसंबद्ध नहीं हैं।

संपादित करें: नीचे ओपी की टिप्पणी पर आधारित:

ओवर-फिटिंग के लिए निश्चित रूप से अभी भी संभावित है। जहां तक ​​लेख है, आप ब्रीमन द्वारा "बैगिंग" के लिए प्रेरणा के बारे में पढ़ सकते हैं और सामान्य रूप से एफ्रॉन और टिबशिरानी द्वारा "बूटस्ट्रैपिंग" कर सकते हैं। जहाँ तक 2., Brieman सामान्यीकरण त्रुटि पर एक ढीला बँधा हुआ है जो कि पेड़ की ताकत और व्यक्तिगत क्लासिफायर के सह-संबंध से संबंधित है। कोई भी बाउंड (सबसे अधिक संभावना) का उपयोग नहीं करता है, लेकिन यह इस बारे में अंतर्ज्ञान देने के लिए है कि पहनावा के तरीकों में कम सामान्यीकरण त्रुटि में मदद करता है। यह रैंडम फॉरेस्ट पेपर में ही है। मेरी पोस्ट आपको इन रीडिंग और मेरे अनुभव / कटौती के आधार पर सही दिशा में धकेलने की थी।

  • ब्रिमन, एल।, बैगिंग प्रेडिक्टर्स, मशीन लर्निंग, 24 (2), पीपी .23-140, 1996।
  • एफ्रॉन, बी।; टिबशिरानी, ​​आर। (1993)। बूटस्ट्रैप का एक परिचय। बोका रैटन, एफएल
  • ब्रिमन, लियो (2001)। "यादृच्छिक वन"। मशीन लर्निंग 45 (1): 5–32।

लेकिन फिर भी ओवरफिटिंग की संभावना हो सकती है। क्या आप इसके लिए पढ़ने के लिए एक लेख का हवाला दे सकते हैं?
Z खान

@Z खान क्या आप भी शायद यही Z खान हैं ? यदि हां, तो कृपया हमें बताएं ताकि हम आपके खातों को मर्ज कर सकें।
whuber

3
@ZKhan RFs में ओवरफिटिंग मुद्दा Hastie et al, (2009) एलिमेंट ऑफ स्टैटिस्टिकल लर्निंग, 2nd एडिशन में कवर किया गया है । पुस्तक के लिए वेबसाइट पर नि: शुल्क पीडीएफ उपलब्ध है। यादृच्छिक जंगलों पर अध्याय देखें।
मोनिका को बहाल करें - जी। सिम्पसन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.