निर्णय वृक्ष की जगह बनाम यादृच्छिक वन का एमसीएमसी नमूना


11

एक बेतरतीब जंगल निर्णय पेड़ों का एक संग्रह है जो प्रत्येक पेड़ के निर्माण के लिए यादृच्छिक रूप से केवल कुछ विशेषताओं का चयन करता है (और कभी-कभी प्रशिक्षण डेटा को जीतना)। जाहिरा तौर पर वे अच्छी तरह से सीखते हैं और सामान्यीकरण करते हैं। क्या किसी ने निर्णय वृक्ष के स्थान का एमसीएमसी नमूना लिया है या उनकी तुलना यादृच्छिक जंगलों से की है? मुझे पता है कि एमसीएमसी को चलाने और सभी सैंपल वाले पेड़ों को बचाने के लिए यह कम्प्यूटेशनल रूप से अधिक महंगा हो सकता है, लेकिन मुझे इस मॉडल की सैद्धांतिक विशेषताओं में दिलचस्पी है, न कि कम्प्यूटेशनल लागतों पर। मेरा मतलब कुछ इस तरह है:

  1. एक यादृच्छिक निर्णय पेड़ का निर्माण (यह शायद बहुत बुरा प्रदर्शन करेगा)
  2. जैसी किसी चीज़ के साथ पेड़ की तुलना करें , या शायद शब्द जोड़ें।P(Tree|Data)P(Data|Tree)Pprior(Tree)
  3. पेड़ को बदलने के लिए एक यादृच्छिक कदम चुनें और संभावना आधार पर चयन करें ।P(Tree|Data)
  4. हर एन कदम, वर्तमान पेड़ की एक प्रति बचाते हैं
  5. कुछ बड़े एन * एम बार के लिए 3 पर वापस जाएं
  6. भविष्यवाणी करने के लिए M सहेजे गए पेड़ों के संग्रह का उपयोग करें

क्या यह रैंडम फ़ॉरेस्ट के समान प्रदर्शन देगा? ध्यान दें कि यहां हम किसी भी कदम पर यादृच्छिक जंगलों के विपरीत अच्छे डेटा या सुविधाओं को नहीं फेंक रहे हैं।


2
मुझे यकीन नहीं है कि यह ठीक उसी प्रकार की प्रक्रिया है जिसे आप स्केच करते हैं, लेकिन BART है । यहाँ एक पीडीएफ के
जोरान

जवाबों:



4

दुर्भाग्य से, चिपमैन एट अल। अपने बायेसियन कार्ट दृष्टिकोण में केवल सबसे संभावित पेड़ को निकालते हैं। उन्होंने कभी पेड़ों पर औसत रहने और रैंडम फ़ॉरेस्ट और एक्स्ट्रा-ट्रीज़ के प्रदर्शन की तुलना करने की कोशिश नहीं की।

मैंने अभी Chipman से BART का पेपर पढ़ा है। अगर मैं सही तरीके से समझूं, तो यह मी ट्री के संग्रह पर के नमूनों का औसत बेयसियन औसत है। यह कई मायनों में दिलचस्प है और यह वास्तव में अच्छा प्रदर्शन करता है। जब m = '1', यह एक साधारण बायेसियन है, जो कि 1 पेड़ के K नमूनों का औसत है, जो पश्च से आता है। हालाँकि, उस विशेष पहलू पर ज्यादा परीक्षण नहीं किया गया है। और मुझे अभी भी यह जानने में दिलचस्पी होगी कि रैंडम फ़ॉरेस्ट या एक्स्ट्रा-ट्रीज़ सच्चे बेयस मॉडल की तुलना कैसे करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.