रैंडम फ़ॉरेस्ट में "नोड आकार" का क्या अर्थ है?


20

मुझे समझ में नहीं आ रहा है कि नोड आकार का मतलब क्या है। मुझे पता है कि एक निर्णय नोड क्या है, लेकिन नोड आकार क्या है।

जवाबों:


24

एक निर्णय पेड़ प्रशिक्षण सेट के पुनरावर्ती विभाजन द्वारा काम करता है। निर्णय वृक्ष के प्रत्येक नोड को प्रशिक्षण सेट से डेटा बिंदुओं के सेट के साथ जोड़ा जाता है :tnt

n_t प्रत्येक नोड का आकार है

आप पैरामीटर nodesizeको कुछ यादृच्छिक जंगलों के पैकेजों में पा सकते हैं , जैसे R : यह न्यूनतम नोड आकार है , उदाहरण में न्यूनतम नोड आकार 10 से ऊपर है। यह पैरामीटर आपके पेड़ों की गहराई को निर्धारित करता है।

nodesize आर यादृच्छिक वन पैकेज से

टर्मिनल नोड्स का न्यूनतम आकार। इस संख्या को बड़ा करने से छोटे पेड़ उगते हैं (और इस तरह कम समय लगता है)। ध्यान दें कि वर्गीकरण (1) और प्रतिगमन (5) के लिए डिफ़ॉल्ट मान अलग-अलग हैं।

अन्य पैकेज में आप सीधे पैरामीटर पाते हैं depth, उदाहरण के लिए WEKA :

-depth WEKA यादृच्छिक वन पैकेज से

पेड़ों की अधिकतम गहराई, असीमित के लिए 0। (डिफ़ॉल्ट 0)


1
'रिकॉर्ड ’क्या हैं? क्या आपका मतलब डेटा पॉइंट्स से है? प्रत्येक नोड रिकॉर्ड के एक सेट के साथ क्यों जुड़ा हुआ है? मैं यादृच्छिक जंगलों को अच्छी तरह से समझता हूं, लेकिन मुझे नहीं पता कि शब्दजाल का मतलब क्या है।
वुल्फसाथेदुर

हां, मेरा मतलब डेटा प्वाइंट था। आमतौर पर आप डेटा बिंदुओं को रिकॉर्ड, उदाहरण या उदाहरण के रूप में संदर्भित कर सकते हैं।
सिमोन

तो क्या पेड़ों से बचने के लिए अंगूठे के न्यूनतम नोड आकार का कोई नियम है? मुझे लगता है कि यह डेटा के आकार पर निर्भर करता है ताकि शायद डेटासेट का एक निश्चित अनुपात हो?
सीनोसैपियन

1
यादृच्छिक जंगलों में, पेड़ पूरी तरह से उगाए जाते हैं: नोड आकार 1 है। कई पेड़ों को उगाने से बचा जाता है। निर्णय वृक्ष में यह अधिक पेचीदा है। पेड़ पूरी तरह से विकसित नहीं होते हैं और आपको ओवरफिटिंग से बचने के लिए छंटाई करनी पड़ती है।
सिमोन

1
ऐसा लगता है कि पेड़ को सरलीकृत करने और ओवरफिटिंग से बचने के लिए वाइनचिंग किसी प्रकार की सुविधा का चयन है। मुझे लगता है कि किसी एक पेड़ की छंटाई हमेशा फायदेमंद होती है। इसके बजाय, जीतना कभी-कभी सटीकता को कम कर सकता है लेकिन यह पेड़ को सरल बनाता है।
सिमोन

2

यह स्पष्ट नहीं है कि क्या नोडसाइड "इन-बैग" नमूने पर है या "आउट-ऑफ-बैग" त्रुटि पर है। यदि यह "आउट-ऑफ-द-बैग" नमूने पर है, तो यह थोड़ा अधिक प्रतिबंधक है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.