रैंडम फ़ॉरेस्ट: क्या होगा अगर मुझे पता है कि एक चर महत्वपूर्ण है


12

मेरी समझ में प्रत्येक निर्णय वृक्ष के निर्माण के लिए रैंडम फ़ॉरेस्ट बेतरतीब ढंग से mtry वैरिएबल है। इसलिए यदि mtry = ncol / 3 हो तो पेड़ों के 1/3 भाग में औसतन प्रत्येक चर का उपयोग किया जाएगा। और 2/3 पेड़ उनका उपयोग नहीं करेंगे।

लेकिन क्या होगा अगर मुझे पता है कि एक एकल चर शायद बहुत महत्वपूर्ण है, तो क्या यह संभावना मैन्युअल रूप से बढ़ाना अच्छा होगा कि इस चर को प्रत्येक पेड़ में चुना जाए? यह R में यादृच्छिकतम पैकेज के साथ संभव है?

जवाबों:


6

ध्यान दें कि mtryप्रत्येक विभाजन पर उम्मीदवारों के रूप में यादृच्छिक रूप से चरों की संख्या है। और इस उम्मीदवारों में से सबसे अच्छा विभाजन करने के लिए चुना जाता है। इस प्रकार आपके द्वारा वर्णित अनुपात पूरी तरह से संतुष्ट नहीं है। अधिक महत्वपूर्ण चर अधिक बार दिखाई देते हैं, और कम महत्वपूर्ण - कम बार। तो अगर चर वास्तव में बहुत महत्वपूर्ण है, तो एक बड़ी संभावना है कि इसे एक पेड़ में चुना जाएगा और आपको मैन्युअल सुधार की आवश्यकता नहीं है। लेकिन कभी-कभी (शायद ही कभी) प्रतिगमन में कुछ चर (इसकी संभावित महत्व की परवाह किए बिना) की उपस्थिति को मजबूर करने की आवश्यकता होती है। जहां तक ​​मुझे पता है आर पैकेज यादृच्छिक वन ऐसी संभावना का समर्थन नहीं करता है। लेकिन अगर इस चर का दूसरों के साथ कोई अंतर्संबंध नहीं है, तो आप इस चर के साथ साधारण प्रतिगमन को एक पद के रूप में बना सकते हैं और फिर इस साधारण प्रतिगमन के अवशेषों पर यादृच्छिक वन प्रतिगमन चला सकते हैं। यदि आप अभी भी निर्धारित चर चुनने की संभावना को सही करना चाहते हैं, तो अगले संकलन के साथ स्रोत कोड का संशोधन आपका विकल्प है।


2
यदि आपको अपने लक्ष्य फ़ंक्शन के लिए एक सभ्य अनुमान प्राप्त करने के लिए n पेड़ों की आवश्यकता है, लेकिन आप चर महत्व की तलाश कर रहे हैं, तो आप जंगल में 5 * n या 10 * n पेड़ों की तरह कुछ सेट कर सकते हैं। वे "फिट एरर" पर नहीं बल्कि वेरिएबल महत्व में बदलाव पर अधिक कन्वर्ज करेंगे।
21

5

जून 2015 के बाद से, 'रेंजर' नामक R-CRAN पर एक नए होनहार आरएफ एल्गोरिथ्म में यह सुविधा है। इसे विभाजित किया गया है, स्प्लिट.सेलेक्ट.वेट्स : "0 और 1 के बीच वजन के साथ संख्यात्मक वेक्टर, विभाजन के लिए चरों का चयन करने की संभावना का प्रतिनिधित्व करता है।"

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.