मैं वास्तव में रैंडम फ़ॉरेस्ट का कार्यान्वयन लिख रहा हूं, लेकिन मेरा मानना है कि प्रश्न पेड़ों (आरएफ से स्वतंत्र) के लिए विशिष्ट है।
इसलिए संदर्भ यह है कि मैं एक निर्णय वृक्ष में एक नोड बना रहा हूं और भविष्यवाणी और लक्ष्य चर दोनों निरंतर हैं। नोड के पास डेटा को दो सेटों में विभाजित करने के लिए एक विभाजन सीमा है, और मैं प्रत्येक सेट में औसत लक्ष्य मान के आधार पर प्रत्येक सबसेट के लिए एक नई भविष्यवाणी बनाता हूं। क्या यह सही तरीका है?
मेरे द्वारा पूछे जाने का कारण यह है कि जब द्विआधारी चर का अनुमान लगाता हूं, तो मुझे लगता है कि विशिष्ट (सही?) दृष्टिकोण डेटा को प्रत्येक उपसमुच्चय में औसतन डेटा पंक्तियों के बिना 0 और 1 सबसेट में विभाजित करना है। बाद में विभाजित बारीक दानेदार उप-भागों में विभाजित हो जाएगा और प्रत्येक विभाजन परिणामों में औसतन बाद में विभाजन (निर्णय पेड़ से नीचे) बाइनरी चर की बजाय अब निरंतर चर रहे हैं (क्योंकि हम मूल के बजाय अवशिष्ट त्रुटि पर काम कर रहे हैं) लक्ष्य)।
साइड सवाल: क्या दो दृष्टिकोणों (द्विआधारी बनाम निरंतर) के बीच अंतर महत्वपूर्ण है - या क्या वे वास्तव में एक पूर्ण निर्णय पेड़ के लिए समान परिणाम देंगे?