मैं यह समझने की कोशिश कर रहा हूं कि स्केलेर के साथ निर्मित एक निर्णय ट्री वर्गीकरण मॉडल की निर्णय प्रक्रिया को पूरी तरह से कैसे समझा जाए। मैं जिस 2 मुख्य पहलू को देख रहा हूं, वे हैं पेड़ का रेखांकन प्रतिनिधित्व और फीचर इंपोर्टेंस की सूची। मुझे समझ में नहीं आता है कि वृक्ष के संदर्भ में विशेषता का महत्व कैसे निर्धारित किया जाता है। उदाहरण के लिए, यहाँ मेरी विशेषता आयातों की सूची है:
फ़ीचर रैंकिंग: 1. फ़ीचर (0.300237)
फ़ीचरबी (0.166800)
फ़ीचरसी (0.092472)
फ़ीचरडी (0.075009)
फ़ीचर (0.068310)
फ़ीचरएफ (0.067118)
फ़ीचरजी (0.066510)
फ़ीचरएच (0.043502)
फ़ीचर (0.040281)
फ़ीचरज (0.039006)
फ़ीचरके (0.032618)
फ़ीचरएल (0.008136)
फ़ीचरएम (0.000000)
हालाँकि, जब मैं पेड़ के ऊपर देखता हूँ, तो ऐसा दिखता है:
वास्तव में, कुछ विशेषताएं जो "सबसे महत्वपूर्ण" रैंक की जाती हैं, वे पेड़ से बहुत नीचे तक दिखाई नहीं देती हैं, और पेड़ की चोटी फीचरजे है जो सबसे कम रैंक वाली सुविधाओं में से एक है। मेरी भोली धारणा यह होगी कि सबसे महत्वपूर्ण विशेषताओं को पेड़ के शीर्ष के पास सबसे बड़ा प्रभाव पड़ेगा। यदि यह गलत है, तो वह क्या है जो एक विशेषता को "महत्वपूर्ण" बनाता है?