जवाबों:
जैसा कि मैंने टैन एट द्वारा डाटा माइनिंग के परिचय में पाया। अल:
अध्ययनों से पता चला है कि अशुद्धता के माप के विकल्प का निर्णय पेड़ के प्रेरण एल्गोरिदम के प्रदर्शन पर बहुत कम प्रभाव पड़ता है। ऐसा इसलिए है क्योंकि कई अशुद्धता के उपाय एक-दूसरे के साथ काफी सुसंगत हैं [...]। वास्तव में, पेड़ को चुभाने के लिए इस्तेमाल की जाने वाली रणनीति का अशुद्धता के उपाय की तुलना में अंतिम पेड़ पर अधिक प्रभाव पड़ता है।
इसलिए, आप C4.5 की तरह CART या Entropy जैसे गिन्नी इंडेक्स का उपयोग करना चुन सकते हैं।
मैं एंट्रॉपी का उपयोग करता हूं, विशेष रूप से C4.5 का लाभ अनुपात क्योंकि आप क्विनलान द्वारा अच्छी तरह से लिखी गई पुस्तक का पालन कर सकते हैं: मशीन लर्निंग के लिए C4.5 प्रोग्राम।