जवाबों:
आपको पैरामीटर ट्यूनिंग के भाग के रूप में उन दोनों को आज़माना चाहिए।
सैद्धांतिक रूप से गिन्नी अशुद्धता एंट्रॉपी / सूचना लाभ को कम करती है जबकि प्रवेश नुकसान को कम करता है, इसलिए आप उनमें से जो कुछ अंतर में रुचि रखते हैं। हालांकि अन्य चीजें जैसे कि संभावना है कि प्रत्येक व्यक्ति को लालची पेड़ के विकास में बहुभिन्नरूपी प्रभावों की खोज करने की बजाय उन चीजों से "विचलित" हो जाना चाहिए जो चीजों में भी खेलते हैं। यानी आप एक अशुद्धता मीट्रिक से बेहतर सामान्यीकरण प्राप्त कर सकते हैं जो हमेशा "सर्वश्रेष्ठ" विभाजन का चयन नहीं करता है।
व्यवहार में (rf के संदर्भ में, तब और अधिक कार्ट) मैंने पाया है कि काम करने वाले क्लीनर कम आयामी डेटा सेटों के लिए बेहतर काम करते हैं, जहाँ आप अधिक जटिल सिग्नल फिट करने की कोशिश कर रहे हैं, जबकि गनी शोर, अत्यधिक आयामी के लिए बेहतर काम करता है। जहां कई शोर संभावित संकेतों में से एक साधारण संकेत को उजागर करने की कोशिश कर रहे हैं। यह सिर्फ मेरा अनुभव है और लगभग सभी मामलों में निश्चित रूप से पकड़ में नहीं आएगा।
नोट: एक टिप्पणी के रूप में शुरू किया गया था लेकिन हटा दिया गया और चीजों पर विस्तार करने के लिए एक उत्तर के लिए ले जाया गया।