गिनी अशुद्धता का उपयोग कब करें और सूचना लाभ का उपयोग कब करें?


11

क्या कोई मुझे समझा सकता है कि निर्णय पेड़ों के लिए गिन्नी अशुद्धता और सूचना लाभ का उपयोग कब करें? क्या आप मुझे ऐसी स्थितियाँ / उदाहरण दे सकते हैं, जिनका उपयोग करना सबसे अच्छा है?

जवाबों:


9

आपको पैरामीटर ट्यूनिंग के भाग के रूप में उन दोनों को आज़माना चाहिए।

सैद्धांतिक रूप से गिन्नी अशुद्धता एंट्रॉपी / सूचना लाभ को कम करती है जबकि प्रवेश नुकसान को कम करता है, इसलिए आप उनमें से जो कुछ अंतर में रुचि रखते हैं। हालांकि अन्य चीजें जैसे कि संभावना है कि प्रत्येक व्यक्ति को लालची पेड़ के विकास में बहुभिन्नरूपी प्रभावों की खोज करने की बजाय उन चीजों से "विचलित" हो जाना चाहिए जो चीजों में भी खेलते हैं। यानी आप एक अशुद्धता मीट्रिक से बेहतर सामान्यीकरण प्राप्त कर सकते हैं जो हमेशा "सर्वश्रेष्ठ" विभाजन का चयन नहीं करता है।

व्यवहार में (rf के संदर्भ में, तब और अधिक कार्ट) मैंने पाया है कि काम करने वाले क्लीनर कम आयामी डेटा सेटों के लिए बेहतर काम करते हैं, जहाँ आप अधिक जटिल सिग्नल फिट करने की कोशिश कर रहे हैं, जबकि गनी शोर, अत्यधिक आयामी के लिए बेहतर काम करता है। जहां कई शोर संभावित संकेतों में से एक साधारण संकेत को उजागर करने की कोशिश कर रहे हैं। यह सिर्फ मेरा अनुभव है और लगभग सभी मामलों में निश्चित रूप से पकड़ में नहीं आएगा।

नोट: एक टिप्पणी के रूप में शुरू किया गया था लेकिन हटा दिया गया और चीजों पर विस्तार करने के लिए एक उत्तर के लिए ले जाया गया।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.