समस्या का अर्थ है पेड़ों के निर्माण का निर्णय लेना। विकिपीडिया के अनुसार ' गिन्नी गुणांक ' को ' गिन्नी अशुद्धता ' के साथ भ्रमित नहीं होना चाहिए । हालाँकि निर्णय वृक्ष का निर्माण करते समय दोनों उपायों का उपयोग किया जा सकता है - ये आइटम के सेट को विभाजित करते समय हमारी पसंद का समर्थन कर सकते हैं।
1) 'गिन्नी अशुद्धता' - यह एक मानक निर्णय-वृक्ष विभाजन मीट्रिक है (ऊपर लिंक में देखें);
2) 'गिन्नी गुणांक' - प्रत्येक विभाजन का मूल्यांकन एयूसी मानदंड के आधार पर किया जा सकता है। प्रत्येक बंटवारे के परिदृश्य के लिए हम एक ROC वक्र बना सकते हैं और AUC मीट्रिक की गणना कर सकते हैं। विकिपीडिया के अनुसार AUC = (GiniCoeff + 1) / 2;
प्रश्न है: क्या ये दोनों उपाय समतुल्य हैं? एक ओर, मुझे सूचित किया जाता है कि गिन्नी गुणांक को गिन्नी अशुद्धता के साथ भ्रमित नहीं होना चाहिए। दूसरी ओर, इन दोनों उपायों का उपयोग एक ही काम करने में किया जा सकता है - एक निर्णय पेड़ की गुणवत्ता का आकलन करना।