AUC का उपयोग करने का औचित्य?


10

विशेष रूप से मशीन लर्निंग साहित्य के कंप्यूटर-विज्ञान उन्मुख पक्ष में, एयूसी (रिसीवर ऑपरेटर विशेषता वक्र के तहत क्षेत्र) सहपाठियों के मूल्यांकन के लिए एक लोकप्रिय मानदंड है। एयूसी का उपयोग करने के लिए क्या औचित्य हैं? उदाहरण के लिए एक विशेष नुकसान फ़ंक्शन है जिसके लिए इष्टतम निर्णय सर्वश्रेष्ठ एयूसी के साथ क्लासिफायरियर है?


1
एयूसी एक नुकसान फ़ंक्शन है, यह स्पष्ट है कि इस नुकसान फ़ंक्शन के लिए इष्टतम निर्णय सर्वश्रेष्ठ एयूसी के साथ क्लासिफायरियर है।
रॉबिन जिरार्ड

1
@robingirard यह नहीं है, क्योंकि यह अलग नहीं है, यानी आप इसे सीधे अनुकूलित नहीं कर सकते।
अगस्‍त

जवाबों:


15

द्विआधारी classifiers के लिए श्रेणी के लिए इस्तेमाल किया (प्रत्येक उदाहरण के लिए यानी हमारे पास अंतराल में ) है जहाँ से एयूसी मापा जाता है एयूसी संभावना के बराबर है कि जहाँ एक वास्तविक सकारात्मक उदाहरण है और एक वास्तविक नकारात्मक उदाहरण है। इस प्रकार, अधिकतम AUC के साथ एक मॉडल का चयन करने की संभावना कम से कम है कि । यही है, एक सच्चे नकारात्मक को कम से कम बड़े सकारात्मक के रूप में रैंकिंग के नुकसान को कम करता है।CeC(e)[0,1]C(e1)>C(e0)e1e0C(e0)C(e1)


0

चलो अच्छे + बुरे टमाटर के पूल से अच्छे टमाटर की पहचान करने का एक सरल उदाहरण लेते हैं। मान लीजिए कि अच्छे टमाटर की संख्या 100 है, और खराब टमाटर 1000 हैं, इसलिए कुल 1100। अब आपका काम है कि आप जितना संभव हो उतने अच्छे टमाटर की पहचान करें। सभी अच्छे टमाटर प्राप्त करने का एक तरीका सभी 1100 टमाटर ले रहे हैं। लेकिन यह स्पष्ट रूप से कहता है कि आप b / n अच्छा बनाम बुरा अंतर करने में सक्षम नहीं हैं ।

तो, अंतर करने का सही तरीका क्या है - बहुत कम बुरे लोगों को उठाते समय बहुत से अच्छे लोगों को प्राप्त करने की आवश्यकता होती है , इसलिए हमें एक उपाय की आवश्यकता होती है, जो कह सकता है कि हमने कितने अच्छे लोगों को उठाया और यह भी कहा कि बुरे लोगों की गिनती क्या है यह। एयूसी माप अधिक वजन देता है अगर यह नीचे दिखाए गए अनुसार कुछ बुरे लोगों के साथ अधिक अच्छे लोगों का चयन करने में सक्षम है। जो कहता है कि आप कितने अच्छे बी / एन को अच्छे और बुरे में अंतर करने में सक्षम हैं।

उदाहरण में आप देख सकते हैं कि 70% अच्छा टमाटर उठाते समय, काले वक्र ने लगभग 48% बुरे लोगों (अशुद्धता) को उठाया, लेकिन नीले रंग में 83% बुरे लोग (अशुद्धता) हैं। तो नीले रंग की तुलना में काले वक्र में बेहतर AUC स्कोर है। यहां छवि विवरण दर्ज करें


यह प्रश्न का उत्तर कैसे देता है?
विवेक सुब्रमण्यन

मैंने एयूसी के अंतर्ज्ञान के साथ लिखा था कि, यह झूठी आबादी की संख्या को कम करते हुए पूरी आबादी में अच्छे लोगों (बाइनरी वर्गीकरण में 1) की पहचान करने के लिए एकल स्कोर देने में मदद करता है। मेरी मदद करें कि मैं इसके लिए और बेहतर कैसे कर सकता था।
युगांधर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.