The AUC does not compare classes real vs. predicted with each other. It is not looking at the predicted class, but the prediction score or the probability. You can do the prediction of the class by applying a cutoff to this score, say, every sample that got a score below 0.5 is classified as negative. But the ROC comes before that happens. It is working with the scores/class-probabilities.
यह इन अंकों को लेता है और उस स्कोर के अनुसार सभी नमूनों को क्रमबद्ध करता है। अब, जब भी आपको एक पॉजिटिव सैंपल मिलता है, आरओसी-कर्व एक स्टेप अप (वाई-एक्सिस के साथ) बनाता है। जब भी आप एक नकारात्मक नमूना पाते हैं तो आप सही (x- अक्ष के साथ) चलते हैं। यदि वह स्कोर दो वर्गों के लिए अलग है, तो सकारात्मक नमूने पहले (आमतौर पर) आते हैं। इसका मतलब है कि आप दाईं ओर से अधिक कदम बढ़ाते हैं। आगे की सूची में नकारात्मक नमूने आएंगे, इसलिए आप बाईं ओर चलते हैं। जब आप नमूनों की पूरी सूची के माध्यम से आप समन्वय (1,1) तक पहुंचते हैं जो सकारात्मक के 100% और नकारात्मक नमूनों के 100% से मेल खाती है।
यदि स्कोर पूरी तरह से सकारात्मक को उन नकारात्मक नमूनों से अलग करता है जिन्हें आप (x = 0, y = 0) से (1,0) और फिर वहाँ से (1, 1) तक ले जाते हैं। तो, वक्र के नीचे का क्षेत्र 1 है।
यदि आपके स्कोर में सकारात्मक और नकारात्मक नमूनों के लिए समान वितरण है, तो सॉर्ट की गई सूची में एक सकारात्मक या नकारात्मक नमूना खोजने की संभावनाएं बराबर हैं और इसलिए आरओसी-वक्र में स्थानांतरित होने या छोड़ने की संभावनाएं बराबर हैं। यही कारण है कि आप विकर्ण के साथ आगे बढ़ते हैं, क्योंकि आप अनिवार्य रूप से ऊपर और बाएं, और ऊपर और बाएं, और इतने पर ... जो लगभग 0.5 का AROC मान देता है।
असंतुलित डेटासेट के मामले में, स्टेपलाइज अलग है। तो, आप बाईं ओर छोटे चरण बनाते हैं (यदि आपके पास अधिक नकारात्मक नमूने हैं)। यही कारण है कि स्कोर असंतुलन से अधिक या कम स्वतंत्र है।
आरओसी वक्र के साथ, आप कल्पना कर सकते हैं कि आपके नमूने कैसे अलग हो गए हैं और वक्र के नीचे का क्षेत्र द्विआधारी वर्गीकरण एल्गोरिदम या किसी भी चर के प्रदर्शन को मापने के लिए एक बहुत अच्छा मीट्रिक हो सकता है जिसका उपयोग अलग-अलग कक्षाओं में किया जा सकता है।
आकृति विभिन्न नमूना आकारों के साथ समान वितरण दिखाती है। काले क्षेत्र से पता चलता है कि सकारात्मक और नकारात्मक नमूनों के यादृच्छिक मिश्रणों के आरओसी-घटता की उम्मीद की जाएगी।