मैंने अभी इस चर्चा को पढ़ना समाप्त किया है । उनका तर्क है कि PR AUC असंतुलित डेटासेट पर ROC AUC से बेहतर है।
उदाहरण के लिए, हमारे पास परीक्षण डेटासेट में 10 नमूने हैं। 9 नमूने सकारात्मक हैं और 1 नकारात्मक है। हमारे पास एक भयानक मॉडल है जो सब कुछ सकारात्मक की भविष्यवाणी करता है। इस प्रकार, हमारे पास एक मीट्रिक होगा कि टीपी = 9, एफपी = 1, टीएन = 0, एफएन = 0।
फिर, प्रिसिजन = 0.9, रिकॉल = 1.0। सटीक और याद दोनों बहुत अधिक हैं, लेकिन हमारे पास एक खराब क्लासिफायरियर है।
दूसरी ओर, टीपीआर = टीपी / (टीपी + एफएन) = 1.0, एफपीआर = एफपी / (एफपी + टीएन) = 1.0। क्योंकि एफपीआर बहुत अधिक है, हम पहचान सकते हैं कि यह एक अच्छा क्लासिफायरियर नहीं है।
स्पष्ट रूप से, आरओसी असंतुलित डेटासेट पर पीआर से बेहतर है। क्या कोई समझा सकता है कि पीआर बेहतर क्यों है?