ROC घटता उत्पन्न करने के लिए (= रिसीवर ऑपरेटिंग कैरेक्टर घटता):
मान लें कि हमारे पास एक संभाव्य, द्विआधारी क्लासिफायर जैसे लॉजिस्टिक रिग्रेशन है। आरओसी वक्र प्रस्तुत करने से पहले, भ्रम मैट्रिक्स की अवधारणा को समझना होगा। जब हम एक द्विआधारी भविष्यवाणी करते हैं, तो 4 प्रकार की त्रुटियां हो सकती हैं:
- हम 0 की भविष्यवाणी करते हैं जबकि हमारे पास होना चाहिए वर्ग वास्तव में 0 है: इसे ट्रू नेगेटिव कहा जाता है , अर्थात हम सही ढंग से भविष्यवाणी करते हैं कि कक्षा नकारात्मक है (0)। उदाहरण के लिए, एक एंटीवायरस ने वायरस के रूप में एक हानिरहित फ़ाइल का पता नहीं लगाया।
- हम 0 की भविष्यवाणी करते हैं जबकि हमारे पास होना चाहिए वर्ग वास्तव में 1 है: इसे गलत नकारात्मक कहा जाता है , अर्थात हम गलत तरीके से भविष्यवाणी करते हैं कि वर्ग नकारात्मक है (0)। उदाहरण के लिए, एक एंटीवायरस वायरस का पता लगाने में विफल रहा।
- हम 1 की भविष्यवाणी करते हैं जबकि हमारे पास होना चाहिए वर्ग वास्तव में 0 है: इसे गलत सकारात्मक कहा जाता है , अर्थात हम गलत अनुमान लगाते हैं कि वर्ग सकारात्मक है (1)। उदाहरण के लिए, एक एंटीवायरस एक हानिरहित फ़ाइल को वायरस मानता था।
- हम 1 की भविष्यवाणी करते हैं जबकि हमारे पास होना चाहिए वर्ग वास्तव में 1 है: इसे एक सच्चा सकारात्मक कहा जाता है , अर्थात हम सही ढंग से भविष्यवाणी करते हैं कि वर्ग सकारात्मक है (1)। उदाहरण के लिए, एक एंटीवायरस ने वायरस का सही पता लगाया।
भ्रम मैट्रिक्स प्राप्त करने के लिए, हम मॉडल द्वारा की गई सभी भविष्यवाणियों पर जाते हैं, और गिनते हैं कि उन 4 प्रकार की त्रुटियों में से प्रत्येक कितनी बार होती है:
एक भ्रम मैट्रिक्स के इस उदाहरण में, वर्गीकृत किए गए 50 डेटा बिंदुओं में से 45 सही ढंग से वर्गीकृत किए गए हैं और 5 मिसकॉलिफ़ाइड हैं।
चूंकि दो अलग-अलग मॉडलों की तुलना करना अक्सर एक से अधिक लोगों के बजाय एक मीट्रिक होना अधिक सुविधाजनक होता है, हम भ्रम मैट्रिक्स से दो मैट्रिक्स की गणना करते हैं, जिसे हम बाद में एक में जोड़ देंगे:
0.00 ; 0.01 , 0.02 , … , 1.00
इस आंकड़े में, नीला क्षेत्र रिसीवर ऑपरेटिंग कैरेक्टरिस्टिक (AUROC) के क्षेत्र के अंतर्गत आता है। विकर्ण में धराशायी रेखा हम एक यादृच्छिक भविष्यवक्ता के आरओसी वक्र को प्रस्तुत करते हैं: इसमें 0.5 का एयूआरओसी है। यादृच्छिक भविष्यवक्ता आमतौर पर यह देखने के लिए आधार रेखा के रूप में उपयोग किया जाता है कि क्या मॉडल उपयोगी है।
यदि आप कुछ पहले हाथ अनुभव प्राप्त करना चाहते हैं: