के बीच कनेक्शन (घ-प्राइम) और एयूसी (आरओसी वक्र के तहत क्षेत्र); निहित पूर्वधारणायें


13

मशीन लर्निंग में हम आरओसी वक्र (अक्सर संक्षिप्त AUC , या AUROC) के तहत क्षेत्र का उपयोग करके यह बता सकते हैं कि सिस्टम दो श्रेणियों के बीच कितना भेदभाव कर सकता है। सिग्नल डिटेक्शन सिद्धांत में अक्सर (संवेदनशीलता सूचकांक) का उपयोग एक समान उद्देश्य के लिए किया जाता है। दोनों एक दूसरे के साथ जुड़े हुए हैं, और मुझे विश्वास है कि यदि वे कुछ मान्यताओं से संतुष्ट हैं तो वे एक दूसरे के समतुल्य हैंd

गणना आमतौर पर संकेत वितरण के लिए सामान्य वितरण संभालने (विकिपीडिया से ऊपर लिंक, उदाहरण के लिए देखें) के आधार पर प्रस्तुत किया है। आरओसी वक्र गणना इस धारणा को नहीं बनाती है: यह किसी भी क्लासिफायरियर पर लागू होता है जो एक निरंतर-मूल्यवान निर्णय मानदंड का उत्पादन करता है जिसे थ्रेशोल्ड किया जा सकता है।d

विकिपीडिया कहता है कि बराबर है । यह सही लगता है अगर दोनों की धारणाएं संतुष्ट हैं; लेकिन अगर धारणाएँ समान नहीं हैं तो यह एक सार्वभौमिक सत्य नहीं है।d2AUC1

क्या मान्यताओं में अंतर को स्पष्ट करना उचित है क्योंकि "एयूसी अंतर्निहित वितरण के बारे में कम धारणा बनाता है"? या वास्तव में एयूसी के रूप में व्यापक रूप से लागू है, लेकिन यह केवल सामान्य अभ्यास है जो का उपयोग करने वाले लोग सामान्य वितरण को मानने वाले गणना का उपयोग करते हैं? क्या मेरे द्वारा याद की गई अंतर्निहित मान्यताओं में कोई अन्य अंतर हैं?dd

जवाबों:


7

सं। AUC का अधिकतम मूल्य 1. d 'नहीं है।

मेरा मानना ​​है कि d 'qnorm (AUC) * sqrt (2) के बराबर है (मेरी एक पुरानी स्टैटिस्टिक्स बुक की मेमोरी जो मुझे अभी नहीं मिल सकती है, लेकिन मुझे वेब पर मिले कुछ डेटा के खिलाफ लगती है)। यहाँ qnorm (x) "सामान्य वितरण के लिए मात्रात्मक कार्य" (R-Speak) है। यही है, यह सामान्य वितरण का मूल्य लौटाता है जिसके लिए वितरण का x अनुपात इसके नीचे है।


2
धन्यवाद, यह मेरे लिए सही लगता है - हालांकि, केवल अगर हम मानते हैं कि वितरण सामान्य हैं (क्यूनोर्म () के उपयोग के कारण)। मैंने विकिपीडिया शब्द को ठीक कर लिया है।
डेन स्टोवेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.