AUROC या सटीकता के आधार पर वर्गीकरण की तुलना करें?


11

मुझे बाइनरी वर्गीकरण की समस्या है और मैं इस पर अलग-अलग क्लासिफायर का प्रयोग करता हूं: मैं क्लासिफायर की तुलना करना चाहता हूं। कौन सा एक बेहतर उपाय AUC या सटीकता है? और क्यों?

Raondom Forest: AUC: 0.828  Accuracy: 79.6667 %
           SVM: AUC: 0.542  Accuracy: 85.6667 %

जवाबों:


13

सही ढंग से वर्गीकृत किया गया अनुपात एक अनुचित स्कोरिंग नियम है, अर्थात, यह एक फर्जी मॉडल द्वारा अनुकूलित है। मैं द्विघात स्कोर के रूप में जाना जाने वाला द्विघात उचित स्कोरिंग नियम या समवर्ती संभावना (द्विआधारी मामले में आरओसी वक्र के तहत क्षेत्र ) का उपयोग करेगा। यादृच्छिक वन आपके मामले में एसवीएम से बेहतर काम करता है।Y


यदि विषय के लिए आपके नमूने में मनाया गया द्विआधारी परिणाम है और '1' की अनुमानित संभावना है, तो बैरियर स्कोर है (यदि मुझे याद है) । जैसा कि ओपी को एक द्विआधारी वर्गीकरण समस्या है ज्ञात हैं लेकिन आप एसवीएम के लिए गणना कैसे करते हैं ? ioi{0,1}f^iB=1ni=1n(f^ioi)2oif^i

@fcop एसवीएम के द्विआधारी वर्गीकरण भविष्यवाणी को संभाव्यता में बदलने का एक तरीका है, जिसे प्लैट स्केलिंग ( en.wikipedia.org/wiki/Platt_scaling ) कहा जाता है । अनिवार्य रूप से, SVM वर्गीकरण की गणना करने के बजाय ( या ) as , जहाँ SVM उत्तल द्विघात प्रोग्रामिंग का समाधान है समस्या, प्लॉट स्केलिंग का लॉजिस्टिक ट्रांसफ़ॉर्मेशन लेता है : जहां और प्लॉट स्केलिंग एल्गोरिदम द्वारा निर्धारित पैरामीटर हैं। y^i=+11y^i=sign(g(yi,xi))g(yi,xi)g(yi,xi)f^i=P(Y=1|xi)=11+exp(A×g(yi,xi)+B)AB
रॉबर्टएफ

8

मुझे लगता है कि आपको निश्चित रूप से केवल एयूसी और सटीकता से अधिक मैट्रिक्स में देखना चाहिए।

सटीकता (संवेदनशीलता और विशिष्टता के साथ) एक बहुत ही सरल लेकिन पक्षपाती मीट्रिक है जो आपको पूर्ण भविष्यवाणी परिणाम को देखने के लिए मजबूर करता है और वर्ग संभावनाओं या रैंकिंग के दावे के लिए नहीं खुलता है। यह आबादी को भी ध्यान में नहीं रखता है जो गलत व्याख्या के लिए आमंत्रित करता है क्योंकि 95% सटीकता के साथ जनसंख्या पर 95% सटीकता देने वाले मॉडल को यादृच्छिक होने पर सही होने का मौका नहीं मिलता है, भले ही सटीकता अधिक हो।

AUC मॉडल सटीकता को सुनिश्चित करने के लिए एक अच्छा मीट्रिक है जो जनसंख्या वर्ग की संभावनाओं से स्वतंत्र है। हालांकि, यह आपको कुछ भी नहीं बताएगा कि वास्तव में संभावना के अनुमान कितने अच्छे हैं। आप एक उच्च एयूसी प्राप्त कर सकते हैं लेकिन अभी भी बहुत कम संभावना अनुमान हैं। यह मीट्रिक सटीकता की तुलना में अधिक भेदभाव करता है और निश्चित रूप से आपको बेहतर मॉडल देगा जब कुछ उचित स्कोरिंग नियम के साथ संयोजन में उपयोग किया जाता है, जैसे कि एक अन्य पोस्ट में उल्लिखित बैरियर स्कोर।

आप यहां एक अधिक औपचारिक प्रमाण प्राप्त कर सकते हैं, हालांकि यह पेपर काफी सैद्धांतिक है: AUC: सांख्यिकीय रूप से सुसंगत और सटीकता से अधिक भेदभावकारी उपाय

हालांकि अच्छे मेट्रिक्स का एक गुच्छा उपलब्ध है। बाइनरी क्लास प्रोबेबिलिटी एस्टिमेशन और क्लासी Prob केशन के लिए नुकसान के कार्य: संरचना और अनुप्रयोग एक अच्छा पेपर है जो उचित स्कोरिंग नियमों जैसे बैरियर स्कोर के लिए निवेश करता है।

मॉडल के प्रदर्शन के दावे के लिए मैट्रिक्स के साथ एक और दिलचस्प पेपर मूल्यांकन है: परिशुद्धता, रिकॉल और एफ-माप से आरओसी, सूचना, चिह्नितता और सहसंबंध जैसे अन्य अच्छे प्रदर्शन मैट्रिक्स को सूचित करना।

संक्षेप में, मैं आपको मॉडल के प्रदर्शन पर जोर देने के लिए AUC / Gini और Brier स्कोर को देखने की सलाह दूंगा, लेकिन आपके मॉडल के साथ लक्ष्य के आधार पर अन्य मैट्रिक्स आपकी समस्या को बेहतर ढंग से प्रस्तुत कर सकते हैं।


मूल्यांकन के लिए लिंक: सटीक, रिकॉल और एफ-उपाय से आरओसी, सूचना, चिह्नितता और सहसंबंध मर चुका है
vonjd

यदि विषय के लिए आपके नमूने में मनाया गया द्विआधारी परिणाम है और '1' की अनुमानित संभावना है, तो बैरियर स्कोर है (यदि मुझे याद है) । जैसा कि ओपी को एक द्विआधारी वर्गीकरण समस्या है ज्ञात हैं लेकिन आप एसवीएम के लिए गणना कैसे करते हैं ? ioi{0,1}f^iB=1ni=1n(f^ioi)2oif^i

कोई भी अवरोधक उन तरीकों के लिए महान नहीं है जो केवल आपको एक परिणाम देता है और एक संभावना नहीं। Niether auc है हालांकि यह आपको बताएगा कि आप अपनी भविष्यवाणियों को कितनी अच्छी तरह से रैंक करते हैं। केवल परिणामों के साथ, आपको केवल ROC स्थान में एक बिंदु मिलेगा इसलिए आपको वक्र के नीचे का क्षेत्र त्रिभुज होगा। लेकिन यह अभी भी आपको एक नंबर देगा और इसलिए सभी बाधाओं को कम करेगा, हालांकि यह 0-1 नुकसान में बदल जाएगा। यदि आपके पास केवल परिणाम हैं, तो मैं आपको सटीक, रिकॉल और कोहेन के कप्पा को देखने का सुझाव देता हूं जो कि आपके परिणाम आने पर तैयार किए गए मीट्रिक हैं।
जबकि
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.