सहपाठियों का मूल्यांकन: आरओसी बनाम घटता सीखना


11

मैं एक बहुस्तरीय पाठ वर्गीकरण समस्या के लिए 2 अलग-अलग क्लासिफायर की तुलना करना चाहूंगा जो बड़े प्रशिक्षण डेटासेट का उपयोग करते हैं। मुझे संदेह है कि क्या मुझे 2 क्लासिफायर की तुलना करने के लिए आरओसी कर्व्स या लर्निंग कर्व्स का उपयोग करना चाहिए।

एक तरफ, सीखने के मोड़ प्रशिक्षण डाटासेट के आकार को तय करने के लिए उपयोगी होते हैं, क्योंकि आप उस डेटासेट का आकार पा सकते हैं जिस पर क्लासिफायर सीखना बंद कर देता है (और शायद गिरावट)। तो इस मामले में सबसे अच्छा क्लासिफायर सबसे छोटे डेटासेट आकार के साथ उच्चतम सटीकता तक पहुंचने वाला हो सकता है।

दूसरी ओर, आरओसी वक्र आपको संवेदनशीलता / विशिष्टता के बीच सही व्यापार-बंद के साथ एक बिंदु खोजने देता है। इस मामले में सबसे अच्छा क्लासिफायर किसी एफपीआर के लिए सबसे अधिक टीपीआर के साथ शीर्ष-बाएं हिस्से के करीब है।

क्या मुझे दोनों मूल्यांकन विधियों का उपयोग करना चाहिए? क्या एक बेहतर लर्निंग कर्व के साथ एक विधि के लिए संभव है कि एक खराब आरओसी वक्र, और इसके विपरीत हो?


क्या आपके पास एक क्लासिफायरियर का उदाहरण है जहां प्रशिक्षण सेट बड़ा हो जाने पर प्रदर्शन कम हो जाता है?
मोग्रोन

जवाबों:


11

लर्निंग कर्व केवल एक निदान उपकरण है, जो आपको बताता है कि आपका मॉडल कितनी तेजी से सीखता है और क्या आपका पूरा विश्लेषण बहुत छोटे सेटों / बहुत छोटे पहनावा (यदि लागू होता है) के quirky क्षेत्र में फंस नहीं रहा है। इस प्लॉट का एकमात्र हिस्सा जो मॉडल मूल्यांकन के लिए दिलचस्प है, इसका अंत है, अर्थात अंतिम प्रदर्शन - लेकिन इसके लिए रिपोर्ट किए जाने वाले प्लॉट की आवश्यकता नहीं है।
एक सीखने की अवस्था के आधार पर एक मॉडल का चयन करना क्योंकि आपने अपने प्रश्न में स्केच किया है, बल्कि एक खराब विचार है, क्योंकि आप एक ऐसे मॉडल का चयन करने की संभावना रखते हैं जो बहुत छोटे नमूने सेट पर ओवरफिट करने में सबसे अच्छा है।

आरओसी के बारे में ... आरओसी वक्र द्विआधारी मॉडल का आकलन करने की एक विधि है जो एक आत्मविश्वास स्कोर पैदा करता है कि एक वस्तु एक वर्ग से संबंधित है; संभवतः उन्हें एक वास्तविक क्लासीफायर में बदलने के लिए उन्हें सर्वश्रेष्ठ थ्रेसहोल्ड खोजने के लिए भी।
आप जो वर्णन करते हैं वह आरओसी अंतरिक्ष में टीपीआर / एफपीआर के स्कैटरप्लॉट के रूप में अपने क्लासीफायर के प्रदर्शन की साजिश रचने के लिए एक विचार है और इसे चुनने के लिए निकटतम-टॉप-लेफ्ट-कॉर्नर मानदंड का उपयोग करें जो कि झूठी अलार्म और मिसेज पैदा करने के बीच सबसे अच्छा संतुलित है - - यह विशेष उद्देश्य केवल एक सर्वश्रेष्ठ एफ-स्कोर (सटीक और स्मरण का हार्मोनिक मतलब) के साथ मॉडल का चयन करके अधिक कुशलता से प्राप्त किया जा सकता है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.