दिया हुआ
- उदाहरणों के साथ एक डाटासेट एक साथ के साथ कक्षाएं जहां हर उदाहरण वास्तव में करने के लिए एक वर्ग के अंतर्गत आता है
- एक बहुस्तरीय क्लासिफायरियर
प्रशिक्षण और परीक्षण के बाद मैं मूल रूप से के साथ एक मेज है सच वर्ग और भविष्यवाणी की वर्ग हर उदाहरण के लिए परीक्षण सेट में। इसलिए हर उदाहरण के लिए मेरे पास या तो एक मैच ( ) या एक मिस ( ) है।y मैं = एक मैं y मैं ≠ एक मैं
मैं मैच की गुणवत्ता का मूल्यांकन कैसे कर सकता हूं? मुद्दा यह है कि कुछ वर्गों में कई सदस्य हो सकते हैं, अर्थात कई उदाहरण इसके हैं। जाहिर है कि यदि सभी डेटा बिंदुओं में से 50% एक वर्ग के हैं और मेरा अंतिम क्लासिफायर 50% सही है, तो मुझे कुछ नहीं मिला है। मैं बस एक तुच्छ क्लासिफायर बनाया जा सकता है जो कि सबसे बड़ी कक्षा को कोई फर्क नहीं पड़ता कि इनपुट क्या है।
क्या प्रत्येक कक्षा के लिए मैचों और हिट के ज्ञात परीक्षण सेट के आधार पर एक क्लासिफायर की गुणवत्ता का अनुमान लगाने के लिए एक मानक तरीका है? शायद प्रत्येक विशेष वर्ग के लिए मिलान दरों में अंतर करना भी महत्वपूर्ण है?
सबसे आसान तरीका जो मैं सोच सकता हूं, वह है सबसे बड़े वर्ग के सही मैचों को बाहर करना। और क्या?