वर्तमान में मैं पाठ से निकाले गए विभिन्न संस्थाओं पर कई अलग-अलग क्लासिफायर का उपयोग कर रहा हूं, और सटीक / रिकॉल का उपयोग करके सारांश के रूप में याद कर रहा हूं कि प्रत्येक अलग-अलग क्लासिफायर किसी दिए गए डेटासेट में कैसा प्रदर्शन करता है।
मुझे आश्चर्य हो रहा है कि क्या एक समान तरीके से इन क्लासिफायर के प्रदर्शन की तुलना करने का एक सार्थक तरीका है, लेकिन जो परीक्षण किए जा रहे डेटा में प्रत्येक इकाई की कुल संख्या को भी ध्यान में रखता है?
वर्तमान में, मैं प्रदर्शन के माप के रूप में परिशुद्धता / रिकॉल का उपयोग कर रहा हूं, इसलिए ऐसा कुछ हो सकता है:
Precision Recall
Person classifier 65% 40%
Company classifier 98% 90%
Cheese classifier 10% 50%
Egg classifier 100% 100%
हालाँकि, मैं जो डेटासेट चला रहा हूँ, उसमें 100k लोग, 5k कंपनियाँ, 500 चीज़ और 1 अंडा हो सकता है।
तो क्या एक सारांश सांख्यिकीय है जो मैं उपरोक्त तालिका में जोड़ सकता हूं जो प्रत्येक आइटम की कुल संख्या को भी ध्यान में रखता है? या क्या इस तथ्य को मापने का कोई तरीका है कि उदाहरण के लिए एग क्लासिफायर पर 100% पूर्व / आरईसी केवल 1 डेटा आइटम के साथ सार्थक नहीं हो सकता है?
मान लीजिए कि हमारे पास सैकड़ों ऐसे क्लासीफायर हैं, मुझे लगता है कि मैं "किस क्लासीफायर से बेहतर प्रदर्शन कर रहा हूं?"