सबसे पहले, मैं "सटीकता" कभी-कभी थोड़ा भ्रामक पाता हूं, क्योंकि यह अलग-अलग चीजों को संदर्भित करता है:
सिस्टम या विधियों (मैं विश्लेषणात्मक रसायनज्ञ हूं) के मूल्यांकन के लिए जीनल में शब्द सटीकता भविष्यवाणियों के पूर्वाग्रह को संदर्भित करता है, अर्थात यह सवाल का जवाब देता है कि औसतन कितनी अच्छी भविष्यवाणियां हैं।
जैसा कि आप जानते हैं, कई अलग-अलग प्रदर्शन उपाय हैं जो क्लासिफायर्स के प्रदर्शन के विभिन्न पहलुओं का जवाब देते हैं। उनमें से एक को सटीकता भी कहा जाता है। यदि आपका पेपर मशीन सीखने / वर्गीकरण करने वाले दर्शकों के लिए नहीं है, तो इस अंतर को बहुत स्पष्ट करने के लिए, मैं इसका उपयोग करूँगा। यहां तक कि सटीकता के इस अधिक विशिष्ट अर्थ के लिए, मैं बहुत स्पष्ट होगा कि मैं सटीकता को फिर से कॉल करता हूं क्योंकि कक्षा असंतुलन से निपटने के कई तरीके हो सकते हैं। आमतौर पर, वर्ग असंतुलन को अनदेखा किया जाता है, जिससे जाने-माने गणना होती है। हालांकि, आप संवेदनशीलता और विशिष्टता के औसत का भी उपयोग कर सकते हैं, जो आपके औसत भार को वर्ग असंतुलन को नियंत्रित करने के लिए है।TP+TNall cases
एफ स्कोर अक्सर सटीक और याद का हरात्मक माध्य (या सकारात्मक भावी सूचक मूल्य और संवेदनशीलता) के रूप में शुरू की है। आपके प्रश्न के लिए, मुझे लगता है कि इसे थोड़ा आगे बढ़ाने और इसे सरल बनाने में मददगार है:
F=2⋅precision⋅recallprecision+recall=2TPall PTPallTTPall P+TPallT=2TP2all P⋅allTTP⋅all Tall P⋅allT+TP⋅all Pall P⋅allT=2 TP2TP⋅all T+TP⋅all P=2 TPall T+all P
पिछले अभिव्यक्ति है नहीं कुछ भी मैं परीक्षण मामलों की एक निश्चित समूह के रूप में के बारे में सोच सकते हैं कि का एक अंश। विशेष रूप से, ट्रू और पॉज़िटिव मामलों के बीच एक (भारी) ओवरलैप अपेक्षित है। यह मुझे प्रतिशत के रूप में एफ-स्कोर व्यक्त करने से रोकता है क्योंकि इस तरह के मामलों का अनुपात होता है। वास्तव में, मुझे लगता है कि मैं पाठक को चेतावनी दूंगा कि एफ-स्कोर की ऐसी व्याख्या नहीं है।