एफ -1 स्कोर बनाम संतुलित सटीकता


15

मैं सोच रहा था कि क्या कोई संतुलित सटीकता के बीच अंतर बता सकता है

b_acc = (sensitivity + specificity)/2

और एफ 1 स्कोर जो है:

f1 = 2*precision*recall/(precision + recall) 

जवाबों:


19

गणितीय रूप से, b_acc याद रखने का अर्थमूलक अर्थ है। पी और रिकॉल_और एफ 1, रिकॉल_पी और प्रिसिजन_पी का हार्मोनिक माध्य है।

दोनों F1 और b_acc क्लासिफायरियर मूल्यांकन के लिए मैट्रिक्स हैं, जो (कुछ हद तक) क्लास असंतुलन को संभालते हैं। दो वर्गों (एन या पी) में से कौन दूसरे के आधार पर निर्भर करता है, प्रत्येक मीट्रिक दूसरे से बेहतर प्रदर्शन करता है।

1) यदि एन >> पी, एफ 1 बेहतर है।

2) यदि P >> N, b_acc बेहतर है।

स्पष्ट रूप से, यदि आप लेबल-स्विच कर सकते हैं, तो दोनों मैट्रिक्स ऊपर दिए गए दो असंतुलन मामलों में से किसी में भी उपयोग किए जा सकते हैं। यदि नहीं, तो प्रशिक्षण डेटा में असंतुलन के आधार पर, आप उपयुक्त मीट्रिक का चयन कर सकते हैं।


1
धन्यवाद सर, क्या आपके पास सकारात्मक / नकारात्मक वर्गों की संख्या के संदर्भ में Fscore बनाम संतुलित सटीकता चुनने के बारे में जानकारी के लिए एक संदर्भ है?
गिन

मैं दोनों के बीच चयन करने के बारे में अधिक जानकारी के लिए दूसरे @ जिन के अनुरोध को चाहूंगा। मेरे पास कुछ डेटा है जहां N लगभग 8% है। उपरोक्त उत्तर से, ऐसा लगता है कि मुझे संतुलित सटीकता का उपयोग करना चाहिए। मैं इस पसंद (P> N -> b_acc) पर अन्य संदर्भों की तलाश कर रहा हूं लेकिन कुछ भी नहीं देखा है।
अंगीनेन १२१० १०

इससे मुझे कोई मतलब नहीं है। बैलेंस्ड सटीकता लेबल स्विचिंग के तहत अपरिवर्तनीय है। यदि आप अपरिवर्तित होंगे तो लेबल स्विचिंग द्वारा आप इसे "बेहतर कैसे बना सकते हैं"?
टीसी प्रॉक्टर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.