एफ-उपाय एक हार्मोनिक मतलब क्यों है और सटीक और याद उपायों का एक अंकगणितीय मतलब नहीं है?


86

जब हम प्रेसिजन और रिकॉल दोनों पर विचार करते हुए एफ-माप की गणना करते हैं, तो हम एक साधारण अंकगणित माध्य के बजाय दो उपायों के हार्मोनिक माध्य लेते हैं।

हार्मोनिक माध्य लेने के पीछे सहज कारण क्या है और एक साधारण औसत नहीं है?


1
अंतर्ज्ञान परिशुद्धता को संतुलित करने और याद करने के लिए है (आमतौर पर सबसे अच्छा माप, लेकिन कुछ मामलों में आप सटीक या याद को अधिकतम करना चाहते हैं, जो एक अलग कहानी है)। यदि कोई एक बहुत कम है, तो आपको उच्च एफ-स्कोर नहीं मिल सकता है।
हरियाली

1
cse.unsw.edu.au/~teachadmin/info/harmonic3.html यह एचएम को समझने का एक अच्छा संसाधन है
सुदीप भंडारी

2
ठीक ऊपर के लिंक: di.unipi.it/~bozzo/The%20Harmonic%20Mean.htm या मूल @ archive.org
Stason

जवाबों:


16

यहां हमारे पास पहले से ही कुछ विस्तृत उत्तर हैं, लेकिन मुझे लगा कि इसके बारे में कुछ और जानकारी कुछ लोगों के लिए मददगार होगी, जो गहराई तक पहुंचना चाहते हैं (विशेष रूप से एफ उपाय)।

माप के सिद्धांत के अनुसार समग्र माप को निम्नलिखित 6 परिभाषाओं को पूरा करना चाहिए:

  1. कनेक्टेडनेस (दो जोड़े का आदेश दिया जा सकता है) और ट्रांज़िटिविटी (यदि e1> = e2 और e2> = e3 तो e1> = e3)
  2. स्वतंत्रता: दो घटक प्रभावशीलता के लिए स्वतंत्र रूप से अपने प्रभाव का योगदान करते हैं।
  3. थॉमसन की स्थिति: यह देखते हुए कि निरंतर याद (सटीक) में हम सटीकता (रिकॉल) के दो मूल्यों के लिए प्रभावशीलता में अंतर पाते हैं, फिर इस मूल्य को निरंतर मूल्य को बदलकर हटाया या बदला नहीं जा सकता है।
  4. प्रतिबंधित सॉल्वेबिलिटी।
  5. प्रत्येक घटक आवश्यक है: दूसरे को छोड़ते समय एक में भिन्नता प्रभावशीलता में भिन्नता देती है।
  6. प्रत्येक घटक के लिए आर्कमेडियन संपत्ति। यह केवल यह सुनिश्चित करता है कि एक घटक पर अंतराल तुलनीय है।

हम तब प्राप्त कर सकते हैं और प्रभावशीलता का कार्य प्राप्त कर सकते हैं : यहां छवि विवरण दर्ज करें

और आम तौर पर हम प्रभावशीलता का उपयोग नहीं करते हैं लेकिन बहुत अधिक एफ एफ स्कोर क्योंकि :
यहां छवि विवरण दर्ज करें

अब हमारे पास एफ उपाय का सामान्य सूत्र है:

यहां छवि विवरण दर्ज करें

जहां हम बीटा को सेट करके रिकॉल या परिशुद्धता पर अधिक प्रभाव डाल सकते हैं, क्योंकि बीटा को निम्नानुसार परिभाषित किया गया है:

यहां छवि विवरण दर्ज करें

अगर हम सटीक से अधिक महत्वपूर्ण वजन को याद करते हैं (सभी प्रासंगिक चुने गए हैं) तो हम बीटा को 2 के रूप में सेट कर सकते हैं और हमें F2 उपाय मिलता है। और अगर हम रिवर्स और वेट प्रिसेंस को रिकॉल से अधिक करते हैं (उदाहरण के लिए चयनित तत्व यथासंभव प्रासंगिक हैं, उदाहरण के लिए कुछ व्याकरण त्रुटि सुधार परिदृश्य जैसे CoNLL में ) तो हम बीटा को केवल 0.5 के रूप में सेट करते हैं और F0.5 माप प्राप्त करते हैं। और जाहिर है कि हम बीटा को 1 के रूप में सेट कर सकते हैं ताकि ज्यादातर इस्तेमाल किए जाने वाले एफ 1 माप (सटीक और याद के हार्मोनिक मतलब) प्राप्त कर सकें।

मुझे लगता है कि कुछ हद तक मैं पहले ही जवाब दे चुका हूं कि हम अंकगणित का उपयोग क्यों नहीं करते हैं।

संदर्भ:

  1. https://en.wikipedia.org/wiki/F1_score
  2. एफ-माप का सच
  3. जानकारी वापस लेने योग्य

99

उदाहरण के लिए समझाने के लिए, 30mph और 40mph का औसत क्या है? यदि आप प्रत्येक गति पर 1 घंटे के लिए ड्राइव करते हैं, तो 2 घंटे से अधिक की औसत गति वास्तव में अंकगणितीय औसत, 35mph है।

हालाँकि यदि आप प्रत्येक गति पर समान दूरी के लिए ड्राइव करते हैं - 10 मील - तो 20 मील से अधिक की औसत गति 30 और 40 का हार्मोनिक मतलब है, लगभग 34.3mph।

कारण यह है कि औसत के लिए मान्य होने के लिए, आपको वास्तव में समान स्केल की गई इकाइयों में मूल्यों की आवश्यकता होती है। प्रति घंटे मील की तुलना में घंटों की समान संख्या की आवश्यकता होती है; उसी मील की तुलना में आपको मील प्रति घंटे की औसत मात्रा की आवश्यकता होती है, जो कि हार्मोनिक का मतलब ठीक है।

परिशुद्धता और याद करते हैं कि दोनों अंश में वास्तविक सकारात्मकता है, और विभिन्न भाजक हैं। उन्हें औसत करने के लिए यह वास्तव में केवल उनके पारस्परिक औसत करने के लिए समझ में आता है, इस प्रकार हार्मोनिक मतलब है।


7
धन्यवाद, यह एक अच्छा तर्क है कि यह सिद्धांत से क्यों समर्थित है; मेरा जवाब व्यावहारिक पक्ष पर अधिक था।
है क्विट -

77

क्योंकि यह चरम मूल्यों को अधिक सजा देता है।

एक तुच्छ विधि पर विचार करें (जैसे हमेशा लौटने वाला वर्ग ए)। वर्ग बी के अनंत डेटा तत्व हैं, और कक्षा ए का एक एकल तत्व हैं:

Precision: 0.0
Recall:    1.0

अंकगणित माध्य लेते समय, यह 50% सही होगा। सबसे खराब संभव परिणाम होने के बावजूद ! हार्मोनिक मतलब के साथ, एफ 1-माप 0 है।

Arithmetic mean: 0.5
Harmonic mean:   0.0

दूसरे शब्दों में, उच्च F1 रखने के लिए, आपको उच्च परिशुद्धता और रिकॉल दोनों की आवश्यकता होती है ।


जब स्मरण 0.0 होता है तो परिशुद्धता 0.0 से अधिक सही होना चाहिए? लेकिन मुझे आपके उदाहरण में बात मिलती है। अच्छी तरह से समझाया - धन्यवाद।
लंदन का लड़का

1
आपके उदाहरण में, क्लास A के लिए परिशुद्धता 0 के बजाय 0.5 है और क्लास A का रिकॉल 1 है; कक्षा बी के लिए सटीकता 0 है और कक्षा बी की याद 0 हम है। मुझे लगता है कि आपके संतुलित वर्ग का मतलब है कि सच्चे लेबल A और B हैं; प्रत्येक 50% डेटा पर लागू होता है।
हरियाली

चलो कक्षा बी के अनंत तत्व बनाते हैं, और वर्ग ए का एक तत्व। यह गणित को एफ 1 के पीछे नहीं बदलता है।
है क्विट - Anony-Mousse

2
यह अधिक संतुलन का चयन करने के लिए सिर्फ एक अनुमान नहीं है। हार्मोनिक माध्य केवल एक ही तरीका है जो इन अनुपातों की इकाइयों को देखते हुए समझ में आता है। मतलब की तुलना में अर्थ नहीं होगा
सीन ओवेन

यह कहाँ "हेयुरिस्टिक" कहता है, और आपकी टिप्पणी मेरे उत्तर से भिन्न कहाँ है? लेकिन एफ उपाय है में यह सटीक हो जाती है और याद भी उतना ही महत्वपूर्ण हैं कि एक अनुमानी। यही कारण है कि बीटा शब्द को चुना जाना चाहिए - हेयुरिस्टिक रूप से, एक आमतौर पर बीटा = 1 का उपयोग करता है।
है क्विट - Anony-Mousse

29

उपरोक्त उत्तर अच्छी तरह से समझाया गया है। यह अंकगणित माध्य की प्रकृति और भूखंडों के साथ हार्मोनिक माध्य को समझने के लिए एक त्वरित संदर्भ के लिए है। जैसा कि आप भूखंड से देख सकते हैं, एक्स अक्ष और वाई अक्ष को सटीक और याद करते हैं, और एफ अक्ष के रूप में जेड अक्ष पर विचार करें। तो, हार्मोनिक माध्य के भूखंड से, सटीक और याद दोनों को समान रूप से F1 अंक के लिए योगदान करना चाहिए जो अंकगणित माध्य के विपरीत उठता है।

यह अंकगणित माध्य के लिए है।

यहां छवि विवरण दर्ज करें

यह हार्मोनिक माध्य के लिए है।

यहां छवि विवरण दर्ज करें


कृपया अपने उत्तर को ठीक से संपादित और स्वरूपित करने के लिए फ़ॉर्मेटिंग टूल का उपयोग करें। छवि यहाँ प्रदर्शित होनी चाहिए, इसकी हाइपरलिंक नहीं।
मोर्स

26

हार्मोनिक माध्य का मतलब है अंकगणित माध्य के बराबर जो कि अंकगणितीय माध्य से औसतन होना चाहिए। अधिक सटीक रूप से, हार्मोनिक मतलब के साथ, आप अपने सभी नंबरों को "औसत दर्जे का" रूप में बदल देते हैं (पारस्परिक रूप से), आप उनके अंकगणित माध्य लेते हैं और फिर परिणाम को मूल प्रतिनिधित्व में बदल देते हैं (पारस्परिक फिर से लेकर)।

परिशुद्धता और रिकॉल "स्वाभाविक रूप से" पारस्परिक हैं क्योंकि उनका अंश समान है और उनके भाजक अलग हैं। अंकगणित औसत से औसत से अधिक समझदार होते हैं जब उनके समान भाजक होते हैं।

अधिक अंतर्ज्ञान के लिए, मान लीजिए कि हम वास्तविक सकारात्मक वस्तुओं की संख्या को स्थिर रखते हैं। फिर सटीक और रिकॉल के हार्मोनिक माध्य लेने से, आप स्पष्ट रूप से गलत सकारात्मक और गलत नकारात्मक के अंकगणित माध्य लेते हैं। मूल रूप से इसका मतलब है कि झूठी सकारात्मक और गलत नकारात्मक आपके लिए समान रूप से महत्वपूर्ण हैं जब वास्तविक सकारात्मक समान रहते हैं। यदि एक एल्गोरिथ्म में N अधिक झूठे सकारात्मक आइटम हैं लेकिन N कम झूठे नकारात्मक (समान सत्य सकारात्मक होने पर), एफ-माप समान रहता है।

दूसरे शब्दों में, एफ-माप उपयुक्त है जब:

  1. गलतियाँ भी उतनी ही बुरी हैं, चाहे वे झूठी सकारात्मक हों या झूठी नकारात्मक
  2. गलतियों की संख्या को सही सकारात्मक की संख्या के सापेक्ष मापा जाता है
  3. सच्ची नकारात्मकताएं निर्बाध होती हैं

बिंदु 1 सच हो सकता है या नहीं भी हो सकता है, एफ-माप के भारित वेरिएंट हैं जिनका उपयोग किया जा सकता है यदि यह धारणा सच नहीं है। बिंदु 2 काफी स्वाभाविक है क्योंकि हम परिणामों को बड़े पैमाने पर करने की उम्मीद कर सकते हैं यदि हम अधिक से अधिक अंक वर्गीकृत करते हैं। रिश्तेदार संख्या समान रहना चाहिए।

प्वाइंट 3 काफी दिलचस्प है। कई अनुप्रयोगों में नकारात्मक प्राकृतिक डिफ़ॉल्ट होते हैं और यह भी निर्दिष्ट करना कठिन या मनमाना हो सकता है कि वास्तव में एक सच्चे नकारात्मक के रूप में क्या मायने रखता है। उदाहरण के लिए फायर अलार्म में हर सेकंड, हर नैनोसेकंड, हर बार प्लैंक टाइम बीतने पर भी एक सच्ची नकारात्मक घटना होती है। यहां तक ​​कि चट्टान के एक टुकड़े में हर समय इन सच्ची नकारात्मक आग का पता लगाने वाली घटनाएं होती हैं।

या चेहरे का पता लगाने के मामले में, अधिकांश समय आप छवि के संभावित क्षेत्रों के अरबों " सही ढंग से वापस नहीं करते हैं " लेकिन यह दिलचस्प नहीं है। दिलचस्प मामलों रहे हैं जब आप करते हैं एक प्रस्तावित पता लगाने वापसी या जब आप चाहिए इसे वापस।

इसके विपरीत वर्गीकरण सटीकता सही सकारात्मक और वास्तविक नकारात्मक के बारे में समान रूप से परवाह करता है और अधिक उपयुक्त है यदि नमूनों की कुल संख्या (वर्गीकरण घटनाओं) अच्छी तरह से परिभाषित और बल्कि छोटी है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.