क्या मुझे सूक्ष्म-औसत या मैक्रो-औसत मूल्यांकन उपायों के आधार पर निर्णय लेना चाहिए?


21

मैंने अलग-अलग बाइनरी वर्गीकरण एल्गोरिदम पर एक ही डेटासेट के साथ 10-गुना क्रॉस सत्यापन चलाया, और माइक्रो और मैक्रो औसत परिणाम दोनों प्राप्त किए। यह उल्लेख किया जाना चाहिए कि यह एक बहु-लेबल वर्गीकरण समस्या थी।

मेरे मामले में, सच्चे नकारात्मक और सकारात्मक सकारात्मक को समान रूप से तौला जाता है। इसका मतलब है कि सही नकारात्मक की भविष्यवाणी करना उतना ही महत्वपूर्ण है, जितना कि सही सकारात्मक का पूर्वानुमान लगाना।

माइक्रो-एवरेज किए गए उपाय मैक्रो एवरेज वाले की तुलना में कम हैं। यहाँ एक तंत्रिका नेटवर्क और समर्थन वेक्टर मशीन के परिणाम हैं:

यहां छवि विवरण दर्ज करें

मैंने उसी एल्गोरिथ्म पर किसी अन्य एल्गोरिथ्म के साथ प्रतिशत-विभाजन परीक्षण भी चलाया। परिणाम थे:

यहां छवि विवरण दर्ज करें

मैं मैक्रो-औसत परिणामों के साथ प्रतिशत-विभाजन परीक्षण की तुलना करना पसंद करूंगा, लेकिन क्या यह उचित है? मुझे विश्वास नहीं है कि मैक्रो-एवरेज किए गए परिणाम पक्षपाती हैं क्योंकि सच्ची सकारात्मकता और सच्ची नकारात्मकताओं को समान रूप से तौला जाता है, लेकिन फिर, मुझे आश्चर्य है कि क्या यह संतरे के साथ सेब की तुलना करने के समान है?

अपडेट करें

टिप्पणियों के आधार पर मैं दिखाऊंगा कि माइक्रो और मैक्रो औसत की गणना कैसे की जाती है।

मेरे पास 144 लेबल हैं (सुविधाओं या विशेषताओं के समान) जो मैं भविष्यवाणी करना चाहता हूं। प्रत्येक लेबल के लिए परिशुद्धता, रिकॉल और एफ-माप की गणना की जाती है।

---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
   ?   |    ?   |    ?   |   ?    | .. |     ?
---------------------------------------------------

एक द्विआधारी मूल्यांकन उपाय बी (tp, tn, fp, fn) को ध्यान में रखते हुए गणना की जाती है जो कि वास्तविक सकारात्मक (tp), वास्तविक नकारात्मक (tn), झूठी सकारात्मक (fp) और झूठी नकारात्मक (fn) के आधार पर गणना की जाती है। एक विशिष्ट माप के मैक्रो और माइक्रो औसत की गणना निम्नानुसार की जा सकती है:

यहां छवि विवरण दर्ज करें

यहां छवि विवरण दर्ज करें

इन सूत्रों का उपयोग करके हम सूक्ष्म और स्थूल औसत की गणना इस प्रकार कर सकते हैं:

यहां छवि विवरण दर्ज करें

यहां छवि विवरण दर्ज करें

इसलिए, सूक्ष्म-औसत उपाय सभी tp, fp और fn (प्रत्येक लेबल के लिए) जोड़ते हैं, इसके बाद एक नया बाइनरी मूल्यांकन किया जाता है। मैक्रो-एवरेज किए गए उपाय सभी उपाय (प्रेसिजन, रिकॉल या एफ-माप) जोड़ते हैं और लेबल की संख्या के साथ विभाजित करते हैं, जो औसत से अधिक है।

अब, सवाल यह है कि कौन सा उपयोग करना है?


जब आप पूछते हैं कि कौन सा उपयोग करना है, तो क्या उपयोग करना है? दो तरीकों के बीच चयन, परिणामों का सारांश, या कुछ और?
शॉन ईस्टर

1
इरादा उपयोग यह पता लगाने के लिए है कि कौन सा मॉडल सबसे बेहतर है, और यह कितना अच्छा प्रदर्शन करता है, इसके बारे में कुछ बताने के लिए। मुझे पता चला कि माइक्रो माप के अनुसार बेहतर हैं: फॉर्मैन, जॉर्ज और मार्टिन शोलज़। "सेब-टू-सेब क्रॉस-वैलिडेशन स्टडीज में: क्लासिफायरफ़ॉर्मर परफ़ॉर्मेंस माप में नुकसान।" ACM SIGKDD एक्सप्लोरेशन न्यूज़लेटर 12.1 (2010): 49-57।
केंकी

@ केंसी, मुझे विश्वास है कि आपको अपने स्वयं के प्रश्न के उत्तर के रूप में पोस्ट करना चाहिए और इसे सही एवर होने की पुष्टि करनी चाहिए। संदर्भ के लिए धन्यवाद!
fnl

जवाबों:


27

यदि आपको लगता है कि सभी लेबल कम या ज्यादा समान रूप से हैं (लगभग एक ही संख्या के उदाहरण हैं), तो किसी का उपयोग करें।

यदि आपको लगता है कि दूसरों की तुलना में अधिक उदाहरणों के साथ लेबल हैं और यदि आप अपने मीट्रिक को सबसे अधिक आबादी वाले लोगों के प्रति पूर्वाग्रह करना चाहते हैं, तो माइकेडिया का उपयोग करें ।

यदि आपको लगता है कि दूसरों की तुलना में अधिक उदाहरणों के साथ लेबल हैं और यदि आप कम से कम आबादी वाले लोगों की ओर अपने मीट्रिक को पूर्वाग्रह करना चाहते हैं (या कम से कम आप सबसे अधिक आबादी वाले लोगों की ओर पूर्वाग्रह नहीं करना चाहते हैं), तो मैक्रोमीडिया का उपयोग करें ।

यदि माइक्रोमीडिया परिणाम मैक्रोमीडिया एक की तुलना में काफी कम है, तो इसका मतलब है कि आपके पास सबसे अधिक आबादी वाले लेबल में कुछ सकल मिसकैरेज हैं, जबकि आपके छोटे लेबल शायद सही ढंग से वर्गीकृत हैं। यदि मैक्रोमेडिया का परिणाम माइक्रोमीडिया एक की तुलना में काफी कम है, तो इसका मतलब है कि आपके छोटे लेबल खराब वर्गीकृत हैं, जबकि आपके बड़े शायद सही ढंग से वर्गीकृत हैं।

यदि आप सुनिश्चित नहीं हैं कि क्या करना है, तो माइक्रो और मैक्रोएवर दोनों पर तुलना के साथ आगे बढ़ें :)

यह इस विषय पर एक अच्छा पेपर है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.