किसी भी मीट्रिक की तरह, एक अच्छा मीट्रिक वह बेहतर है जो "गूंगा", द्वारा-मौका अनुमान है, अगर आपको टिप्पणियों के बारे में कोई जानकारी नहीं है। इसे आंकड़ों में इंटरसेप्ट-ओनली मॉडल कहा जाता है।
यह "गूंगा" -गुस्सा 2 कारकों पर निर्भर करता है:
- कक्षाओं की संख्या
- कक्षाओं का संतुलन: प्रेक्षित प्रेस्क्रिप्शन में उनका प्रचलन
लॉगलॉस मीट्रिक के मामले में, एक सामान्य "सुप्रसिद्ध" मीट्रिक यह कहना है कि 0.693 गैर-सूचनात्मक मूल्य है। यह आंकड़ा p = 0.5
द्विआधारी समस्या के किसी भी वर्ग के लिए भविष्यवाणी करके प्राप्त किया जाता है। यह केवल संतुलित बाइनरी समस्याओं के लिए मान्य है । क्योंकि जब एक वर्ग का प्रचलन 10% होता है, तो आप p =0.1
हमेशा उस वर्ग के लिए भविष्यवाणी करेंगे । यह आपकी डंबल की बेसलाइन होगी, बाय-बाय प्रेडिक्शन, क्योंकि प्रेडिक्टिंग 0.5
डम्बर होगा।
I. डम्ब-लॉगलॉस पर कक्षाओं की संख्या का प्रभाव N
:
संतुलित स्थिति में (प्रत्येक वर्ग में एक ही प्रचलन है), जब आप p = prevalence = 1 / N
हर अवलोकन के लिए भविष्यवाणी करते हैं, तो समीकरण बस बन जाता है:
Logloss = -log(1 / N)
log
किया जा रहा है Ln
जो लोग कि सम्मेलन का उपयोग के लिए, neperian लघुगणक।
बाइनरी केस में, N = 2
:Logloss = - log(1/2) = 0.693
तो गूंगा-लॉजॉसेस निम्नलिखित हैं:
द्वितीय। गूंगा-लोग्लॉस पर कक्षाओं के प्रसार का प्रभाव:
ए। बाइनरी वर्गीकरण का मामला
इस मामले में, हम हमेशा भविष्यवाणी करते हैं p(i) = prevalence(i)
, और हम निम्नलिखित तालिका प्राप्त करते हैं:
इसलिए, जब कक्षाएं बहुत असंतुलित होती हैं (व्यापकता <2%), तो 0.1 का लॉगलॉस वास्तव में बहुत खराब हो सकता है! जैसे 98% की सटीकता उस स्थिति में खराब होगी। तो शायद Logloss उपयोग करने के लिए सबसे अच्छा मीट्रिक नहीं होगा
ख। तीन श्रेणी का मामला
"गूंगा" -लोगलॉस प्रचलन के आधार पर - तीन-स्तरीय मामला:
हम यहां संतुलित बाइनरी और तीन-श्रेणी के मामलों (0.69 और 1.1) के मूल्यों को देख सकते हैं।
निष्कर्ष
0.69 का लॉगलॉस मल्टीस्कल्स समस्या में अच्छा हो सकता है, और बाइनरी बायस्ड मामले में बहुत खराब हो सकता है।
अपने मामले के आधार पर, आप बेहतर होगा कि आप अपने आप को समस्या की आधारभूत गणना करें, अपनी भविष्यवाणी के अर्थ की जांच करने के लिए।
पक्षपाती मामलों में, मैं समझता हूं कि लॉगलॉस में सटीकता और अन्य नुकसान कार्यों के समान समस्या है: यह आपके प्रदर्शन का केवल वैश्विक माप प्रदान करता है। इसलिए आप अल्पसंख्यक वर्गों (याद और सटीक) पर केंद्रित मैट्रिक्स के साथ अपनी समझ को बेहतर ढंग से पूरक करेंगे, या शायद लॉगलॉस का उपयोग न करें।