मैं हाल ही में संभाव्य कक्षा के लिए उचित स्कोरिंग नियमों के बारे में सीख रहा हूं। इस वेबसाइट पर कई थ्रेड्स ने इस बात पर जोर दिया है कि सटीकता एक अनुचित स्कोरिंग नियम है और इसका उपयोग लॉजिस्टिक रिग्रेशन जैसे एक संभाव्य मॉडल द्वारा उत्पन्न भविष्यवाणियों की गुणवत्ता का मूल्यांकन करने के लिए नहीं किया जाना चाहिए।
हालांकि, मैंने जो कुछ अकादमिक पेपर पढ़े हैं, उनमें द्विआधारी वर्गीकरण सेटिंग में एक (गैर-सख्त) उचित स्कोरिंग नियम के उदाहरण के रूप में गर्भपात नुकसान दिया है। सबसे स्पष्ट व्याख्या जो मुझे मिल सकती है, वह इस पृष्ठ में थी। पेज 7 के नीचे। मेरी समझ में सबसे अच्छा है, मिसकैरेजिफिकेशन लॉस को कम करना अधिकतम सटीकता के बराबर है, और पेपर में समीकरण सहज रूप से समझ में आते हैं।
उदाहरण के लिए: कागज के अंकन का उपयोग करते हुए, यदि ब्याज की श्रेणी का वास्तविक सशर्त संभाव्यता (कुछ विशेषता वेक्टर x दिया गया है ) of = 0.7 है, तो किसी भी पूर्वानुमान q > 0.5 में अपेक्षित हानि आर (η | q ) = होगी। 0.7 (0) + 0.3 (1) = 0.3, और किसी भी क्ष 0.5 0.7 की एक उम्मीद नुक़सान होता। इसलिए नुकसान फ़ंक्शन q = 0.7 = 0.7 पर कम से कम किया जाएगा और परिणामस्वरूप उचित होगा; सच्ची सशर्त संभावनाओं और पूर्वानुमानों की संपूर्ण सीमा का सामान्यीकरण वहाँ से काफी सीधा लगता है।
उपर्युक्त गणनाओं और कथनों को सही मानते हुए, एक गैर-अद्वितीय न्यूनतम की कमियां और 0.5 से ऊपर की सभी भविष्यवाणियां समान न्यूनतम हानि को साझा करना स्पष्ट हैं। मुझे अभी भी पारंपरिक विकल्पों जैसे कि लॉग स्कोर, बैरियर स्कोर, आदि पर सटीकता का उपयोग करने का कोई कारण नहीं दिखता है। हालांकि, क्या यह कहना सही है कि द्विआधारी सेटिंग में संभाव्य मॉडल का मूल्यांकन करते समय सटीकता एक उचित स्कोरिंग नियम है, या मैं एक बना रहा हूं गलती - या तो गर्भपात के नुकसान की मेरी समझ में, या इसे सटीकता के साथ बराबर करने में?