मेरे पास एक प्रशिक्षित लॉजिस्टिक रिग्रेशन मॉडल है जिसे मैं एक परीक्षण डेटा सेट पर लागू कर रहा हूं। आश्रित चर द्विआधारी (बूलियन) है। परीक्षण डेटा सेट में प्रत्येक नमूने के लिए, मैं एक% संभावना उत्पन्न करने के लिए लॉजिस्टिक रिग्रेशन मॉडल लागू करता हूं जो निर्भर चर सत्य होगा। फिर मैं रिकॉर्ड करता हूं कि क्या एक्यूट वैल्यू सही थी या गलत। मैं एक रेखीय प्रतिगमन मॉडल के रूप में एक या समायोजित आकृति की गणना करने की कोशिश कर रहा हूं ।आर 2
यह मुझे परीक्षण सेट में प्रत्येक नमूने के लिए एक रिकॉर्ड देता है:
prob_value_is_true acutal_value
.34 0
.45 1
.11 0
.84 0
.... ....
मैं सोच रहा हूं कि मॉडल की सटीकता का परीक्षण कैसे किया जाए। मेरा पहला प्रयास एक आकस्मिक तालिका का उपयोग करना था और "अगर prob_value_is_true
> 0.80, का अनुमान है कि वास्तविक मूल्य सत्य है" और फिर गलत वर्गीकरण के लिए सही के अनुपात को मापें। लेकिन मुझे यह पसंद नहीं है, क्योंकि ऐसा लगता है कि मैं सिर्फ 0.80 का एक सीमा के रूप में मूल्यांकन कर रहा हूं, न कि पूरे और सभी prob_value_is_true
मूल्यों पर मॉडल की सटीकता ।
फिर मैंने प्रत्येक प्रॉब्लम_वल्यू_आईएस_ट्र्यू डिस्क्रीट वैल्यू को देखने की कोशिश की, उदाहरण के तौर पर, सभी नमूनों prob_value_is_true
को देखने के लिए = = 0.34 और उन नमूनों का% मापना, जहां एक्यूट वैल्यू सही है (इस मामले में, सही सटीकता होगी यदि सैंपल का% यह सच था = 34%)। मैं प्रत्येक असतत मान पर अंतर को जोड़कर एक मॉडल सटीकता स्कोर बना सकता हूं prob_value_is_true
। लेकिन यहाँ नमूना आकार एक बहुत बड़ी चिंता का विषय है, विशेष रूप से चरम (लगभग 0% या 100%) के लिए, जैसे कि एक्यूट वैल्यू का औसत सटीक नहीं है, इसलिए मॉडल सटीकता को मापने के लिए उनका उपयोग करना सही नहीं लगता है।
मैंने पर्याप्त नमूना आकार (0-.25, .25-.50, .50-75, .75-1.0) सुनिश्चित करने के लिए विशाल रेंज बनाने की कोशिश की, लेकिन वास्तविक मूल्य के उस% के "अच्छाई" को कैसे मापें । सभी नमूने कहें, जहां prob_value_is_true
0.25 और 0.50 के बीच औसतन acutal_value
0.45 है। क्या इसकी सीमा में अच्छा है? 37.5% (रेंज का केंद्र) के पास बुरा नहीं है?
इसलिए मैं इस बात पर अड़ा हुआ हूं कि ऐसा क्या लगता है एक आसान सवाल होना चाहिए, और उम्मीद है कि कोई मुझे लॉजिस्टिक रिग्रेशन मॉडल के लिए सटीकता सटीकता की गणना करने के लिए संसाधन या विधि की ओर संकेत कर सकता है।