मैं अक्सर परीक्षण सेट को आयोजित करके और प्रशिक्षण सेट पर एक मॉडल को प्रशिक्षित करके एक वर्गीकरण मॉडल के प्रदर्शन का मूल्यांकन करने के बारे में सुनता हूं। फिर 2 वैक्टर बनाना, एक भविष्यवाणी मूल्यों के लिए और एक सच्चे मूल्यों के लिए। स्पष्ट रूप से एक तुलना करने से कोई व्यक्ति एफ-स्कोर, कप्पा स्टेटिस्टिक, प्रिसिजन एंड रिकॉल, आरओसी कर्व्स आदि जैसी चीजों का उपयोग करके अपनी पूर्वानुमानित शक्ति द्वारा मॉडल के प्रदर्शन का न्याय कर सकता है।
यह प्रतिगमन जैसे संख्यात्मक भविष्यवाणी का मूल्यांकन करने के लिए कैसे तुलना करता है? मुझे लगता है कि आप प्रशिक्षण सेट पर प्रतिगमन मॉडल को प्रशिक्षित कर सकते हैं, इसका उपयोग मूल्यों की भविष्यवाणी करने के लिए कर सकते हैं, फिर इन अनुमानित मूल्यों की तुलना परीक्षण सेट में बैठे सच्चे मूल्यों से कर सकते हैं। जाहिर है कि प्रदर्शन के उपाय अलग-अलग होने चाहिए क्योंकि यह कोई वर्गीकरण कार्य नहीं है। सामान्य अवशिष्ट और आँकड़े स्पष्ट उपाय हैं लेकिन क्या प्रतिगमन मॉडल के प्रदर्शन का मूल्यांकन करने के लिए अधिक / बेहतर तरीके हैं? ऐसा लगता है कि वर्गीकरण में बहुत सारे विकल्प हैं, लेकिन प्रतिगमन आर 2 और अवशेषों के लिए छोड़ दिया गया है ।