प्रशिक्षण और परीक्षण सेट का उपयोग करके प्रतिगमन मॉडल के प्रदर्शन का मूल्यांकन?


10

मैं अक्सर परीक्षण सेट को आयोजित करके और प्रशिक्षण सेट पर एक मॉडल को प्रशिक्षित करके एक वर्गीकरण मॉडल के प्रदर्शन का मूल्यांकन करने के बारे में सुनता हूं। फिर 2 वैक्टर बनाना, एक भविष्यवाणी मूल्यों के लिए और एक सच्चे मूल्यों के लिए। स्पष्ट रूप से एक तुलना करने से कोई व्यक्ति एफ-स्कोर, कप्पा स्टेटिस्टिक, प्रिसिजन एंड रिकॉल, आरओसी कर्व्स आदि जैसी चीजों का उपयोग करके अपनी पूर्वानुमानित शक्ति द्वारा मॉडल के प्रदर्शन का न्याय कर सकता है।

यह प्रतिगमन जैसे संख्यात्मक भविष्यवाणी का मूल्यांकन करने के लिए कैसे तुलना करता है? मुझे लगता है कि आप प्रशिक्षण सेट पर प्रतिगमन मॉडल को प्रशिक्षित कर सकते हैं, इसका उपयोग मूल्यों की भविष्यवाणी करने के लिए कर सकते हैं, फिर इन अनुमानित मूल्यों की तुलना परीक्षण सेट में बैठे सच्चे मूल्यों से कर सकते हैं। जाहिर है कि प्रदर्शन के उपाय अलग-अलग होने चाहिए क्योंकि यह कोई वर्गीकरण कार्य नहीं है। सामान्य अवशिष्ट और आँकड़े स्पष्ट उपाय हैं लेकिन क्या प्रतिगमन मॉडल के प्रदर्शन का मूल्यांकन करने के लिए अधिक / बेहतर तरीके हैं? ऐसा लगता है कि वर्गीकरण में बहुत सारे विकल्प हैं, लेकिन प्रतिगमन आर 2 और अवशेषों के लिए छोड़ दिया गया है ।आर2आर2


1
मुझे यकीन नहीं है कि आप क्या सवाल पूछ रहे हैं, लेकिन एक निरंतर उत्पादन के साथ प्रतिगमन मॉडल के लिए एक स्पष्ट त्रुटि मीट्रिक मॉडल आउटपुट और परिणाम चर के बीच वर्ग त्रुटि (MSE) है।
बिग्रीन

तो बस वास्तविक और अनुमानित के बीच एक त्रुटि उपाय।
स्टेटिक टाइम

हां, प्रशिक्षण सेट पर अनुकूलित और परीक्षण सेट का उपयोग करके मान्य किया गया।
बिग्रीन

जवाबों:


2

जैसा कि कहा गया है, आमतौर पर, मीन चुकता त्रुटि का उपयोग किया जाता है। आप अपने प्रशिक्षण सेट के आधार पर अपने प्रतिगमन मॉडल की गणना करते हैं, और परीक्षण सेट (y) और दिए गए आउटपुट के बीच MSE की गणना करके एक अलग परीक्षण सेट (इनपुट x और ज्ञात पूर्वानुमानित y पर एक सेट) का उपयोग करके इसके प्रदर्शन का मूल्यांकन करते हैं। उसी दिए गए इनपुट (x) के लिए मॉडल (f (x)) द्वारा।

वैकल्पिक रूप से आप निम्न मैट्रिक्स का उपयोग कर सकते हैं: रूट मीन स्क्वॉयर एरर, रिलेटिव स्क्वॉयर एरर, मीन एब्सोल्यूट एरर, रिलेटिव एब्सोल्यूट एरर ... (परिभाषाओं के लिए गूगल से पूछें)


आरआर=Σ(एक्स-एक्समैं)+बीΣ(एक्स-एक्समैं)2जहां ए और बी को प्रत्येक स्कोरिंग विधि के लिए वजन चुना जाता है। वास्तव में यह इस बात पर निर्भर करेगा कि आपकी विशिष्ट समस्या के लिए कौन से कारक महत्वपूर्ण हैं।
ग्रेग पीटरसन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.