जवाबों:
सबसे पहले, हमें भूखंड के दाईं ओर ध्यान केंद्रित करना चाहिए, जहां मूल्यांकन के लिए पर्याप्त डेटा हैं।
यदि दो वक्र "एक दूसरे के करीब" हैं और दोनों में कम स्कोर है, लेकिन है। मॉडल एक अंडर फिटिंग समस्या (उच्च पूर्वाग्रह) से पीड़ित है
यदि प्रशिक्षण वक्र में बहुत बेहतर स्कोर है, लेकिन परीक्षण वक्र में कम स्कोर है, अर्थात, दो वक्रों के बीच बड़े अंतराल हैं। तब मॉडल एक ओवर फिटिंग की समस्या से ग्रस्त है (उच्च विचरण)
प्लॉट से यह कहना मुश्किल है कि मॉडल अच्छा है या नहीं। यह संभव है कि आपके पास वास्तव में "आसान समस्या" हो, एक अच्छा मॉडल 90% हासिल कर सकता है। दूसरी ओर, यह संभव है कि आपके पास वास्तव में "कठिन समस्या" है कि हम जो सबसे अच्छी चीज कर सकते हैं वह 70% प्राप्त कर रहा है। (ध्यान दें, आप उम्मीद नहीं कर सकते हैं कि आपके पास एक आदर्श मॉडल होगा, स्कोर स्कोर है। 1. आप कितना प्राप्त कर सकते हैं यह आपके डेटा में कितना निर्भर करता है। मान लीजिए कि आपके डेटा में बहुत सारे डेटा बिंदु हैं, जिनमें सटीक सुविधा है लेकिन विभिन्न लेबल हैं। कोई फर्क नहीं पड़ता कि आप क्या करते हैं, आप स्कोर पर 1 हासिल नहीं कर सकते।)
आपके उदाहरण में एक और समस्या यह है कि एक वास्तविक विश्व अनुप्रयोग में 350 उदाहरण बहुत छोटे प्रतीत होते हैं।
एक बेहतर समझ पाने के लिए, आप एक से अधिक फिटिंग के तहत अनुभव करने के लिए निम्नलिखित प्रयोग कर सकते हैं और सीख सकते हैं कि सीखने की अवस्था में क्या होगा।
एक बहुत ही जटिल डेटा का चयन करें जिसे एमएनआईएसटी डेटा कहते हैं, और एक साधारण मॉडल के साथ फिट होते हैं, एक विशेषता के साथ रैखिक मॉडल कहते हैं।
एक साधारण डेटा चुनें, आईरिस डेटा कहें, एक जटिलता मॉडल के साथ फिट, कहें, एसवीएम।
इसके अलावा, मैं फिटिंग और ओवर फिटिंग से संबंधित दो उदाहरण दूंगा। ध्यान दें कि यह वक्र नहीं सीख रहा है, लेकिन क्रमिक बूस्टिंग मॉडल में पुनरावृत्तियों की संख्या के लिए प्रदर्शन सम्मान , जहां अधिक पुनरावृत्तियों में अधिक फिटिंग की संभावना होगी। एक्स अक्ष पुनरावृत्तियों की संख्या दिखाता है, और y अक्ष प्रदर्शन को दर्शाता है, जो कि आरओसी के तहत नकारात्मक क्षेत्र है (कम बेहतर)।
बाएं सबप्लॉट ओवर फिटिंग (अच्छी तरह से फिटिंग के तहत नहीं होता है क्योंकि प्रदर्शन यथोचित रूप से अच्छा है) से पीड़ित नहीं होता है, लेकिन सही पुनरावृत्ति अधिक होने पर फिटिंग से अधिक पीड़ित होता है।