ओवरफिटिंग, संक्षेप में, का मतलब है कि अपने डेटा और / या पूर्व ज्ञान से बहुत अधिक जानकारी को ध्यान में रखें और इसका उपयोग एक मॉडल में करें। इसे और अधिक सरल बनाने के लिए, निम्नलिखित उदाहरण पर विचार करें: आप कुछ वैज्ञानिकों द्वारा उन्हें कुछ प्रकार के पौधों की वृद्धि की भविष्यवाणी करने के लिए एक मॉडल प्रदान करने के लिए काम पर रखा गया है। वैज्ञानिकों ने आपको पूरे साल ऐसे पौधों के साथ उनके काम से एकत्रित जानकारी दी है, और वे आपको उनके वृक्षारोपण के भविष्य के विकास के बारे में लगातार जानकारी देंगे।
तो, आप प्राप्त आंकड़ों के माध्यम से चलाते हैं, और इसके एक मॉडल का निर्माण करते हैं। अब मान लीजिए कि, आपके मॉडल में, आपने हमेशा प्रारंभिक विशेषताओं में देखे गए पौधों के सटीक व्यवहार का पता लगाने के लिए यथासंभव कई विशेषताओं पर विचार किया। अब, जैसा कि उत्पादन जारी है, आप हमेशा उन विशेषताओं को ध्यान में रखेंगे, और बहुत ही बढ़िया परिणाम देंगे । हालाँकि, अगर वृक्षारोपण अंततः कुछ मौसमी परिवर्तन से पीड़ित होता है, तो आपको प्राप्त होने वाले परिणाम आपके मॉडल को इस तरह से फिट करेंगे कि आपकी भविष्यवाणियाँ विफल होने लगेंगी (या तो यह कहना कि विकास धीमा हो जाएगा, जबकि यह वास्तव में गति करेगा, या विलोम)।
इस तरह के छोटे बदलावों का पता लगाने में असमर्थ होने के अलावा, और आमतौर पर गलत तरीके से अपनी प्रविष्टियों को वर्गीकृत करने के लिए, मॉडल पर बढ़िया अनाज , यानी, बड़ी मात्रा में चर, प्रसंस्करण बहुत महंगा हो सकता है। अब, कल्पना करें कि आपका डेटा पहले से ही जटिल है। डेटा के लिए अपने मॉडल को ओवरफिट करने से न केवल वर्गीकरण / मूल्यांकन बहुत जटिल हो जाएगा, बल्कि सबसे शायद आपको इनपुट पर हो सकने वाली थोड़ी सी भी भिन्नता के बारे में भविष्यवाणी करने में त्रुटि होगी।
संपादित करें : यह कुछ उपयोग का हो सकता है, शायद उपरोक्त स्पष्टीकरण में गतिशीलता को जोड़कर: डी