कहो कि मेरे पास एक वर्गीकरण की तरह एक साधारण मशीन सीखने की समस्या है। दृष्टि या श्रव्य मान्यता में कुछ बेंचमार्क के साथ, मैं, एक मानव के रूप में, एक बहुत अच्छा क्लासिफायरियर हूं। इसलिए मेरा एक अंतर्ज्ञान है कि एक क्लासिफायरियर को कितना अच्छा मिल सकता है।
लेकिन बहुत सारे डेटा के साथ एक बिंदु यह है कि मुझे नहीं पता कि मैं जिस क्लासिफायर ट्रेन को प्राप्त करना संभव है वह कितना अच्छा है। यह वह डेटा है जहां मैं व्यक्तिगत रूप से एक बहुत अच्छा क्लासिफायरियर नहीं हूं (कहते हैं, ईईजी डेटा से किसी व्यक्ति के मूड को वर्गीकृत करें)। मेरी समस्या कितनी कठिन है, इस पर अंतर्ज्ञान प्राप्त करना वास्तव में संभव नहीं है।
अब, अगर मुझे मशीन सीखने की समस्या के साथ प्रस्तुत किया जाता है, तो मैं यह पता लगाना चाहूंगा कि मुझे कितना अच्छा मिल सकता है। क्या इसके लिए कोई राजसी दृष्टिकोण है? आप यह कैसे करेंगे?
डेटा की कल्पना करें? सरल मॉडल से शुरू करें? बहुत जटिल मॉडल से शुरू करें और देखें कि क्या मैं ओवरफिट कर सकता हूं? यदि आप इस प्रश्न का उत्तर देना चाहते हैं तो आप क्या देख रहे हैं? आप कोशिश करना कब बंद करते हैं?