आइए MNIST डेटासेट को वर्गीकृत करने के बारे में समस्या पर विचार करें।
Yann LeCun के MNIST वेबपेज के अनुसार , 'Ciresan et al।' कन्वेंशनल न्यूरल नेटवर्क का उपयोग करके MNIST टेस्ट सेट पर 0.23% त्रुटि दर मिली।
मान लें कि MNIST प्रशिक्षण सेट को , MNIST परीक्षण सेट रूप में , अंतिम परिकल्पना उन्होंने का उपयोग रूप में की , और MNIST टेस्ट सेट पर उनकी त्रुटि दर रूप में उपयोग की। ।
उनके विचार में, चूंकि , की परवाह किए बिना इनपुट स्पेस से सैंपल टेस्ट सेट है , वे इस बात पर जोर दे सकते हैं कि उनकी अंतिम परिकल्पना आउट-ऑफ-सैंपल एरर परफॉर्मेंस है। Hoeffding की असमानता से निम्नलिखित के रूप में बाध्य है जहां।
दूसरे शब्दों में, कम से कम संभावना ,
आइए एक और दृष्टिकोण पर विचार करें। मान लीजिए कि कुछ व्यक्ति MNIST टेस्ट सेट को अच्छी तरह से वर्गीकृत करना चाहते हैं। इसलिए उन्होंने पहली बार Yann LeCun के MNIST वेबपेज को देखा , और अन्य लोगों द्वारा 8 अलग-अलग मॉडल का उपयोग करके प्राप्त किए गए परिणामों को देखा,
और अपने मॉडल जी को चुना जिसने 8 मॉडलों के बीच MNIST टेस्ट सेट पर सर्वश्रेष्ठ प्रदर्शन किया।
उसके लिए, सीखने की प्रक्रिया एक परिकल्पना जी उठा रही थी जिसने परीक्षण सेट पर एक परिकल्पना सेट ।
इस प्रकार, परीक्षण सेट पर त्रुटि इस सीखने की प्रक्रिया के लिए 'इन-सैंपल' त्रुटि है, इसलिए वह असमानता का पालन करते हुए परिमित परिकल्पना सेट के लिए बाध्य VC को लागू कर सकता है। पी [ | ई ओ यू टी ( जी ) - ई आई एन ( जी ) | < Ε ] ≥ 1 - 2 | एच टी आर एक आई एन ई डी | ई 2 ϵ 2 एन टी ई एस टी
दूसरे शब्दों में, कम से कम प्रायिकता ,
इस परिणाम का अर्थ है कि अगर हम मॉडल को कई मॉडलों में सर्वश्रेष्ठ प्रदर्शन करते हैं तो टेस्ट सेट पर ओवरफिटिंग हो सकती है।
इस स्थिति में, व्यक्ति चुन सकता है , जिसकी त्रुटि दर । चूँकि इस विशेष परीक्षण सेट पर 8 मॉडलों के बीच सबसे अच्छी परिकल्पना है , इसलिए कुछ संभावना हो सकती है कि MNIST परीक्षण सेट पर एक परिकल्पना है।
इस प्रकार, यह व्यक्ति निम्नलिखित असमानता पर जोर दे सकता है।
नतीजतन, हमें दो असमानताएं और ।
हावेर, यह स्पष्ट है कि ये दो असमानताएं असंगत हैं।
मैं कहाँ गलत कर रहा हूँ? कौन सा सही है और कौन सा गलत है
यदि बाद गलत है, तो इस मामले में परिमित परिकल्पना सेट के लिए बाध्य वीसी को लागू करने का सही तरीका क्या है?