मेरे पास एक गहरा तंत्रिका नेटवर्क मॉडल है और मुझे इसे अपने डेटासेट पर प्रशिक्षित करने की आवश्यकता है जिसमें लगभग 100,000 उदाहरण हैं, मेरे सत्यापन डेटा में लगभग 1000 उदाहरण हैं। क्योंकि प्रत्येक उदाहरण (प्रत्येक उदाहरण के लिए लगभग 0.5s) को प्रशिक्षित करने के लिए समय लगता है और ओवरफिटिंग से बचने के लिए, मैं अनावश्यक गणना को रोकने के लिए शुरुआती रोक लागू करना चाहूंगा। लेकिन मुझे यकीन नहीं है कि अपने तंत्रिका नेटवर्क को जल्दी से रोकने के साथ कैसे ठीक से प्रशिक्षित किया जाए, कई चीजें जो मुझे अब समझ में नहीं आती हैं:
एक अच्छा सत्यापन आवृत्ति क्या होगी? क्या मुझे प्रत्येक युग के अंत में सत्यापन डेटा पर अपने मॉडल की जांच करनी चाहिए? (मेरे बैच का आकार 1 है)
क्या यह ऐसा मामला है कि पहले कुछ युग बेहतर परिणाम में बदलने से पहले खराब परिणाम दे सकते हैं? उस स्थिति में, क्या हमें जल्दी रुकने की जाँच करने से पहले अपने नेटवर्क को कई युगों के लिए प्रशिक्षित करना चाहिए?
जब सत्यापन हानि ऊपर और नीचे जा सकती है तो मामले को कैसे संभालें? उस स्थिति में, जल्दी रोकना मेरे मॉडल को आगे सीखने से रोक सकता है, है ना?
पहले ही, आपका बहुत धन्यवाद।