मैं RMSProp, एडम और SGD के साथ नेटवर्क का उपयोग करते हुए EMNIST सत्यापन सेट पर प्रयोग कर रहा हूं। मैं SGD (0.1 की सीखने की दर) और ड्रॉपआउट (0.1 ड्रॉपआउट प्रोब) के साथ-साथ एल 2 नियमितीकरण (1e-05 जुर्माना) के साथ 87% सटीकता प्राप्त कर रहा हूं। आरएमएसप्रॉप और एडम के साथ ही 0.001 की प्रारंभिक सीखने की दर के साथ एक ही सटीक कॉन्फ़िगरेशन का परीक्षण करते समय, मैं 85% की सटीकता और काफी कम चिकनी प्रशिक्षण वक्र प्राप्त कर रहा हूं। मुझे नहीं पता कि इस व्यवहार को कैसे समझाऊं। प्रशिक्षण वक्र में चिकनाई की कमी और कम सटीकता और उच्च त्रुटि दर प्राप्त करने के पीछे क्या कारण हो सकता है?