मैं इस तथ्य के लिए पहले से माफी मांगता हूं कि मैं अभी भी इस पर गति करने के लिए आ रहा हूं। मैं अपने न्यूरॉन सक्रियण फ़ंक्शन के लिए टैन्ह (मानचित्र -1 से 1) बनाम सिग्मॉइड (मानचित्र 0 से 1) का उपयोग करने के पेशेवरों और विपक्षों को समझने की कोशिश कर रहा हूं। मेरे पढ़ने से यह मामूली अंतर के साथ एक छोटी सी बात की तरह लग रहा था। अपनी समस्याओं के लिए अभ्यास में मुझे लगता है कि सिग्मॉइड को प्रशिक्षित करना और अजीब रूप से आसान है, सिग्मॉइड सामान्य समाधान को बेहतर खोजने के लिए प्रकट होता है। इससे मेरा मतलब है कि जब सिग्मॉइड संस्करण का प्रशिक्षण किया जाता है तो यह संदर्भ (अप्रशिक्षित) डेटा सेट पर अच्छा करता है, जहां टैन्ह संस्करण संदर्भ पर खराब प्रदर्शन करते हुए प्रशिक्षण डेटा पर सही उत्तर प्राप्त करने में सक्षम होता है। यह समान नेटवर्क आर्किटेक्चर के लिए है।
मेरे पास एक अंतर्ज्ञान यह है कि सिग्मॉइड के साथ, न्यूरॉन के लिए लगभग पूरी तरह से बंद करना आसान है, इस प्रकार बाद की परतों के लिए कोई इनपुट प्रदान नहीं करता है। टैन के पास यहां एक कठिन समय है क्योंकि इसे अपने इनपुट को पूरी तरह से रद्द करने की आवश्यकता है, अन्यथा यह हमेशा अगली परत को एक मूल्य देता है। शायद यह अंतर्ज्ञान हालांकि गलत है।
लंबी पोस्ट। निचला रेखा, व्यापार क्या है, और क्या इससे कोई बड़ा बदलाव होना चाहिए?