मैंने कहीं और पढ़ा है कि किसी NN में छिपे हुए लेयर एक्टिवेशन फंक्शन का चुनाव किसी की ज़रूरत पर आधारित होना चाहिए , यानी यदि आपको रेंज -1 से 1 में मानों की जरूरत है तो टैन का उपयोग करें और रेंज 0 से 1 के लिए सिग्मॉइड का उपयोग करें।
मेरा सवाल यह है कि किसी को क्या पता है कि किसी की ज़रूरत क्या है? क्या यह इनपुट लेयर की सीमा पर आधारित है, उदाहरण के लिए फ़ंक्शन का उपयोग करें जो इनपुट लेयर की पूरी रेंज को मानों में शामिल कर सकता है, या किसी तरह इनपुट लेयर के वितरण (गाऊसी फंक्शन) को दर्शाता है? या है की जरूरत समस्या / डोमेन विशिष्ट और एक के अनुभव / निर्णय इस विकल्प बनाने के लिए आवश्यक है? या यह केवल "उपयोग करें जो सबसे अच्छा क्रॉस-मान्य न्यूनतम प्रशिक्षण त्रुटि देता है?"
1 + (1 / exp(-sum))
। प्रत्येक डेटा सेट पर दोनों की कोशिश किए बिना समझने की आवश्यकता को बहुत कठिन बनाना । जरूरत आप इसे यहाँ का वर्णन के रूप में वास्तविक संबंध से जुड़ा हुआ है सीखा जा रहा है, यानी एक बाइनरी डेटा सेट तेजी से है या नहीं सब को देखते हुए अलग सक्रियण में सीखना होगा।