मैं वर्तमान में तंत्रिका नेटवर्क पर एक परीक्षा की तैयारी कर रहा हूं। पूर्व परीक्षाओं के कई प्रोटोकॉल में मैंने पढ़ा है कि न्यूरॉन्स (बहुपरत पेसेप्ट्रॉन में) के सक्रियण कार्य को मोनोनिक होना चाहिए।
मैं समझता हूं कि सक्रियण कार्य अलग-अलग होने चाहिए, एक व्युत्पन्न होना चाहिए जो कि अधिकांश बिंदुओं पर 0 न हो, और गैर-रैखिक हो। मुझे समझ में नहीं आता है कि एकरस होना महत्वपूर्ण / सहायक क्यों है।
मैं निम्नलिखित सक्रियण कार्यों को जानता हूं और वे एकरस हैं:
- Relu
- अवग्रह
- tanh
- Softmax: मैं नहीं यकीन है कि अगर दिष्टता की परिभाषा कार्यों के लिए लागू है के साथ
- Softplus
- (पहचान)
हालांकि, मैं अभी भी क्यों उदाहरण के लिए कोई कारण नहीं देख सकते हैं ।
सक्रियण कार्यों को एकरस क्यों होना पड़ता है?
(संबंधित पक्ष प्रश्न: क्या कोई कारण है कि लॉगरिथम / घातांक फ़ंक्शन को सक्रियण फ़ंक्शन के रूप में उपयोग नहीं किया जाता है)