अनिवार्य रूप से, मेरा सवाल यह है कि बहुपरत पर्सेप्ट्रॉन में, सिग्माइड्रॉन का उपयोग सिग्मॉइड सक्रियण फ़ंक्शन के साथ किया जाता है। तो नवीनीकरण नियम में है कि y के रूप में गणना की जाती है
यह "सिग्मॉइड" पर्सेप्ट्रॉन एक लॉजिस्टिक रिग्रेशन से कैसे भिन्न होता है?
मैं कहूँगा कि एक एकल परत अवग्रह perceptron अर्थों में एक रसद प्रतिगमन के बराबर है कि दोनों उपयोग y = 1अपडेट नियम में 1 + ऍक्स्प ( - w T x i ) । इसके अलावा, दोनों वापसीभविष्यवाणी में। हालाँकि, बहुपरत पेसेप्ट्रॉन में, सिग्मॉइड एक्टिवेशन फंक्शन का उपयोग प्रायिकता को लौटाने के लिए किया जाता है, लॉजिस्टिक रिग्रेशन और सिंगल-लेयर पर्सेप्ट्रॉन के विपरीत ऑन-ऑफ सिग्नल पर नहीं।
मुझे लगता है कि "परसेप्ट्रॉन" शब्द का उपयोग थोड़ा अस्पष्ट हो सकता है, इसलिए मुझे सिंगल-लेयर परसेप्ट्रॉन के बारे में मेरी वर्तमान समझ के आधार पर कुछ पृष्ठभूमि प्रदान करें:
क्लासिक अवधारणात्मक नियम
सबसे पहले, एफ। रोसेनब्लाट द्वारा क्लासिक परसेप्ट्रॉन जहां हमारे पास एक चरण कार्य है:
वजन को अद्यतन करने के लिए
ताकि y के रूप में गणना की जाती है
ढतला हुआ वंश
ग्रेडिएंट डिसेंट का उपयोग करके, हम लागत फ़ंक्शन का अनुकूलन (कम से कम) करते हैं
जहां हमारे पास "वास्तविक" संख्याएं हैं, इसलिए मैं इसे मूल रूप से रैखिक प्रतिगमन के अनुरूप देखता हूं, इस अंतर के साथ कि हमारा वर्गीकरण आउटपुट थ्रेसहोल्ड है।
जब हम भार को अद्यतन करते हैं, तो यहां हम ग्रेडिएंट की नकारात्मक दिशा में एक कदम उठाते हैं
लेकिन यहाँ, हमारे पास y = डब्ल्यू टी x मैं के बजाय y = संकेत ( डब्ल्यू टी x मैं )
साथ ही, हम क्लासिक पेसेप्ट्रॉन नियम के विपरीत संपूर्ण प्रशिक्षण डेटासेट (बैच लर्निंग मोड में) के लिए एक पूर्ण पास के लिए चुकता त्रुटियों की गणना करते हैं, जो नए प्रशिक्षण नमूनों के आने के साथ वेट को अपडेट करते हैं (एनालॉग से स्टॉचस्टिक ग्रेडिएंट वंश) सीख रहा हूँ)।
सिग्माइड सक्रियण फ़ंक्शन
अब, यहाँ मेरा सवाल है:
बहुपरत पर्सेप्ट्रोन में, एक रिसेप्ट्रॉन का उपयोग सिग्मॉइड सक्रियण फ़ंक्शन के साथ किया जाता है। तो नवीनीकरण नियम में है कि y के रूप में गणना की जाती है
यह "सिग्मॉइड" पर्सेप्ट्रॉन एक लॉजिस्टिक रिग्रेशन से कैसे भिन्न होता है?