जब एक तंत्रिका नेटवर्क को बैक-प्रचार एल्गोरिथ्म का उपयोग करके प्रशिक्षण दिया जाता है, तो वजन अपडेट को निर्धारित करने के लिए ढाल वंश विधि का उपयोग किया जाता है। मेरा सवाल है: धीरे-धीरे एक निश्चित वजन के संबंध में न्यूनतम बिंदु का पता लगाने के लिए ढाल मूल विधि का उपयोग करने के बजाय, हम सिर्फ व्युत्पन्न , सेट नहीं करते हैं और भार का मान ज्ञात जो त्रुटि को कम करता है?w
इसके अलावा, हमें क्यों यकीन है कि बैक-प्रचार में त्रुटि फ़ंक्शन न्यूनतम होगा? क्या यह नहीं हो सकता है कि त्रुटि फ़ंक्शन बदले में अधिकतम है? क्या स्क्वाशिंग फ़ंक्शंस की एक विशिष्ट संपत्ति है जो गारंटी देती है कि किसी भी संख्या में छिपे हुए नोड्स के साथ एक नेटवर्क मनमाना भार और इनपुट वैक्टर हमेशा एक त्रुटि फ़ंक्शन देगा जिसमें कुछ मिनीमा है?