हाल ही में मैंने Yann Dauphin et al द्वारा एक पेपर पढ़ा है। उच्च-आयामी गैर-उत्तल अनुकूलन में काठी बिंदु समस्या की पहचान करना और उस पर हमला करना , जहां वे सैडल-फ्री न्यूटन नामक एक दिलचस्प वंश एल्गोरिथ्म का परिचय देते हैं , जो तंत्रिका नेटवर्क अनुकूलन के लिए बिल्कुल अनुरूप लगता है और दुखद बिंदुओं में फंसने से पीड़ित नहीं होना चाहिए। वेनिला SGD के रूप में पहले के आदेश के तरीकों की तरह।
पेपर 2014 में वापस आ गया, इसलिए यह कुछ भी नया नहीं है, हालांकि, मैंने इसे "वाइल्ड" में इस्तेमाल नहीं किया है। इस पद्धति का उपयोग क्यों नहीं किया जा रहा है? क्या हेसियन अभिकलन वास्तविक दुनिया के आकार की समस्याओं / नेटवर्कों के लिए भी निषेधात्मक है? क्या इस एल्गोरिथ्म का कुछ खुला स्रोत कार्यान्वयन भी है, संभवत: कुछ प्रमुख गहरे शिक्षण ढाँचों के साथ उपयोग किया जा सकता है?
फरवरी 2019 को अपडेट करें : अब एक कार्यान्वयन उपलब्ध है: https://github.com/dave-fernandes/SaddleFreeOptimizer )