मैंने एंड्रयू एनजी को सुना (एक वीडियो में मैं दुर्भाग्य से अब और नहीं मिल सकता है) इस बारे में बात करें कि गहरी सीखने की समस्याओं में स्थानीय मिनीमाता की समझ इस अर्थ में बदल गई है कि उन्हें अब कम समस्याग्रस्त माना जाता है क्योंकि उच्च-आयामी रिक्त स्थान (सामना करना पड़ा) गहरी शिक्षा) महत्वपूर्ण बिंदु स्थानीय मीनिमा के बजाय काठी अंक या पठार होने की अधिक संभावना है।
मैंने कागजात (जैसे यह एक ) देखा है, जिसमें उन मान्यताओं पर चर्चा की गई है जिनके तहत "प्रत्येक स्थानीय न्यूनतम एक वैश्विक न्यूनतम है"। ये धारणाएं सभी तकनीकी हैं, लेकिन मैं जो समझता हूं, वे तंत्रिका नेटवर्क पर एक संरचना थोपते हैं जो इसे कुछ रैखिक बनाते हैं।
क्या यह एक वैध दावा है कि, गहरी शिक्षा (incl। Nonlinear आर्किटेक्चर) में, पठार स्थानीय मिनिमा से अधिक होने की संभावना है? और यदि हां, तो क्या इसके पीछे एक (संभवतः गणितीय) अंतर्ज्ञान है?
क्या गहरी सीखने और काठी अंक के बारे में कुछ खास है?