क्यों TensorFlow सरल रेखीय मॉडल फिट नहीं कर सकते हैं अगर मैं मतलब चुकता त्रुटि के बजाय पूर्ण मतलब त्रुटि कम कर रहा हूँ?


जवाबों:


17

मैंने यह कोशिश की और वही परिणाम मिला।

इसका कारण यह है कि .absएक साधारण ऑप्टिमाइज़र के लिए ग्रैडिएंट का मिनिमम का पालन करना कठिन होता है, स्क्वेर डिफरेंस के विपरीत, जहाँ ग्रैडिएंट धीरे-धीरे शून्य तक पहुँचता है, पूर्ण अंतर के ग्रैडिएंट में एक निश्चित परिमाण होता है, जो अचानक उलट जाता है, जो आस-पास के ऑप्टिमाइज़र को दोलन करता है। न्यूनतम बिंदु। बेसिक ग्रेडिएंट डिसेंट्रिएंट ग्रेडिएंट के परिमाण के प्रति, और सीखने की दर के प्रति बहुत संवेदनशील है, जो अनिवार्य रूप से स्टेप साइज के लिए ग्रेडिएंट का गुणक है।

सबसे सरल फिक्स लर्निंग रेट को कम करना है जैसे परिवर्तन लाइन

optimizer = tf.train.GradientDescentOptimizer(0.5)

सेवा

optimizer = tf.train.GradientDescentOptimizer(0.05)

इसके अलावा, विभिन्न ऑप्टिमाइज़र के साथ एक नाटक करें। कुछ .absबेहतर-हानि के साथ सामना करने में सक्षम होंगे ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.