पथरी 101 में हमने "विश्लेषणात्मक विधि" का उपयोग करके किसी फ़ंक्शन को अनुकूलित करने के तरीके के बारे में सीखा: हमें केवल लागत फ़ंक्शन के व्युत्पन्न प्राप्त करने और व्युत्पन्न को 0 पर सेट करने की आवश्यकता है, फिर समीकरण को हल करें। यह वास्तव में एक खिलौना समस्या है और वास्तविक दुनिया में लगभग कभी नहीं होगी।
वास्तविक दुनिया में, कई लागत कार्यों में हर जगह व्युत्पन्न नहीं होते हैं (आगे, लागत फ़ंक्शन असतत हो सकता है और बिल्कुल भी व्युत्पन्न नहीं होता है)। इसके अलावा, यहां तक कि आप व्युत्पन्न की गणना कर सकते हैं, आप केवल समीकरण को विश्लेषणात्मक रूप से हल नहीं कर सकते हैं (उदाहरण के लिए, को हल करने के तरीके के बारे में सोचें विश्लेषणात्मक रूप से; मैं आपको बता सकता हूं संख्यात्मक उत्तर , लेकिन विश्लेषणात्मक समाधान नहीं जानते हैं)। हमें कुछ संख्यात्मक तरीकों का उपयोग करना चाहिए (जांच करें कि यहां बहुपद मामलों पर एबेल रफिन प्रमेय क्यों है )।x7+x3−52+ex+log(x+x2)+1/x=0x=1.4786
Iterative तरीके उपयोग करने के लिए महान हैं, और समझने के लिए बहुत सहज हैं। मान लें कि आप किसी समीकरण को हल करने के बजाय एक फ़ंक्शन को ऑप्टिमाइज़ करना चाहते हैं और उत्तर प्राप्त करना चाहते हैं, तो आप पर्याप्त पुनरावृति के बाद पुनरावृत्तियों / चरणों की संख्या से अपने उत्तर को बेहतर बनाने का प्रयास करते हैं, आपको उत्तर "सही उत्तर" के करीब मिलेगा। मान लें कि यदि आप को कम करने के लिए कलन का उपयोग करते हैं , तो आप सीधे प्राप्त करते हैं, लेकिन संख्यात्मक विधियों का उपयोग करके, आप प्राप्त कर सकते हैं ।f(x)=x2x=0x=1.1234×10−20
अब, यह समझना महत्वपूर्ण है कि ये पुनरावृत्तियां कैसे काम करती हैं। मुख्य अवधारणा यह जान रही है कि बेहतर समाधान प्राप्त करने के लिए अपने इनपुट मापदंडों को कैसे अपडेट किया जाए। मान लीजिए कि आप को छोटा करना चाहते हैं(ध्यान दें कि यह लागत फ़ंक्शन हर जगह भिन्न नहीं है, लेकिन "अधिकांश स्थानों पर" अलग-अलग है, यह हमारे लिए काफी अच्छा है, क्योंकि हम जानते हैं कि "अधिकांश स्थानों" को कैसे अपडेट किया जाए।), वर्तमान में आप । और लागत , अब आप उद्देश्य फ़ंक्शन को छोटा करने के लिए अपडेट करना चाहते हैं। आप वह कैसे करेंगें? आप कह सकते हैं कि मैं दोनों को कम करना चाहता , लेकिन क्यों? वास्तव में आप उपयोग कर रहे हैंf(x1,x2)=x21+x22+|x1+x2|(1,1)4.0(x1,x2)x1 x2ग्रेडिएंट की अवधारणा " की छोटी राशि को बदलना , पर क्या होगा "। xy। में , व्युत्पन्न है , तो नकारात्मक ढाल बार एक सीखने दर कहते हैं , है , तो हम से हमारे समाधान अद्यतन करने के लिए जिनकी लागत बेहतर है।(1,1)(3,3)α=0.001(−0.003,−0.003)1,1(0.997,0.997)