BFGS अपडेट के लिए सहज प्रेरणा


15

मैं एक संख्यात्मक विश्लेषण सर्वेक्षण वर्ग सिखा रहा हूँ और बीएफजीएस पद्धति के लिए छात्रों के लिए प्रेरणा की मांग कर रहा हूँ जो कि अनुकूलन में सीमित पृष्ठभूमि / अंतर्ज्ञान के साथ है!

जबकि मेरे पास यह साबित करने का समय नहीं है कि सब कुछ परिवर्तित हो जाता है, मैं इसके लिए एक उचित प्रेरणा देना चाहता हूं कि BFGS हेसियन अपडेट क्यों दिखाई दे सकता है। सादृश्य के रूप में, ब्रोयडेन की जड़-खोज विधि (मेरा राइटअप यहां है ) को यह पूछकर प्रेरित किया जा सकता है कि आपके वर्तमान जैकबियन अंतर को कम करता है पुराने जैकोबिन के साथ बाधा के अधीन है कि यह नवीनतम सेकंड को ध्यान में रखता है: J_k (\ vec x_k- \ vec x_ {k-1}) = f (\ vec x_k) -f (\ vec x_ {k-1) }) J k ( x k - x k - 1 ) = f ( x k ) - f ( x k - 1 )JkJk1Fro2Jk(xkxk1)=f(xk)f(xk1)

बीएफजीएस अपडेट की व्युत्पत्तियां कहीं अधिक शामिल हैं और मर्करी हैं! विशेष रूप से, मैं एक प्राथमिकता नहीं मानूंगा कि अद्यतन रैंक -2 होना चाहिए या एक विशेष रूप लेना चाहिए। क्या ब्रूफेन के लिए बीएफजीएस हेसियन अपडेट की तरह एक लघु परिवर्तनशील दिखने वाली प्रेरणा है?


4
यदि आप एक मनमाना अपडेट की अनुमति देंगे, तो आप न्यूटन की विधि में पूर्ण हेस्सियन का उपयोग कर सकते हैं। एक निम्न रैंक अपडेट का एक प्रमुख कम्प्यूटेशनल लाभ यह है कि यह आपको अनुमानित हेसियन के कारक को बहुत जल्दी अपडेट करने की अनुमति देता है।
ब्रायन बोरचर्स

जवाबों:


12

BFGS की व्युत्पत्ति अधिक सहज है जब कोई मानता है (कड़ाई से) उत्तल लागत कार्य:

एक्स कश्मीर( एक्स कश्मीर + पी ) ( एक्स कश्मीर ) + ( एक्स कश्मीर ) टी पी + 1

f(x)minxRn
xkfपी
f(xk+p)f(xk)+f(xk)Tp+12pTH(xk)p.()
px कश्मीर + 1 : = एक्स कश्मीर + पी ( * ) पी()xk+1:=xk+p()p"- और इसे शून्य पर सेट करने से संबंध जहां 'है' ढाल का जैकबियन 'या हेसियन मैट्रिक्स।एच
H(xk)[xk+1xk]=f(xk+1)f(xk),
H

चूंकि हेसियन की गणना और व्युत्क्रम महंगा है ...


... एक छोटा सा जवाब

(cf. Broyden का अपडेट) हो सकता है कि BFGS अपडेट कम से कम हो जाए मानदंड में, का विषय हैएच - 1 कश्मीर - एच - 1डब्ल्यूHk+11

Hk1H1W
  1. H[xk+1xk]=f(xk+1)f(xk) - यह वही है जो किसी के लिए बाहर है - और (
  2. HT=H , क्योंकि हेसियन सममित है।

तब वेट की पसंद in औसत हेसियन के विलोम के रूप में , cf. यहाँ कथन के लिए, लेकिन बिना प्रमाण के, BFGS अद्यतन सूत्र (with ) देता है।WHW:=W1/2HW1/2F G:=01H(xk+τp)dταk=1

प्रमुख बिंदु हैं:

  • एक द्विघात सन्निकटन के लिए समाधान द्वारा वास्तविक लागत के लिए समाधान का अनुमान लगाने की कोशिश करता है
  • हेसियन की गणना, और इसके व्युत्क्रम, महंगा है। एक सरल अद्यतन पसंद करता है।
  • अद्यतन को वास्तविक हेसियन के बजाय व्युत्क्रम के लिए इष्टतम चुना गया है।
  • यह एक रैंक -2 अपडेट है जो फ्रोबेनियस मानदंड में भार की विशेष पसंद का परिणाम है।

एक लंबे समय तक उत्तर में शामिल होना चाहिए कि कैसे वज़न का चयन किया जाए, कैसे इस काम को नॉनवॉन्क्स समस्याओं के लिए बनाया जाए (जहां वक्रता की स्थिति दिखाई देती है, जिसके लिए खोज दिशा की स्केलिंग की आवश्यकता होती है ), और अद्यतन के लिए वास्तविक सूत्र कैसे प्राप्त करें। एक संदर्भ यहाँ (जर्मन में) है।p


बहुत बहुत धन्यवाद, यह बहुत बढ़िया है (और कमोबेश जो मैंने Nocedal & Wright में चर्चा के आधार पर अपेक्षित था)। एक शेष प्रश्न मेरे पास है: हम और मानक का चयन क्यों करते हैं जैसा कि हम करते हैं? मुझे लगता है कि इसे इकाइयों के साथ करना है, लेकिन और मानदंडों के बहुत सारे संभावित विकल्प हैं जो ऐसा करते हैं। डब्ल्यूडब्ल्यू
जस्टिन सोलोमन

हाँ सच। खैर, मुझे नहीं पता। एक उत्तर यह है कि यह सरल और अच्छी तरह से काम करने के फॉर्मूले को सरल बनाता है। ऐतिहासिक रूप से, अपडेट के लिए यह दृष्टिकोण - अपडेट में अंतर को कम करना - शन्नो द्वारा एक था। यह एक रेफरी (गोल्डफर्ब) था जिसने पाया कि वेट का एक विशेष विकल्प ब्राइडन और फ्लेचर के फार्मूले की ओर जाता है। इस PhD थीसिस को देखें BFGS सेकेंडरी विधि का ऐतिहासिक विकास ... BFGS के डेवलपर्स के अंतर्ज्ञान के लिए। हालांकि, सभी 3 दृष्टिकोण काफी सार हैं।
Jan

1
दिलचस्प, मार्गदर्शन के लिए धन्यवाद! मेरा वर्तमान राइटअप (कुछ गणित गलतियों के साथ जिसकी मदद की आवश्यकता है) यहां है: graphics.stanford.edu/courses/cs205a-13-fall/assets/notes/… (यदि आप अपनी मदद के लिए क्रेडिट चाहते हैं तो मैं इसे प्रदान करके खुश हूं - कृपया मुझे उपयुक्त संपर्क जानकारी के साथ ईमेल करें)
जस्टिन सोलोमन

एच(एक्स)[एक्स+1-एक्स]=(एक्स+1)-(एक्स)
एच(एक्स+1)[एक्स+1-एक्स]=(एक्स+1)-(एक्स)?
एच+1रों=ysk=xk+1xk,yk=fk+1fk
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.