हैमिल्टन-जैकोबी-बेलमैन समीकरण को हल करना; इष्टतमता के लिए आवश्यक और पर्याप्त?


13

निम्नलिखित विभेदक समीकरण पर विचार करें जहां राज्य है और नियंत्रण चर है। समाधान जहाँ दी गई जन्मजात अवस्था है।एक्सयूएक्स(टी)=एक्स0+ टी 0 एफ(एक्स(रों),यू(रों))रोंx0:=x(0)

x˙(t)=f(x(t),u(t))
xu
x(t)=x0+0tf(x(s),u(s))ds.
x0:=x(0)

अब निम्नलिखित प्रोग्राम पर विचार करें जहां \ rho> 0 समय वरीयता को दर्शाता है, V (\ cdot) मान है और F ( एक उद्देश्य समारोह ) । एक शास्त्रीय आर्थिक अनुप्रयोग इष्टतम विकास का रैमसे-कैस-कोपामंस मॉडल है। हैमिल्टन-जैकोबी-बेलमैन समीकरण \ _ द्वारा शुरू किया गया है {align} \ rho V (x) = \ max_u [F (x, u) + V '(x) f (x, u)], \ quad \ toall t \ [0 में, \ infty)। \ अंत {align}

V(x0):=maxu0eρtF(x(t),u(t))dts.t. x˙(t)=f(x(t),u(t))x(0)=x0
ρ>0V()F()
ρV(x)=maxu[F(x,u)+V(x)f(x,u)],t[0,).

कहो मैंने HJB V के लिए हल किया है V। इष्टतम नियंत्रण तब

u=argmaxu[F(x,u)+V(x)f(x,u)].
मैं राज्य और नियंत्रण के लिए इष्टतम प्रक्षेपवक्र प्राप्त करूँगा {(x(t),u(t)):t[0,)}

विकि लेख का कहना है

... लेकिन जब पूरे राज्य के स्थान पर हल किया जाता है, तो एचजेबी समीकरण एक इष्टतम के लिए एक आवश्यक और पर्याप्त स्थिति है।

Bertsekas (2005) डायनामिक प्रोग्रामिंग और ऑप्टिमल कंट्रोल , वॉल्यूम 1, 3 एड में। प्रस्ताव 3.2.1 में उन्होंने कहा है कि V के लिए हल Vकरना सबसे अच्छा कॉस्ट-टू-गो फंक्शन है और संबंधित u इष्टतम है। हालाँकि, वह स्पष्ट रूप से इसे पर्याप्तता प्रमेय घोषित करता है।

असल में, मैं सिर्फ यह सुनिश्चित करना चाहता हूं, कि अगर मैंने HJB को हल कर लिया है और संबंधित राज्य और नियंत्रण प्रक्षेपवक्र को ठीक कर दिया है, तो मुझे किसी भी अतिरिक्त इष्टतम स्थितियों से चिंतित होने की आवश्यकता नहीं है।

उपाय

मैं प्रयास करता हूँ

मुझे लगता है कि मैं HJB समीकरण द्वारा अधिकतम सिद्धांत से आवश्यक शर्तों को प्राप्त करने में सक्षम था।

हैमिल्टनियन की

H(x,u,V(x)):=F(x,u)+V(x)f(x,u)

फिर हमारे पास

ρV(x)=maxuH(x,u,V(x))

जो है

ρV(x)=H(x,u,V(x)).

एक मनमाना कार्य परिभाषित करें को साथ परिभाषित करें । अब फिक्स q:[0,)Rq(0)=limtq(t)=0

x=x+εq

जहां एक पैरामीटर है। शब्द को उस अधिकतम हेमिलटोनियन में प्लग करें, जो εR

ρV(x+εq)=H(x+εq,u,V(x+εq)).

पर हम इष्टतम समाधान है। इस प्रकार पहले क्रम की स्थिति प्राप्त करने के लिए पर अंतरε=0ε

ρVq=Hxq+HVVq.

अब adjoint वैरिएबल को start साथ परिभाषित करें

λ=V(x).

समय के साथ अंतर करना

λ˙=Vx˙.

और ध्यान दें कि

HV=f(x,u)=x˙.

संस्कृति और उसके जो में प्रत्येक भाग को प्लग देता है

ρλ=Hx+λ˙.

यह बहुत ज्यादा है। तो HJB को हल करना वास्तव में आवश्यक और पर्याप्त है (यहाँ छोड़ दिया गया है)। किसी को इसे विकि से जोड़ना चाहिए। इस तरह की समस्याओं के बारे में सोचने वाले लोगों के लिए समय की बचत हो सकती है (मैं बहुत अधिक नहीं होगा)।

हालाँकि ट्रांसवर्सिटी की स्थिति अनुपलब्ध है।

limteρtλ(t)=0

II प्रयास

अदायगी क्रिया को परिभाषित करें

J(u):=0eρtF(x,u)dt

ध्यान दें कि by परिभाषा। । अदायगी शब्द को

0eρtλ[f(x,u)x˙]dt=0
x˙=f(x,u)
J(u)=0eρt[F(x,u)+λf(x,u)]dt0eρtλx˙dt=0eρtH(x,u,λ)0eρtλx˙dt

दाहिने शब्द के कुछ हिस्सों के एकीकरण से rds की पैदावार होती है

0eρtλx˙dt=[eρtλ(t)x(t)]00eρtx(λ˙ρλ)dt

उस शब्द को फिर से जो संयुक्ताक्षर

J(u)=0eρt[H(x,u,λ)+x(λ˙ρλ)]dtlimteρtλ(t)x(t)+λ(0)x(0)

परिभाषित

x=x+εqu=u+εp

जो देता है

J(ε)=0eρt[H(x+εq,u+εp,λ)+(x+εq)(λ˙ρλ)]dtlimteρtλ(t)[x(t)+εq(t)]+λ(0)x(0)

FOC अधिकतमJε=0

Jε=0eρt[Hxq+Hup+q(λ˙ρλ)]dtlimteρtλ(t)q(t)=0

चूँकि और असंबंधित हैं, इसलिए हमारे पास करना चाहिए qp

Hu=0Hx=ρλλ˙limteρtλ(t)=0

क्या आपने अभी तक आवश्यक और पर्याप्त स्थितियों की पहचान की है?
जैम

यह किस आर्थिक संदर्भ में आता है?
स्टेन शुनपाइक

उदाहरण के लिए रैमसे मॉडल cer.ethz.ch/resec/people/tsteger/Ramsey_Model.pdf
कोई खबर नहीं

1
मुझे लगता है कि यह धागा math.stackexchange.com के लिए बेहतर अनुकूल है क्योंकि यह वास्तव में econ से जुड़ा नहीं है। एक मॉड इसे स्थानांतरित कर सकता है।
क्लूलेस

मुझे यकीन नहीं है कि यहां क्या पूछा गया है: यदि एचटीबी को हल करने वाले बर्थसेकस पर्याप्त हैं , तो आपको "अतिरिक्त इष्टतम परिस्थितियों के बारे में चिंता करने की ज़रूरत नहीं है"। HJB हल नहीं होने की स्थिति में "आवश्यक और पर्याप्त" के खिलाफ "पर्याप्त" उत्पन्न होगा, जो कोई भी कहेगा "इसका मतलब यह नहीं है कि कोई समाधान नहीं है"। वैसे, आपके प्रयास I और II यहां मूल्यवान सामग्री हैं - पहला जो एक लिंक bewteen HJB और Optimal Control दिखा रहा है, दूसरा यह दर्शाता है कि Optimal Control FOC कैसे प्राप्त किया जा सकता है।
एलेकोस पापाडोपोलोस 10

जवाबों:


1

(यह शायद एक टिप्पणी पर विचार किया जाना चाहिए।)

यदि आपने HJB समीकरण हल किया है, तो यह इष्टतम समाधान प्राप्त करने के लिए पर्याप्त है। इसलिए आपको "किसी भी अन्य इष्टतम स्थितियों से चिंतित नहीं होना है," जो मुझे लगता है कि आपके प्रश्न का उत्तर देने के लिए प्रतीत होता है।

ऐसा प्रतीत होता है कि आप प्रमेय के "आवश्यक" घटक के बारे में चिंतित हैं। कथन का आवश्यक पक्ष इस प्रकार है: यदि कोई इष्टतम समाधान है, तो HJB समीकरण का एक समाधान मौजूद होना चाहिए।

मैंने इस विशेष समस्या के साथ काम नहीं किया है, लेकिन सामान्य रूप से उत्तर यह है कि हम एक अलग फ़ंक्शन V की उम्मीद नहीं करते हैं। इसलिए हमारे पास समीकरण का समाधान नहीं है जैसा कि कहा गया है। इसके बजाय, हमें सामान्यीकृत डेरिवेटिव को देखने की जरूरत है, और एचजेबी समीकरण को असमानता में परिवर्तित करें। किस मामले में, आपको "चिपचिपापन समाधान" मिल सकता है। यदि हम सामान्यीकृत व्युत्पन्न का उपयोग करने का विस्तार करते हैं, तो यह साबित करना संभव हो सकता है कि ऐसा समाधान हमेशा मौजूद होता है। अपने प्रमाणों पर गौर करते हुए, वे आवश्यकता स्थितियों पर मदद नहीं करेंगे, जैसा कि आप भिन्नता मान रहे हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.