बेलमैन समीकरण का समाधान एक निश्चित बिंदु है


3

मैंने हाल ही में गतिशील अनुकूलन का अध्ययन शुरू किया है। मैं इस तथ्य के बारे में अपना सिर नहीं लपेट सकता कि बेलमैन समीकरण का मान फ़ंक्शन एक संकुचन मानचित्रण का एक निश्चित बिंदु है। जहां तक मेरी समझ बल्कि अनुभवहीन है: अगर समस्या परिमित है, कहते हैं:

t=0Tβtu(ct)
हम अंत से बेल्लमान समीकरण का निर्माण, के रूप में अगर हम पहले से अनुक्रम की अधिकतम संभव मूल्य जानता था । अंतिम अवधि से शुरू होकर T, हम केवल वर्तमान अवधि उपयोगिता दर्शाते हुए एक इष्टतम शब्द जोड़कर अधिकतमकरण को दोहराते हैं u(ct), जब तक हम अवधि 0 तक नहीं पहुंच जाते।0। यहां से मैं स्पष्ट रूप से देख सकता हूं कि संकुचन मानचित्रण कैसे काम करता है। लेकिन अनंत मामला मेरे लिए समझना इतना आसान नहीं है: मैं केवल यह मान सकता हूं कि, बेलमैन ऑपरेटर पुनरावृत्ति द्वारा (Bv)(x), हम तब तक फ़ंक्शन फ़ंक्शन का "अंशांकन" करते हैं जब तक कि हम मूल्य फ़ंक्शन नहीं पाते हैं (अर्थात हमारी ट्रांसवर्सैलिटी की स्थिति को देखते हुए अधिकतम संभव उपयोगिता) (Bv)(x)=v(x)। क्या मैं, कम से कम, सही दिशा में सोच रहा हूं, या इस विचार को एक अलग तरीके से समझा जाना चाहिए? पहले ही, आपका बहुत धन्यवाद। (इसके अलावा, .stackexchange पर यह मेरा पहला प्रश्न है, और यदि मेरे प्रश्न की प्रस्तुति के साथ कोई समस्या है, तो कृपया मुझे बताएं)

जवाबों:


1

मैं इस पर एक विशेषज्ञ द्वारा कोई मतलब नहीं है, लेकिन शायद यह मदद करता है। बेलमैन समीकरण के लिए यहां एक सरल उदाहरण है

V(y)=maxxu(x,y)+βV(y)

s.t.y=f(x,y)

यह एक अज्ञात फ़ंक्शन V में एक कार्यात्मक समीकरण है। इस समस्या का समाधान एक फ़ंक्शन V है जो ऊपर दिए गए समीकरण को संतुष्ट करता है। यदि आप समीकरण को देखते हैं, तो यह स्पष्ट है कि समाधान को बेलमैन समीकरण के आरएचएस पर ऑपरेटर का एक निश्चित बिंदु होना चाहिए: यदि आप सही V और एक मनमाना y लेते हैं और गणना करते हैं

maxxu(x,y)+βV(y)

s.t.y=f(x,y)

आपको मिलेगा । ऑपरेटर जो बेलमैन समीकरण का आरएचएस है, वह फ़ंक्शंस पर कार्य करता है, और समाधान फ़ंक्शंस के कुछ स्थान में एक निश्चित बिंदु है।V(y)

यह एक अलग सवाल है कि क्या यह निश्चित बिंदु मौजूद है और इसे कैसे खोजना है। यहाँ, आप संकुचन मानचित्रण प्रमेय के लिए अपील करते हैं: यू पर विशिष्ट मान्यताओं के तहत और प्रदान किया गया , ऊपर दिया गया अधिकतम कदम V के किसी भी अनुमान के लिए एक संकुचन मानचित्रण है। इसका मतलब है कि एक विशिष्ट निश्चित बिंदु V मौजूद है, और आप इसे क्रमिक पुनरावृत्ति द्वारा खोजें।β<1


धन्यवाद, आपकी पोस्ट पढ़ने के बाद मैं देख रहा हूं कि यह वास्तव में परिभाषा के अनुसार एक निश्चित बिंदु है। हां, मैंने अभी यह मान लिया है कि यूटिलिटी फंक्शन बाध्य है, आदि, डिफ़ॉल्ट रूप से। मुझे एक लेख मिला है जो बिंदु को और अधिक विस्तार से बताता है
dpd

@due_to_revision यदि आप उत्तर से खुश हैं, तो आपको इसे स्वीकार करने पर विचार करना चाहिए, इसलिए साइट आपके प्रश्न को 'अनुत्तरित' कतार में नहीं रखती है।
सैद्धांतिक अर्थशास्त्री
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.