जब इष्टतम नियंत्रण विफल हो जाता है (?)


17

"मेरा सवाल पूछने के लिए", मुझे पहले एक मॉडल को हल करना होगा। मैं कुछ चरणों को छोड़ दूंगा लेकिन फिर भी, यह अनजाने में इस पोस्ट को बहुत लंबा कर देगा-यह देखने के लिए भी एक परीक्षण है कि क्या यह समुदाय इस तरह के प्रश्नों को पसंद करता है।

शुरू करने से पहले, मैं स्पष्ट करता हूं कि यह पूरी तरह से निरंतर समय में एक मानक नियोक्लासिकल विकास मॉडल की तरह लग सकता है, लेकिन ऐसा नहीं है : यह एक एकल व्यक्ति के साथ संबंध है, जो उसके आसपास की अर्थव्यवस्था में किसी और का प्रतिनिधित्व नहीं करता है, एक अर्थव्यवस्था जो मॉडलिंग नहीं की है। यहाँ रूपरेखा "एकल व्यक्ति की अधिकतम समस्या के लिए इष्टतम नियंत्रण का अनुप्रयोग" है। यह ऑप्टिमल कंट्रोल सॉल्यूशन फ्रेमवर्क और मेथड के बारे में है।

हम एक छोटे व्यापारी की इंटरटेम्पोरल यूटिलिटी मैक्सिमाइजेशन समस्या को हल करते हैं जो उसकी फर्म में पूंजी का मालिक है, जबकि वह पूरी तरह से प्रतिस्पर्धी श्रम बाजार में श्रम सेवाओं की खरीद करता है, और वह अपने उत्पाद (ताजा डोनट्स) को पूरी तरह से प्रतिस्पर्धी माल बाजार में बेचता है। हम अनिश्चितता के बिना निरंतर समय में मॉडल सेट करते हैं (सामाजिक आर्थिक स्थितियां स्थिर हैं), और अनंत क्षितिज के साथ (व्यवसायी कई भविष्य की प्रतियों को एक पंक्ति में शामिल करता है):

maxc,,k0eρtlncdts.t.k˙=f(k,)wδkclimteρtλ(t)k(t)=0

जहाँ c व्यवसायी की खपत है, lnc उपभोग से तात्कालिक उपयोगिता है, ρ>0 शुद्ध समय वरीयता की दर है, k फर्म की पूँजी है, δ पूँजी मूल्यह्रास दर है, और f(k,) व्यवसाय का उत्पादन कार्य है। प्रारंभिक स्तर की पूंजी दी गई है, k0 । व्यवसाय के साथ व्यवसायी का अपना व्यवसाय पूंजी में बदल जाता है। उत्पादन समारोह मानक नियोक्लासिकल (पैमाने पर लगातार रिटर्न, सकारात्मक सीमांत उत्पाद, नकारात्मक दूसरे भाग, इनडा स्थिति) है। बाधाएं वर्तमान मूल्य गुणक का उपयोग करते हुए पूंजी की गति, और ट्रांसवर्सिटी स्थिति का कानून हैं।

वर्तमान मूल्य हैमिल्टनियन की स्थापना

H^=lnc+λ[f(k,)wδkc]

हम पहले-क्रम की स्थितियों की गणना करते हैं

H^c=01c=λc˙c=λ˙λ

H^=0λ[fw]=0f=w

H^k=ρλλ˙λ[fkδ]=ρλλ˙

और उनके संयोजन से हम अपने व्यवसायी के उपभोग के विकास का नियम प्राप्त करते हैं,

(1)c˙=(fkδρ)c

श्रम मांग के लिए इष्टतम नियम से (स्थैतिक) और स्थिरांक पर निरंतर रिटर्न ( ) हम प्राप्त । इसे हम प्राप्त होने वाले पूँजी की गति के नियम में सम्मिलित करते हैंf = f k k + f f:f=wf=fkk+ffw=fkk

(2)k˙=fkkδkc

समीकरण और अंतर समीकरणों की एक प्रणाली बनाते हैं। खपत और व्यवसायी की पूंजी के लिए स्थिर-राज्य मूल्य हैं( 2 )(1)(2)

(3)c=fkkδk,k:fk=δ+ρ

(3a)c=ρk

... जो एक बहुत परिचित अभिव्यक्ति है।

k को कभी-कभी पूंजी का "संशोधित स्वर्ण नियम" स्तर कहा जाता है। स्थिर स्थिति मूल्यों पर मूल्यांकन किए गए सिस्टम के जैकबियन में मॉडल मापदंडों के किसी भी मूल्य के लिए एक नकारात्मक निर्धारक है , जो प्रणाली के लिए काठी-पथ स्थिरता का प्रदर्शन करने के लिए आवश्यक और पर्याप्त स्थिति है।

locus की अधिकतम बिंदु पर है, (कभी-कभी इसे "सुनहरा नियम" राजधानी का समय कहा जाता है) ~ कश्मीरk˙=0k~

(4)k~:fkk(k~)k~+fk(k~)δ=0fk(k~)=δfkk(k~)k~

मूल्य एक बेंचमार्क के रूप में महत्वपूर्ण है: यह राजधानी के स्तर है, जहां और एक पर है अधिकतम (नहीं इष्टतम या स्थिर राज्य )।˙ के =k~k˙=0c

लोकी स्थिर राज्य की राजधानी स्तर पर चरण आरेख की क्षैतिज अक्ष (कि उपायों राजधानी) को पार कर ।कश्मीर *c˙=0k

अगर , जिसके लिए आवश्यकता होती है , तो नकारात्मक दूसरे भाग के कारण, हमारे पास "पूंजी का अधिक संचय" (बहुत अधिक डोनट्स) होगा: व्यवसायी अधिक स्थिर आनंद ले सकता है- निम्न स्तर की पूंजी के साथ राज्य की खपत। का उपयोग करते हुए और हमारे पास* कश्मीर < कश्मीर ( ~ कश्मीर )k>k~fk<fk(k~)( 4 )(3)(4)

*<(~)δ+ρ<δ-(~)~

(5)ρ<-(~)~

असमानता पूंजी के उप-इष्टतम स्थिर-राज्य स्तर के लिए शर्त है। और बात यह है कि हम इसे खारिज नहीं कर सकते । इसके लिए बस यह आवश्यक है कि व्यवसायी "पर्याप्त रूप से धैर्यवान" हो, जिसमें पर्याप्त समय के लिए शुद्ध समय की पर्याप्त दर हो, लेकिन फिर भी वह सकारात्मक हो।(5)

यहां समस्या शुरू होती है: प्रतिनिधि एजेंट मॉडल में पूंजी के अतिव्यापीकरण को प्रभावी ढंग से बाहर रखा गया है। पीढ़ी के मॉडल को ओवरलैप करना संभव है, लेकिन मैक्रोइकॉनॉमिक स्तर पर एक अनपेक्षित परिणाम के रूप में, सबसे शुरुआती उदाहरणों में से एक है कि मैक्रो-अर्थव्यवस्था सूक्ष्म रूप से स्थापित हो सकती है और अभी भी सूक्ष्म दुनिया की तुलना में अलग तरह से व्यवहार करती है।

लेकिन हमारा मॉडल न तो श्रेणी में आता है: यह एक अव्यवस्थित विषम वातावरण में एक एकल एजेंट का एक आंशिक संतुलन मॉडल है-और सामान्य संतुलन यहाँ परिणामों में परिवर्तन नहीं करेगा: यह व्यक्ति केवल स्वयं का प्रतिनिधित्व करता है। तो समस्या यह है कि अगर रखती है, तो इष्टतम नियंत्रण समाधान स्पष्ट रूप से उप-इष्टतम होगा , क्योंकि यहां हमारे पास एक व्यक्ति, एक इच्छा, एक दिमाग: समाधान को देखकर हमारा व्यवसायी कहेगा, " हे, यह विधि बेकार है, अगर मैं इसकी सलाह का पालन करता हूं तो मैं एक उप-आशावादी उच्च स्तर की पूंजी के साथ समाप्त हो जाऊंगा "। (5)

और मैं केवल "अच्छी तरह से कहने के लिए संतुष्ट नहीं हूँ, इष्टतम नियंत्रण इस समस्या के लिए उपयुक्त नहीं है, एक और तरीका आज़माएं", क्योंकि मैं यह नहीं देख सकता कि हमें इसे अनुपयुक्त क्यों मानना ​​चाहिए। लेकिन अगर यह उपयुक्त है, तो विधि का संकेत चाहिए कि कुछ गलत है, यह कुछ बिंदु पर होना चाहिए की आवश्यकता होती है कि करता नहीं आदेश में एक समाधान (पेशकश करने में सक्षम होने के लिए पकड़ है, अगर यह इतना है कि नहीं है पकड़, सब कुछ प्रफुल्लित दिखता है)।( )(5)(5)

कोई आश्चर्यचकित हो सकता है "शायद रखती है तो ट्रांसवर्सिटी की स्थिति का उल्लंघन होता है ?" -लेकिन ऐसा नहीं लगता कि यह ऐसा करता है, क्योंकि , जो कि एक सकारात्मक स्थिरांक में जाता है, जबकि जाता है शून्य, केवल उस ।λ ( टी ) के ( टी ) = के ( टी ) / सी ( टी ) - ρ टी ρ > (5)λ(टी)(टी)=(टी)/सी(टी)-ρटीρ>0

मेरे सवाल:

1) क्या कोई यहाँ कुछ जानकारी दे सकता है?

2) मैं आभारी रहूंगा यदि किसी ने डायनामिक प्रोग्रामिंग का उपयोग करके इसे हल किया और परिणामों की सूचना दी।

परिशिष्ट
देखने के एक गणितीय दृष्टि से, इस मॉडल की महत्वपूर्ण अंतर यह है कि अनुकूलित पूंजी की गति, eq की व्यवस्था। में मानक मॉडल की तरह पूरा आउटपुट शामिल नहीं है , लेकिन केवल पूंजी रिटर्न । और ऐसा इसलिए होता है क्योंकि हमने आउटपुट पर संपत्ति के अधिकारों को अलग कर दिया है, जो "व्यक्तिगत व्यवसाय की अधिकतम समस्या" ढांचे में है, उम्मीद की जानी है।एफ ( के ) एफ के के(2)f(k)fkk


मुझे यकीन नहीं है कि आपके कहने का मतलब क्या है जब आप कहते हैं "अधिकतम kdot = 0 लोकस"। क्या सम्मान के साथ अधिकतम? इसके अलावा, जब आप गणना करते हैं (4), तो क्या आपको पूरी तरह से अंतर नहीं करना चाहिए (2) - यानी क्या आपको उस बदलाव की गणना भी नहीं करनी चाहिए जो कि k = को सुनिश्चित करने के लिए आवश्यक है = 0 अभी भी संतुष्ट है जब आप k बदलते हैं?
सर्वव्यापी

@ विशिष्ट पूंजी के संबंध में अधिकतम। यह ठीक उसी तरह है जैसे चरण चित्र खींचे जाते हैं, लेकिन मैं यहाँ इन गणनाओं को भी शामिल नहीं कर सकता। दूसरे प्रश्न के लिए: इन और पूंजी, ( स्थिर राज्य मान पर मूल्यांकन नहीं कार्य के रूप में व्यक्त करने से आता है । इस स्थान के आकार को प्राप्त करने के लिए, हम इसे पूंजी के संबंध में अलग करते हैं। ˙ कश्मीर = 0 ( 2 ) सी = कश्मीर कश्मीर - δ कश्मीर(4)k˙=0(2)c=fkkδk
एलेकोस पापाडोपोलोस

मैंने पूरी बात की जाँच नहीं की है, लेकिन एक समस्या मुझे दिखती है कि श्रम की इष्टतमता की स्थिति (सीआरएस के तहत) पूंजी / श्रम अनुपात निर्धारित करती है, जो बदले में पूंजी के सीमांत उत्पाद को निर्धारित करती है, जो इस प्रकार इष्टतम पथ के साथ स्थिर होगी। मॉडल तब बहिर्जात ब्याज दर के साथ मानक खपत-बचत समस्या के बराबर है, इसलिए यदि MPK - डेल्टा> rho, एजेंट की खपत निरंतर दर (यानी कोई स्थिर स्थिति नहीं है) में बढ़ रही होगी।
ivansml

@ivansml। योगदान के लिए धन्यवाद। लेकिन समाधान यह नहीं कहता कि । स्थिर राज्य है जहां पर , eq। । समस्या यह है कि यह स्थिर-अवस्था किस पूंजी के स्तर से मेल खाती है, और क्या यह "गोल्डन रूल" स्तर ऊपर या नीचे होगा । कश्मीर - δ = ρ ( 3 ) ~ कश्मीरfkδ>ρfkδ=ρ(3)k~
एलेकोस पापाडोपोलोस

केवल अब मैंने देखा कि यह प्रश्न पुराना है ... आशा है कि कोई फर्क नहीं पड़ता। विषय पर वापस - श्रम FOC द्वारा निर्धारित किया जाना चाहिए। स्थिर अवस्था तभी मौजूद होगी जब का यह मान भी संयोग (या कुछ सामान्य संतुलन पर विचार) द्वारा बराबर हो । यदि यह अधिक है, तो एजेंट अनिश्चित काल के लिए पूंजी जमा करेगा और उसकी खपत बढ़ती है, अगर यह कम है, तो वह पूंजी को कम कर देगा और उसकी खपत गिर जाएगी। सीआरएस धारणा के कारण यह सब वास्तव में है - "राजस्व" फ़ंक्शन में रैखिक है क्योंकि एक बार फर्म श्रम पर अनुकूलन करता है, इसलिए स्थिर विकास संभव है। कश्मीर ρ + δ ( कश्मीर , ) - डब्ल्यू कश्मीरfkfkρ+δf(k,)wk
ivansml

जवाबों:


9

मेरा मानना ​​है कि समस्या यह है कि स्थिर स्थिति मौजूद नहीं हो सकती है, और सिस्टम इसके बजाय स्थिर विकास (मापदंडों के आधार पर) का प्रदर्शन करता है।

इसका कारण यह है कि मॉडल बहिर्जात और निरंतर ब्याज दर के साथ मानक खपत-बचत समस्या के बराबर है। यह देखने के लिए, पहले श्रम विकल्प (यहाँ, आंशिक रूप से wrt। th तर्क का व्युत्पन्न है लिए पहली आदेश स्थिति पर विचार करें । निरंतर रिटर्न की परिभाषा का उपयोग करते हुए, श्रम के सीमांत उत्पाद जो केवल पूंजी-श्रम अनुपात का एक कार्य है। यदि मजदूरी स्थिर है, तो श्रम FOC विशिष्ट रूप से इष्टतम निर्धारित करतामैंमैं f2(k,)=wfifiकश्मीर/डब्ल्यू

f(k,)=[f(k,1)]=f1(k,1)k+f(k,1)
k/वेतन और अन्य मापदंडों के एक समारोह के रूप में अनुपात । चूँकि पूँजी भी पर निर्भर करता , यह इष्टतम पथ के साथ स्थिर रहेगा। सीमांत उत्पाद इस मान को निरूपित करें , और मूल्यह्रास के रिटर्न नेट को निरूपित करें । पूँजी और उपभोग की गतिकी के समीकरण (1) - (2) तो और विशिष्ट समाधान जो ट्रांसवर्सिटी की स्थिति को संतुष्ट करता है होना चाहिएwकश्मीर/आर*आर=आर*-δ ˙ सी टी
kf(k,)=k[f(k,1)]=f1(k,1)
k/rr=rδ ct=ρktk0(r-ρ)w
c˙t=(rρ)ctk˙t=rktct
ct=ρkt साथ , अर्थात् प्रत्येक क्षण में धन का एक निरंतर भाग खपत होता है। पूंजी और खपत दोनों दर बढ़ती हैं , इसलिए जब तक पूंजी पर वापसी नहीं होती है, तब तक कोई स्थिर स्थिति नहीं होती है (जो यहां बहिर्जात मजदूरी दर पर निर्भर करती है ) समय की वरीयता के बराबर होती है।k0(rρ)w

(+1) धन्यवाद। मैं इसे अब एक जवाब में ले रहा हूं।
एलेकोस पापाडोपोलोस

बहुत बढ़िया जवाब। मूल रूप से, एक बार श्रम को बेहतर तरीके से चुने जाने के बाद, लाभ फ़ंक्शन राजधानी में रैखिक हो जाता है - ताकि यह मॉडल एक एके मॉडल के लिए उबलता हो, जिसके गुणों (स्थिर राज्य विकास सहित) को अच्छी तरह से समझा जाता है।
नाममात्र कठोर

@nominallyrigid लेकिन केवल अगर हम मानते हैं कि मजदूरी स्थिर रहती है । याद रखें कि यह सामान्य संतुलन नहीं है, अर्थव्यवस्था के महासागर में तैरने वाला एक छोटा सा व्यक्ति है।
एलेकोस पापाडोपोलोस

6

मैं इसे एक उत्तर के रूप में पोस्ट कर रहा हूं, क्योंकि यह उपयोगकर्ता @ivansml उत्तर पर जारी है ... जो कि यहां पकड़ने वाले की पहचान करता है, एक कैच जिसे मैंने भोलेपन से अनदेखा किया है (हालांकि यह एक संकीर्ण मामला है, जबकि दिलचस्प सममूल्य के बाद आता है। फिर भी, इससे निपटा जाना चाहिए)।

वास्तव में, बहिर्जात मजदूरी दर और श्रम मांग पर पूरी तरह से प्रतिस्पर्धी अनुकूलन के साथ, पूंजी का सीमांत उत्पाद केवल मॉडल के मापदंडों और मजदूरी दर से निर्धारित होता है। उस सरल मामले के लिए जहां हम मानते हैं कि मजदूरी दर स्थिर है @ivansml का विश्लेषण निरंतर है: मॉडल अंतर्जात विकास में से एक बन जाता है : पूंजी का सीमांत उत्पाद निरंतर होता है, जो कि अंतर्जात विकास के लिए आवश्यक है, जहां कोई स्थिर नहीं है स्तरों में राज्य ।

Denoting और , समीकरण और की OP लिखी जा सकती हैं कश्मीर = ˙ कश्मीर /कश्मीर(1)(2)c^=c˙/ck^=k˙/k(1)(2)

कश्मीर =कश्मीर-δ

(1b)c^=fkδρ
(2b)k^=fkδc/k

चूँकि स्थिर है, उपभोग की वृद्धि दर स्थिर है - शून्य, धनात्मक, या ऋणात्मक, मापदंडों और मजदूरी के आधार पर। दूसरी ओर समय के संबंध में अंतर हमें मिलता हैfk(2b)

k^˙=(k^c^)(c/k)

और यह स्पष्ट है कि स्थिर-राज्य विकास के लिए हम , जो, से प्राप्त होता है यदि । यह सत्यापित करना आसान है कि, चूंकि , एकमात्र तरीका है कि ट्रांसवर्सिटी स्थिति धारण करेगा, अगर खपत और पूंजी बढ़ती है, या सिकुड़ती है, उसी दर पर (या स्थिर रहें)।k^=c^(2b)c=ρkλ(t)=c(t)

अंतर्जात विकास मॉडल उचित में जहां हम पूरी अर्थव्यवस्था की जांच करते हैं, हम सिर्फ यह मानते हैं कि मॉडल के पैरामीटर ऐसे हैं कि सकारात्मक विकास दर है, क्योंकि यही हम वास्तविक दुनिया में देखते हैं। लेकिन यहाँ, हमारे पास सिर्फ एक व्यक्ति है। तो, हम अपने व्यवसायी को क्या बता रहे हैं?

यदि , विकास दर सकारात्मक है, और उसकी खपत और पूंजी दोनों को "हमेशा" बढ़ना चाहिए, एक निरंतर अनुपात बनाए रखना चाहिए। यदि , विकास दर शून्य है, और दोनों चर हमेशा स्थिर रहते हैं। अगर , विकास दर नकारात्मक है, और हमें कम खपत और पूंजी के नीचे की ओर सर्पिल में प्रवेश करना चाहिए (हमेशा संबंध बनाए रखना )।fkδρ>0
fkδρ=0
fkδρ<0c=ρk

यह कुछ अंतर्ज्ञान है, इष्टतम नियंत्रण आवेदन की उपयुक्तता को मान्य करता है: अन्य मापदंडों और मजदूरी दर को देखते हुए, बड़ी "अधीरता" (बड़ा है) अधिक संभव हो जाता है कि व्यक्ति घटते खपत के स्तर का अनुभव करेगा। भविष्य, और इसलिए निवेश, उसकी पसंद के हिसाब से ज्यादा नहीं हैं। बेशक, एक मोनोटोनिक नीचे की ओर सर्पिल बहुत यथार्थवादी नहीं लग सकता है क्योंकि समाधान के रूप में-यह एक बहुत ही स्टाइल वाला मॉडल है, जो आवश्यक रूप से अत्यधिक औपचारिक गणितीय भाषा में सामान्य प्रवृत्ति प्रदान करता है। ρ

वाकई दिलचस्प हिस्सा है, तो शुरू कर देंगे हम एक चर मजदूरी पर विचार । यह हमारे छोटे व्यवसायी और उसके उपभोग-निवेश निर्णयों के लिए सभी प्रकार के दिलचस्प और जटिल गतिकी का निर्माण कर सकता है।


4

मुझे लगता है कि मुख्य सवाल यह है कि क्या यह अर्थव्यवस्था में एकमात्र फर्म है। यदि यह है तो यह अब इसके लिए सही नहीं है कि इसे रूप में लिया जाए क्योंकि अपने स्वयं के पूंजी संचय निर्णय से प्रभावित होगा। इस मामले में आपको हेमिल्टन को स्थापित करते समय अपने समीकरण (2) से पहले किए गए प्रतिस्थापन को बनाना चाहिए। दूसरी ओर यदि यह कई फर्मों में से एक है, ताकि मजदूरी दर बहिष्कृत हो, तो eq से पहले प्रतिस्थापन। (२) मान्य नहीं हैं। मैं आप ध्यान से big- के बीच अंतर करने की जरूरत है , अर्थव्यवस्था में कुल पूंजी, और little- राजधानी इस निर्णय निर्माता द्वारा चुना।wwkk


मैं कड़ाई से एक एकल फर्म को देख रहा हूं जो कुल को प्रभावित करने के लिए बहुत छोटा है। तो आपकी दूसरी टिप्पणी प्रासंगिक है, जहां आप कहते हैं कि "समीकरणों से पहले प्रतिस्थापन (2) मान्य नहीं हैं"। मैं क्यों नहीं देख रहा हूँ। क्या आप कृपया उस पर विस्तृत रूप से (अधिमानतः औपचारिक रूप से) विचार कर सकते हैं? धन्यवाद।
एलेकोस पापाडोपोलोस

@AlecosPapadopoulos मुझे लगता है कि समस्या गणितीय नहीं है बल्कि व्याख्या की है। यदि मेरी फर्म अर्थव्यवस्था को प्रभावित करने के लिए बहुत छोटी है, तो ऐसा मामला क्यों होना चाहिए जो मेरे द्वारा चुने गए बिना अपनी फर्म के लिए या , जो आपके द्वारा पहले किए गए प्रतिस्थापनों में निहितार्थ से प्रतीत होता है (2) ) और फिर से आरएचएस फर्क के संबंध में समीकरण । w=flr=fkkk˙k
ज्योतिर्मय भट्टाचार्य

1
@ ज्योतिर्मय भट्टाचार्य कि प्रतिस्पर्धी बाजारों को संभालने से एक मानक परिणाम है।
फुआबर

@FooBar एक प्रतिस्पर्धी बाजार में आप और और बनाने के लिए और । शर्तों में मनमानी और पर पकड़ नहीं है । klw=flr=fklk
ज्योतिर्मय भट्टाचार्य

ठीक है, मुझे हैमिल्टन को लिखना होगा, और इसे और भी लंबा बनाना होगा।
एलेकोस पापाडोपोलोस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.