Pde- विवश अनुकूलन के लिए सहायक विधि की लागत को समझना


11

मैं यह समझने की कोशिश कर रहा हूं कि एक पीडीई विवश अनुकूलन के लिए आसन्न-आधारित अनुकूलन विधि कैसे काम करती है। विशेष रूप से, मैं यह समझने की कोशिश कर रहा हूं कि समस्याओं के लिए आसन्न विधि अधिक कुशल क्यों है जहां डिजाइन चर की संख्या बड़ी है, लेकिन "समीकरणों की संख्या छोटी है"।

मैं क्या समझता हूँ:

निम्न PDE पर विचार करें अनुकूलन समस्या के कारण:

minβ I(β,u(β))s.t.R(u(β))=0

जहाँ वेक्टर डिज़ाइन वेरिएबल का एक (पर्याप्त रूप से निरंतर) वस्तुनिष्ठ कार्य करता और फ़ील्ड वेरिएबल का वेक्टर होता है जो डिज़ाइन चर पर निर्भर करता है, और पीडीई का अवशिष्ट रूप है।Iβu(β)R(u)

स्पष्ट रूप से, हम I और R के पहले बदलाव कर सकते हैं

δI=Iβδβ+Iuδu

δR=Rβδβ+Ruδu=0

लैग्रेंज मल्टीप्लायरों एक वेक्टर का परिचय , उद्देश्य फ़ंक्शन में भिन्नता के रूप में लिखा जा सकता हैλ

δI=Iβδβ+Iuδu+λT[Rβδβ+Ruδu]

शब्दों को बदलते हुए, हम लिख सकते हैं:

δI=[Iβ+λTRβ]δβ+[Iu+λTRu]δu

इस प्रकार, अगर हम लिए हल करने में सक्षम हैं जैसे किमैंλ

Iu+λTRu=0 (adjoint equation)

फिर ढाल का मूल्यांकन किया गया है केवल डिज़ाइन चर संदर्भ में ।बीटाδI=[Iβ+λTRβ]δββ

इस प्रकार, एक निकटता आधारित अनुकूलन एल्गोरिथ्म निम्नलिखित चरणों में लूप करेगा:

  1. वर्तमान डिज़ाइन चर को देखते हुएβ
  2. फ़ील्ड चर (PDE से) के लिए हल करेंu
  3. लैग्रेंज मल्टीप्लायरों ( ( निकटवर्ती समीकरण से) के लिए हल करेंλ
  4. ग्रेडिएंट्स गणना करेंIβ
  5. अद्यतन डिजाइन चरβ

मेरा प्रश्न

यह स्थगन 'चाल' उस मामले में प्रति प्रवाह के अनुकूलन की लागत में सुधार कैसे करता है, जहां डिजाइन चर की संख्या बड़ी है? मैंने सुना है कि सहायक विधि के लिए ढाल मूल्यांकन की लागत डिजाइन चर की संख्या के 'स्वतंत्र' है। लेकिन यह वास्तव में कितना सही है?

मुझे यकीन है कि कुछ बहुत स्पष्ट है कि मैं किसी तरह से देख रहा हूँ।


3
वैसे, लैगरेंज गुणक को आमतौर पर उद्देश्य कार्यात्मक में जोड़ा जाता है, भिन्नता नहीं; इस प्रकार । से शून्य के संबंध में व्युत्पन्न को समीपवर्ती समीकरण में सेट करता है, और इस (और राज्य समीकरण के समाधान ) को व्युत्पन्न में संबंध में ढाल ढाल देता है। यदि आप पीडीई के कमजोर निर्माण के साथ शुरू करते हैं, तो चीजें और भी सरल हो जाती हैं: बस टेस्ट फ़ंक्शन के स्थान पर लैगरेंज गुणक डालें। कहीं भी मजबूत रूप या आंशिक एकीकरण की आवश्यकता नहीं है। यू यू आर ( यू , β ) = 0 βminu,βmaxλI(u,β)+λTR(u,β)uuR(u,β)=0β
क्रिश्चियन क्लैसन

1
किसी भी सिमुलेशन का सबसे महंगा हिस्सा हल चरण है। समीपवर्ती का उपयोग करके आप दो हिस्सों में ढाल प्राप्त करते हैं, परिमित अंतर की तुलना में बहुत सस्ता है जहां आपको कम से कम n + 1 हल की आवश्यकता होती है, अपने मॉडल में मुफ्त मापदंडों की संख्या होने के नाते।
स्टालिक

जवाबों:


10

यह स्थगन 'चाल' उस मामले में प्रति प्रवाह के अनुकूलन की लागत में सुधार कैसे करता है, जहां डिजाइन चर की संख्या बड़ी है?

मैं एक रैखिक बीजगणितीय परिप्रेक्ष्य से लागत के बारे में सोचता हूं। ( स्टीफन जी। जॉनसन द्वारा इन नोटों को देखें , जो मुझे लग्र गुणक दृष्टिकोण से अधिक सहज लगता है)। सीधे दृष्टिकोण संवेदनशीलता के लिए हल करने के लिए राशि:

uβ=(Ru)1Rβ

जिसमें वेक्टर में प्रत्येक पैरामीटर के लिए एक रैखिक प्रणाली को हल करना शामिल है , फिर मूल्यांकन करनाβ

dIdβ=Iβ+Iuuβ,

जहाँ कुल व्युत्पन्न को दर्शाता है, और आंशिक व्युत्पन्न को दर्शाता है।d

निकटवर्ती नोटों का कहना है कि

मैंβ=मैंβ-मैंयू(आरयू)-1आरβ,

इसलिए निकटवर्ती चर (लग्र गुणक) द्वारा परिभाषित किया जा सकता हैλ

-मैंयू(आरयू)-1=λटी,

जो समीपवर्ती समीकरण से मेल खाता है

मैंयू+λटीआरयू=0।

शर्तों के इस पुनर्संरचना के लिए प्रत्येक पैरामीटर के लिए रैखिक समाधान के बजाय केवल एक रैखिक समाधान की आवश्यकता होती है, जो कई पैरामीटर मामले के लिए आसन्न मूल्यांकन को सस्ता बनाता है।

मैंने सुना है कि सहायक विधि के लिए ढाल मूल्यांकन की लागत डिजाइन चर की संख्या के 'स्वतंत्र' है। लेकिन यह वास्तव में कितना सही है?

यह पूरी तरह से स्वतंत्र नहीं है; वर्तमान में मूल्यांकन की लागत और मापदंडों की संख्या के साथ बढ़ेगी। लीनियर सॉल्व, हालांकि, तब भी एक ही आकार का होगा, जब तक कि का आकार नहीं बदलता। धारणा यह है कि फ़ंक्शन मूल्यांकन की तुलना में सोल्व बहुत अधिक महंगे हैं।( आर /बीटा ) यू(मैं/β)(आर/β)यू


8

संक्षेप में, लाभ कम उद्देश्य की गणना डेरिवेटिव के लिए है कि इस तथ्य से आता , तुम सच के व्युत्पन्न पता करने की जरूरत नहीं है सम्मान के साथ करने के लिए एक अलग वस्तु के रूप में, लेकिन इसका केवल वह हिस्सा जो में भिन्नता की ओर जाता है ।यू ( βमैं(β,यू(β))β मैं ( β , यू ( β ) )यू(β)βमैं(β,यू(β))

मुझे एक संकेतन मैं थोड़ा के साथ अधिक सहज कर रहा हूँ करने के लिए स्विच करते हैं: ( किया जा रहा है डिजाइन वेरिएबल, स्टेट वेरिएबल है, और ऑब्जेक्टिव है)। मान लें कि निहित फ़ंक्शन प्रमेय को लागू करने के लिए काफी अच्छा है, इसलिए समीकरण में एक अद्वितीय समाधान जो कि संबंध में निरंतर भिन्न है , और व्युत्पन्न को ( और का आंशिक व्युत्पन्न किया जा रहा है के समाधान द्वारा दिया गया है। ।u y J e ( y , u ) e ( y , u ) = y ( u ) u y ) ( u ) e y ( y ( u ) , u ) y ( u ) + u ( y ( यू ) , यू )

मिनटy,यूजे(y,यू)का विषय है(y,यू)=0
यूyजे(y,यू)(y,यू)=0y(यू)यूy'(यू)वाययू
(1)y(y(यू),यू)y'(यू)+यू(y(यू),यू)=0
yयू

इसका मतलब है कि आप कम किए गए ऑब्जेक्टिव को परिभाषित कर सकते हैं , जो कि अलग-अलग भी है (यदि है)। ग्रेडिएंट को चिह्नित करने का एक तरीका दिशात्मक डेरिवेटिव के माध्यम से है (उदाहरण के लिए, डिज़ाइन स्थान के आधार पर सभी आंशिक डेरिवेटिव की गणना करें)। यहाँ, दिशा में दिशात्मक व्युत्पन्न श्रृंखला नियम द्वारा यदि अच्छा है, तो गणना करने के लिए केवल एक ही मुश्किल चीज है दी गई । यह गुणा करके किया जा सकता है के साथजम्मू ( y , यू ) j ( यू ) j ' ( यू ; ) = जम्मू y ( y ( यू ) , यू यू ) , यू ) , जम्मू y ' ( यू ) जे(यू): =जे(y(यू),यू)जे(y,यू)जे(यू)

(2)जे'(यू;)=जेy(y(यू),यू),y'(यू)+जेयू(y(यू),यू),
जेy'(यू)( 1 ) एच वाई ' ( यू ) [ y ' ( यू ) ] = y ( y ( यू ) , यू ) - 1(1) (जिसे निहित फ़ंक्शन प्रमेय अनुमति देता है) के लिए दाईं ओर से हल करना , यानी, कंप्यूटिंग और इस अभिव्यक्ति को में प्लग करना । पीडीई-विवश अनुकूलन में, यह डिजाइन स्थान के हर आधार वेक्टर के लिए एक रैखिक पीडीई को हल करने के लिए है।y'(यू)
(3)[y'(यू)]=y(y(यू),यू)-1[यू(y(यू),यू)]
(2)

हालाँकि, यदि हमें एक ऑपरेटर ऐसा लगता है कि तो यह वांछित ढाल होना चाहिए। देखते हुए , हम (साथ adjoint ऑपरेटर जा रहा है), इसलिए हम सभी गणना करने की जरूरत है । इसका उपयोग करते हुए , यह , अर्थात, कंप्यूटिंग का उपयोग करके किया जा सकता है और सेटिंग विवश अनुकूलन में,जे

जे'(यू;)=जे,सबके लिए ,
(1)
जेy(y(यू),यू),y'(यू)=y'(यू)*जेy(y(यू),यू),
y'(यू)*y'(यू)*जेy(y(यू),यू) ( 3 ) λ : = y ( y ( यू ) , यू ) - * जम्मू y ( y ( यू ) , यू ) ) * λ + जम्मू यू ( y ( यू ) , यू ) जे वाई ( वाई ( यू ) , यू ) λ(बी)*=बी**(3)
λ: =y(y(यू),यू)-*जेy(y(यू),यू)
जे(यू)=यू(y(यू),यू)*λ+जेयू(y(यू),यू)
जेy(y(यू),यू)आमतौर पर कुछ प्रकार के अवशिष्ट होते हैं, और कंप्यूटिंग में डिज़ाइन स्पेस के आयाम से स्वतंत्र एक (रैखिक) सहायक पीडीई को हल करना शामिल होता है। (वास्तव में, यह वितरित मापदंडों के लिए भी काम करता है, अर्थात, यदि कुछ अनंत-आयामी बानाच स्थान में एक फ़ंक्शन है, जहां पहला दृष्टिकोण अनम्य है।)λयू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.