एक इष्टतम के लिए आवश्यक शर्तों के रूप में KKT की स्थिति के मूल विचार है कि अगर वे एक व्यवहार्य बिंदु पर पकड़ नहीं है , तो वहां मौजूद एक दिशा उस उद्देश्य में सुधार होगा में वृद्धि के बिना (और इसलिए संभवतः उल्लंघन) बाधाओं। (यदि केकेटी की शर्तें पर नहीं हैं, तो एक इष्टतम नहीं हो सकती हैं, इसलिए एक बिंदु के लिए KKT की स्थिति एक इष्टतम होना आवश्यक है।)xδfxx
कल्पना कीजिए कि आपको अनुकूलन समस्या है:
minimize (over x)subject tof(x)∀j∈{1…k}gj(x)≤0
जहां और वहाँ बाधाएं हैं।x∈Rnk
चलो की ढाल को संकेतित एक स्तंभ वेक्टर होना पर मूल्यांकन किया जाता ।∇f(x)fx
एप्लाइड इस स्थिति के लिए, फ़र्कास लेम्मा कहा गया है कि किसी भी बिंदु के लिए वास्तव में एक निम्नलिखित बयानों में रखती है:x∈Rn
- वहाँ जैसे कि औरλ∈Rk∑kj=1λj∇gj(x)=−∇f(x)λ≥0
- भी बना हुआ है ऐसा है कि औरδ∈Rn∀jδ′gj(x)≤0δ′∇f(x)<0
इसका क्या मतलब है? इसका मतलब है कि किसी भी संभव बिंदु , या तो:x
- स्थिति (1) रखती है और केकेटी की स्थिति संतुष्ट होती है।
- स्थिति (2) रखती है और एक व्यवहार्य दिशा वहां मौजूद उस उद्देश्य समारोह को बेहतर बनाता है बढ़ रही बाधाओं के बिना । (उदा। आप से ले जाकर सुधार सकते हैं )δfgjfxx+ϵδ
शर्त (1) में कहा गया है कि गैर-ऋणात्मक गुणक जैसे कि KKT स्थितियां बिंदु पर संतुष्ट हैं । (ज्यामितीय रूप से, यह कहता है कि बाधाओं के ग्रेडिएंट्स द्वारा परिभाषित उत्तल शंकु में निहित है।)λx−∇f
स्थिति (2) बताती है कि बिंदु , वहां (स्थानीय रूप से) को स्थानांतरित करने के लिए एक दिशा मौजूद है:xδ
- दिशा में जाने से उद्देश्य फ़ंक्शन कम हो जाता है (क्योंकि और का डॉट उत्पाद शून्य से कम है)।δ∇f(x)δ
- दिशा में जाने से बाधाओं का मान नहीं बढ़ता है (क्योंकि और सभी के लिए शून्य से कम या बराबर है बाधाएं )।δ∇gj(x)δj
(ज्यामितीय रूप से, संभव दिशा वेक्टर के बीच एक अलग हाइपरप्लेन को परिभाषित करता है और द्वारा परिभाषित उत्तल शंकु ।)।)δ−∇f(x)∇gj(x)
(ध्यान दें: इसे लेम्मा में मैप करने के लिए , मैट्रिक्स ]A=[∇g1,∇g2,…,∇gk]
यह तर्क आपको एक इष्टतम पर केकेटी परिस्थितियों की आवश्यकता (लेकिन पर्याप्तता नहीं) देता है। यदि केकेटी की शर्तें संतुष्ट नहीं हैं (और बाधा योग्यताएं संतुष्ट हैं), तो बाधाओं का उल्लंघन किए बिना उद्देश्य में सुधार करना संभव है।
बाधा योग्यता की भूमिका
क्या गलत हो सकता हैं? आप पतित स्थितियों को प्राप्त कर सकते हैं जहां बाधाओं के ग्रेडिएंट्स को स्थानांतरित करने के लिए संभव नहीं हैं।
वहाँ से चुनने के लिए विभिन्न तर्क योग्यता की एक भीड़ है कि उपरोक्त तर्क काम करने की अनुमति देगा।
न्यूनतम, अधिकतम व्याख्या (सबसे सहज रूप में)
लैग्रेन्जियम का गठन करें
L(x,λ)=f(x)+∑j=1kλjgj(x)
को बाध्य करने के लिए विषय को कम करने के बजाय , कल्पना करें कि आप को कम करने की कोशिश कर रहे हैं, जबकि कुछ प्रतिद्वंद्वी इसे अधिकतम करने की कोशिश कर रहे हैं। बाधाओं का उल्लंघन करने के लिए आप गुणक को दंड (कुछ प्रतिद्वंद्वी द्वारा चुना गया) के रूप में व्याख्या कर सकते हैं । fgjLλi
मूल अनुकूलन समस्या का समाधान इसके बराबर है:
minxmaxλL(x,λ)
अर्थात्:
- आप पहली बार को Lagrangian , को कम करने के लिए संज्ञान लेते हैं कि ...xL
- फिर मैं Lagrangian को अधिकतम करने के लिए (अपने pick )।λx
उदाहरण के लिए, यदि आप बाधा उल्लंघन करते हैं, तो मैं अनंत को सेट करके आपको दंडित कर सकता हूं !g2λ2
कमजोर द्वैत
किसी भी कार्य के लिए निरीक्षण करें:f(x,y)
∀x^,y^minxf(x,y^)≤f(x^,y^)≤maxyf(x^,y)
चूँकि वह किसी भी और धारण करता है, यह भी मानता है कि:
x^y^
maxyminxf(x,y)≤minxmaxyf(x,y)
लैंगरियन सेटिंग में, इसका परिणाम यह है कि को कमजोर द्वंद्व के रूप में जाना जाता है।maxλminxL(x,λ)≤minxmaxλL(x,λ)
दोहरी समस्या आपको समाधान पर एक कम बाध्य प्रदान करती हैmaxλminxL(x,λ)
प्रबल द्वंद्व
कुछ विशेष परिस्थितियों में (उदाहरण के लिए उत्तल समस्या जहां स्लेटर की स्थिति है), आपके पास मजबूत द्वंद्व (यानी काठी बिंदु संपत्ति) है।
maxλminxL(x,λ)=minxmaxλL(x,λ)
यह सुंदर परिणाम तात्पर्य है कि आप समस्या के क्रम को उलट सकते हैं।
मैं पहली बार को अधिकतम करने के लिए पेनल्टी ।λ
फिर आप Lagrangian को कम करने के लिए ।xL
इस प्रक्रिया में सेट बाध्यताओं का उल्लंघन के लिए कीमतों में हैं, और कीमतों में इस तरह स्थापित कर रहे हैं कि आप बाधाओं का उल्लंघन कभी नहीं होगा।λ