अधिक तकनीकी जवाब है क्योंकि विवश अनुकूलन समस्या को लैग्रेग मल्टीप्लायरों के संदर्भ में लिखा जा सकता है। विशेष रूप से, लाग्रंगियन कंस्ट्रेन्ड अनुकूलन समस्या के साथ जुड़े द्वारा दिया जाता है
जहाँ एक गुणक को समस्या की बाधाओं को संतुष्ट करने के लिए चुना जाता है। इस अनुकूलन समस्या के लिए पहले के आदेश की स्थिति (जो आपके लिए उचित उचित उत्तल कार्यों के साथ काम कर रही है) पर्याप्त हैं, इसलिए इस प्रकार लैग्रैजियन को संबंध में विभेदित करके प्राप्त किया जा सकता है
L(β)=argminβ⎧⎩⎨∑i=1N(yi−∑j=1pxijβj)2⎫⎭⎬+μ{(1−α)∑j=1p|βj|+α∑j=1pβ2j}
μβऔर डेरिवेटिव को 0 के बराबर सेट करना (यह LASSO भाग के अपरिहार्य बिंदु होने के बाद से थोड़ा अधिक बारीक है, लेकिन पहले क्रम की स्थिति को अभी भी काम करने के लिए व्युत्पन्न को सामान्य बनाने के लिए
उत्तल विश्लेषण से तरीके हैं )। यह स्पष्ट है कि ये पहले आदेश की शर्तें आपके द्वारा लिखी गई असंबंधित समस्या के पहले क्रम की स्थितियों के समान हैं।
हालाँकि, मुझे लगता है कि यह देखना उपयोगी है कि सामान्य रूप से, इन अनुकूलन समस्याओं के साथ, समस्या के बारे में सोचने के लिए अक्सर या तो एक विवश अनुकूलन समस्या के लेंस के माध्यम से या एक असंबंधित समस्या के लेंस के माध्यम से यह संभव है। अधिक रूप से, मान लें कि हमारे पास निम्नलिखित फ़ॉर्म की एक असंबंधित अनुकूलन समस्या है:
हम हमेशा इस अनुकूलन को सीधे हल करने का प्रयास कर सकते हैं, लेकिन कभी-कभी, इस समस्या को तोड़ने में समझदारी हो सकती है। उप-घटक। विशेष रूप से, यह देखना मुश्किल नहीं है कि
तो की एक निश्चित मूल्य के लिए
maxxf(x)+λg(x)
maxxf(x)+λg(x)=maxt(maxxf(x) s.t g(x)=t)+λt
λ(और कार्यों को वास्तव में उनकी ऑप्टिमा प्राप्त करने के लिए अनुकूलित मानकर), हम इसके साथ एक मूल्य जोड़ सकते हैं जो बाहरी अनुकूलन समस्या को हल करता है। यह हमें असंबद्ध अनुकूलन समस्याओं से विवश समस्याओं के लिए मानचित्रण का एक प्रकार देता है। आपकी विशेष सेटिंग में, चूंकि लोचदार नेट प्रतिगमन के लिए सब कुछ अच्छी तरह से व्यवहार किया जाता है, यह मानचित्रण वास्तव में एक से एक होना चाहिए, इसलिए इन दो संदर्भों के बीच स्विच करने में सक्षम होना उपयोगी होगा, जिसके आधार पर किसी विशेष अनुप्रयोग के लिए अधिक उपयोगी है। सामान्य तौर पर, विवश और असंबंधित समस्याओं के बीच इस संबंध को कम व्यवहार किया जा सकता है, लेकिन यह अभी भी यह सोचने के लिए उपयोगी हो सकता है कि आप विवश और असंबंधित समस्या के बीच किस हद तक आगे बढ़ सकते हैं।
t∗
संपादित करें: जैसा कि अनुरोध किया गया है, मैं रिज प्रतिगमन के लिए एक अधिक ठोस विश्लेषण शामिल करूंगा, क्योंकि यह मुख्य विचारों को कैप्चर करता है जबकि LASSO दंड की गैर-भिन्नता से जुड़ी तकनीकी से निपटने के लिए। याद रखें, हम अनुकूलन समस्या को हल कर रहे हैं (मैट्रिक्स नोटेशन में):
argminβ{∑i=1Nyi−xTiβ}s.t.||β||2≤M
Let OLS समाधान हो (अर्थात जब कोई बाधा न हो)। फिर मैं उस मामले पर ध्यान केंद्रित करूंगा जहां(बशर्ते यह मौजूद है) अन्यथा, बाधा तब से निर्बाध है क्योंकि यह बांधती नहीं है। इस समस्या के लिए
तब विभेदित करते हुए , हम पहले क्रम की स्थिति प्राप्त करते हैं:
जो कि रैखिक समीकरणों की एक प्रणाली है और इसलिए इसे हल किया जा सकता है:
βOLSM<∣∣∣∣βOLS∣∣∣∣
L(β)=argminβ{∑i=1Nyi−xTiβ}−μ⋅||β||2≤M
0=−2(∑i=1Nyixi+(∑i=1NxixTi+μI)β)
β^=(∑i=1NxixTi+μI)−1(∑i=1Nyixi)
गुणक की कुछ पसंद के लिए । गुणक को तब कसौटी पर खरा उतारने के लिए चुना जाता है, अर्थात हमें जरूरत है
μ
⎛⎝(∑i=1NxixTi+μI)−1(∑i=1Nyixi)⎞⎠T⎛⎝(∑i=1NxixTi+μI)−1(∑i=1Nyixi)⎞⎠=M
जो LHS के बाद से मौजूद है, वह में मोनोटोनिक है । यह समीकरण मल्टीप्लायरों से अवरोधों के लिए एक स्पष्ट मानचित्रण देता है , with
जब RHS मौजूद होता है और
यह मैपिंग वास्तव में काफी सहज ज्ञान युक्त होती है।
लिफाफा प्रमेय हमें बताता है कि
μμ∈(0,∞)M∈(0,∣∣∣∣βOLS∣∣∣∣)limμ→0M(μ)=∣∣∣∣βOLS∣∣∣∣
limμ→∞M(μ)=0
μ(M)हम सीमांत की एक छोटी छूट से प्राप्त त्रुटि में मामूली कमी से मेल खाते हैं । यह बताता है कि क्यों जब से मेल खाता है। एक बार जब बाधा बाध्यकारी नहीं होती है, तो इसे और अधिक आराम करने में कोई मूल्य नहीं है, यही वजह है कि गुणक गायब हो जाता है।
Mμ→0M→||βOLS||