अधिक तकनीकी जवाब है क्योंकि विवश अनुकूलन समस्या को लैग्रेग मल्टीप्लायरों के संदर्भ में लिखा जा सकता है। विशेष रूप से, लाग्रंगियन कंस्ट्रेन्ड अनुकूलन समस्या के साथ जुड़े द्वारा दिया जाता है
जहाँ एक गुणक को समस्या की बाधाओं को संतुष्ट करने के लिए चुना जाता है। इस अनुकूलन समस्या के लिए पहले के आदेश की स्थिति (जो आपके लिए उचित उचित उत्तल कार्यों के साथ काम कर रही है) पर्याप्त हैं, इसलिए इस प्रकार लैग्रैजियन को संबंध में विभेदित करके प्राप्त किया जा सकता हैL(β)=argminβ⎧⎩⎨∑i=1N(yi−∑j=1pxijβj)2⎫⎭⎬+μ{(1−α)∑j=1p|βj|+α∑j=1pβ2j}
μβऔर डेरिवेटिव को 0 के बराबर सेट करना (यह LASSO भाग के अपरिहार्य बिंदु होने के बाद से थोड़ा अधिक बारीक है, लेकिन पहले क्रम की स्थिति को अभी भी काम करने के लिए व्युत्पन्न को सामान्य बनाने के लिए उत्तल विश्लेषण से तरीके हैं )। यह स्पष्ट है कि ये पहले आदेश की शर्तें आपके द्वारा लिखी गई असंबंधित समस्या के पहले क्रम की स्थितियों के समान हैं।
हालाँकि, मुझे लगता है कि यह देखना उपयोगी है कि सामान्य रूप से, इन अनुकूलन समस्याओं के साथ, समस्या के बारे में सोचने के लिए अक्सर या तो एक विवश अनुकूलन समस्या के लेंस के माध्यम से या एक असंबंधित समस्या के लेंस के माध्यम से यह संभव है। अधिक रूप से, मान लें कि हमारे पास निम्नलिखित फ़ॉर्म की एक असंबंधित अनुकूलन समस्या है:
हम हमेशा इस अनुकूलन को सीधे हल करने का प्रयास कर सकते हैं, लेकिन कभी-कभी, इस समस्या को तोड़ने में समझदारी हो सकती है। उप-घटक। विशेष रूप से, यह देखना मुश्किल नहीं है कि
तो की एक निश्चित मूल्य के लिएmaxxf(x)+λg(x)
maxxf(x)+λg(x)=maxt(maxxf(x) s.t g(x)=t)+λt
λ(और कार्यों को वास्तव में उनकी ऑप्टिमा प्राप्त करने के लिए अनुकूलित मानकर), हम इसके साथ एक मूल्य जोड़ सकते हैं जो बाहरी अनुकूलन समस्या को हल करता है। यह हमें असंबद्ध अनुकूलन समस्याओं से विवश समस्याओं के लिए मानचित्रण का एक प्रकार देता है। आपकी विशेष सेटिंग में, चूंकि लोचदार नेट प्रतिगमन के लिए सब कुछ अच्छी तरह से व्यवहार किया जाता है, यह मानचित्रण वास्तव में एक से एक होना चाहिए, इसलिए इन दो संदर्भों के बीच स्विच करने में सक्षम होना उपयोगी होगा, जिसके आधार पर किसी विशेष अनुप्रयोग के लिए अधिक उपयोगी है। सामान्य तौर पर, विवश और असंबंधित समस्याओं के बीच इस संबंध को कम व्यवहार किया जा सकता है, लेकिन यह अभी भी यह सोचने के लिए उपयोगी हो सकता है कि आप विवश और असंबंधित समस्या के बीच किस हद तक आगे बढ़ सकते हैं।t∗
संपादित करें: जैसा कि अनुरोध किया गया है, मैं रिज प्रतिगमन के लिए एक अधिक ठोस विश्लेषण शामिल करूंगा, क्योंकि यह मुख्य विचारों को कैप्चर करता है जबकि LASSO दंड की गैर-भिन्नता से जुड़ी तकनीकी से निपटने के लिए। याद रखें, हम अनुकूलन समस्या को हल कर रहे हैं (मैट्रिक्स नोटेशन में):
argminβ{∑i=1Nyi−xTiβ}s.t.||β||2≤M
Let OLS समाधान हो (अर्थात जब कोई बाधा न हो)। फिर मैं उस मामले पर ध्यान केंद्रित करूंगा जहां(बशर्ते यह मौजूद है) अन्यथा, बाधा तब से निर्बाध है क्योंकि यह बांधती नहीं है। इस समस्या के लिए
तब विभेदित करते हुए , हम पहले क्रम की स्थिति प्राप्त करते हैं:
जो कि रैखिक समीकरणों की एक प्रणाली है और इसलिए इसे हल किया जा सकता है:
βOLSM<∣∣∣∣βOLS∣∣∣∣L(β)=argminβ{∑i=1Nyi−xTiβ}−μ⋅||β||2≤M
0=−2(∑i=1Nyixi+(∑i=1NxixTi+μI)β)
β^=(∑i=1NxixTi+μI)−1(∑i=1Nyixi)
गुणक की कुछ पसंद के लिए । गुणक को तब कसौटी पर खरा उतारने के लिए चुना जाता है, अर्थात हमें जरूरत हैμ
⎛⎝(∑i=1NxixTi+μI)−1(∑i=1Nyixi)⎞⎠T⎛⎝(∑i=1NxixTi+μI)−1(∑i=1Nyixi)⎞⎠=M
जो LHS के बाद से मौजूद है, वह में मोनोटोनिक है । यह समीकरण मल्टीप्लायरों से अवरोधों के लिए एक स्पष्ट मानचित्रण देता है , with
जब RHS मौजूद होता है और
यह मैपिंग वास्तव में काफी सहज ज्ञान युक्त होती है। लिफाफा प्रमेय हमें बताता है किμμ∈(0,∞)M∈(0,∣∣∣∣βOLS∣∣∣∣)limμ→0M(μ)=∣∣∣∣βOLS∣∣∣∣
limμ→∞M(μ)=0
μ(M)हम सीमांत की एक छोटी छूट से प्राप्त त्रुटि में मामूली कमी से मेल खाते हैं । यह बताता है कि क्यों जब से मेल खाता है। एक बार जब बाधा बाध्यकारी नहीं होती है, तो इसे और अधिक आराम करने में कोई मूल्य नहीं है, यही वजह है कि गुणक गायब हो जाता है।Mμ→0M→||βOLS||