लैस्सो समस्या _ पास बंद फ़ॉर्म समाधान है: \ Beta_j ^ {\ text {lasso}} = = mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (! \ beta_j ^ \ पाठ {LS | }} | - \ अल्फा) ^ +
यदि X के पास असामान्य कॉलम हैं। यह इस थ्रेड में दिखाया गया था: बंद फॉर्म लैस्सो समाधान की व्युत्पत्ति ।
βlasso=argminβ∥y−Xβ∥22+α∥β∥1
βlassoj=sgn(βLSj)(|βLSj|−α)+
X
हालाँकि मैं यह नहीं समझता कि सामान्य रूप से कोई बंद फॉर्म समाधान क्यों नहीं है। उप-विभाग का उपयोग करके मैंने निम्नलिखित प्राप्त किया।
( X एक n×p मैट्रिक्स है)
f(β)=∥y−Xβ∥22+α∥β∥1
_ | _1 = \ sum_ {i = 1} ^ n (y_i-X_i \ beta) 2 + \ Alpha \ sum_ {j = 1} ^ p | \ beta_j | =∑i=1n(yi−Xiβ)2+α∑j=1p|βj|
(
X_i XXi की i- वीं पंक्ति है )
= \ sum_ {i = 1} ^ n y_i ^ 2 -2 \ sum_ {i = 1} ^ n y_i X_i \ beta + \ sum_ {i = 1 = ^ n \ _ बीटा ^ T X_i ^ T X_i \ beta + \ Alpha \ sum_ {j = 1} ^ p_ \ beta_j | \ Rightarrow \ frac {\ आंशिक f} {\ आंशिक \ Beta_j} = -2 \ sum_ {i = 1} ^ ny_i X_ {ij} + 2 \ sum_ {i = 1} ^ n X_ {j} ^ 2 \ beta_j + \ frac {\ आंशिक} {\ आंशिक \ Beta_j} (\ Alpha | \ beta_j |X⇒ ∂ च= ∑मैं = १ny2मैं- 2 ∑मैं = १nyमैंएक्समैंβ+ ∑मैं = १nβटीएक्सटीमैंएक्समैंβ+ α ∑ज = १पी| βj|
={ - 2 Σ n मैं = 1 y मैं एक्स मैं j + 2 Σ n मैं = 1 एक्स 2 मैं j बीटा j + अल्फा के लिए बीटा j > 0 - 2 Σ n मैं = 1 y मैं एक्स मैं j + 2 Σ n मैं⇒ ∂च∂βj= - 2 ∑मैं = १nyमैंएक्समैं जे+ 2 ∑मैं = १nएक्स2मैं जेβj+ ∂∂βj( α | β |j| )
= ⎧⎩⎨⎪⎪- 2 ∑nमैं = १yमैंएक्समैं जे+ 2 ∑nमैं = १एक्स2मैं जेβj+ Α के लिए βj> 0- 2 ∑nमैं = १yमैंएक्समैं जे+ 2 ∑nमैं = १एक्स2मैं जेβj- α के लिए βj< ०[ - २ ∑nमैं = १yमैंएक्समैं जे- α , - २ Σnमैं = १yमैंएक्समैं जे+ α ] के लिए βj= 0
with
∂च∂βj= 0 हमें मिलता है
βj=⎧⎩⎨⎪⎪( २) ( ∑nमैं = १yमैंएक्समैं जे) - α ) / 2 Σnमैं = १एक्स2मैं जे( २) ( ∑nमैं = १yमैंएक्समैं जे) + Α ) / 2 Σnमैं = १एक्स2मैं जे0के लिए Σnमैं = १yमैंएक्समैं जे> αके लिए Σnमैं = १yमैंएक्समैं जे< - α के लिए Σnमैं = १yमैंएक्समैं जे∈ [ - α , α ]
क्या कोई देखता है कि मैंने कहाँ गलत किया?
उत्तर:
यदि हम मेट्रिसेस के संदर्भ में समस्या लिखते हैं तो हम बहुत आसानी से देख सकते हैं कि एक बंद फॉर्म समाधान केवल एक्स ^ TX = I के साथ क्यों असामान्य मामले में मौजूद है एक्सटीएक्स= मैं:
च(β) = ∥ य- एक्सβ∥22+ अल्फा ∥ बीटा∥1
= यटीy- 2 βटीएक्सटीy+ βटीएक्सटीएक्सβ+ अल्फा ∥ बीटा∥1
_ | _1 \ Rightarrow \ nabla f (\ beta) = - 2X ^ Ty + 2X ^ TX \ Beta + \ nabla (\ अल्फा | \ beta \ _ | _1)⇒ ∇ च( β) = - 2 एक्सटीy+ 2 एक्सटीएक्सβ+ ∇ ( अल्फा | बीटा∥1)
(मैंने यहां एक बार में कई कदम उठाए हैं। हालांकि। इस बिंदु तक यह पूरी तरह से कम से कम वर्गों के समाधान की व्युत्पत्ति के अनुरूप है। इसलिए आपको वहाँ लापता चरणों को खोजने में सक्षम होना चाहिए।)
⇒∂च∂βj= - 2 एक्सटीjy+ 2 ( एक्स)टीएक्स)jβ+ ∂∂βj( α | β |j| )
साथ ∂च∂βj= 0 पर हम पाते हैं
2 ( एक्स)टीएक्स)jβ= 2 एक्सटीjy- ∂∂βj( α | β |j| )
⇔ 2 ( एक्सटीएक्स)जे जेβj= 2 एक्सटीjy- ∂∂βj( α | β |j| )-2 ∑i = 1 , i ≠ jपी( एक्स)टीएक्स)जे आईβमैं
अब हम देख सकते हैं कि one लिए हमारा समाधान अन्य सभी पर निर्भर है, इसलिए यह स्पष्ट नहीं है कि यहां से कैसे आगे बढ़ना है। यदि orthonormal है तो हमारे पास इसलिए निश्चित रूप से इस मामले में एक बंद रूप समाधान मौजूद है।βjβमैं ≠ जेएक्स2 ( एक्स)टीएक्स)jβ= 2 ( आई)jβ= 2 βj
उनके उत्तर के लिए गुमुंदुर सेमिनार के लिए धन्यवाद, जिस पर मैंने यहां विस्तार किया। मुझे आशा है कि इस बार यह सही है :-)