मैंने पढ़ा है कि समूह lasso का उपयोग चर चयन और चर के समूह में प्रसार के लिए किया जाता है। मैं इस दावे के पीछे के अंतर्ज्ञान को जानना चाहता हूं।
- समूह लासो को लासो को क्यों पसंद किया जाता है?
- क्यों समूह lasso समाधान पथ टुकड़ा नहीं रैखिक है?
मैंने पढ़ा है कि समूह lasso का उपयोग चर चयन और चर के समूह में प्रसार के लिए किया जाता है। मैं इस दावे के पीछे के अंतर्ज्ञान को जानना चाहता हूं।
जवाबों:
सहज रूप से बोलते हुए, समूह lasso को lasso के लिए पसंद किया जा सकता है क्योंकि यह हमारे लिए सही गुणांक लिए हमारे अनुमान में अतिरिक्त जानकारी (एक निश्चित प्रकार) को शामिल करने का साधन प्रदान करता है । एक चरम परिदृश्य के रूप में, निम्नलिखित पर विचार करना:
साथ , डाल के समर्थन के रूप में । "Oracle" अनुमानक जो दो समूहों के साथ समूह lasso है - एक सच्चा समर्थन और एक पूरक। चलो का सबसे छोटा मान हो बनाता है कि । समूह लैसो दंड की प्रकृति के कारण, हम जानते हैं कि कम से से चलता रहता है को (कुछ छोटे के लिएλमीटरएकएक्सλ बीटा =0λλमीटरएकएक्स
व्यवहार में, हम इस समूह को अच्छी तरह से नहीं चुनते हैं। हालांकि, समूह, ऊपर के चरम परिदृश्य की तुलना में अधिक महीन होने के बावजूद, अभी भी हमारी मदद करेंगे: विकल्प अभी भी सच्चे कोवरिएट्स के समूह और असत्य कोवरियों के समूह के बीच बनाया जाएगा। हम अभी भी ताकत उधार ले रहे हैं।
यह यहां औपचारिक रूप दिया गया है । वे कुछ शर्तों के तहत दिखाते हैं, कि समूह लास्सो की भविष्यवाणी की त्रुटि के बारे में एक ऊपरी सीमा सादा लसो की भविष्यवाणी त्रुटि पर कम बाध्य से कम है। यही है, उन्होंने साबित कर दिया कि समूहीकरण हमारे अनुमान को बेहतर बनाता है।
आपके दूसरे प्रश्न के लिए: (सादा) लास्सो का दंड टुकड़े-टुकड़े में रैखिक है, और यह टुकड़े-टुकड़े रैखिक समाधान पथ को जन्म देता है। सहज रूप से, समूह लास्सो मामले में, दंड अब टुकड़े टुकड़े में रैखिक नहीं है, इसलिए हमारे पास अब यह संपत्ति नहीं है। समाधान रास्तों के टुकड़े-टुकड़े रैखिकता पर एक महान संदर्भ यहाँ है । उनका प्रस्ताव देखें 1. और । वे दिखाते हैं कि समूह लैस्सो का समाधान पथ रैखिक है यदि और केवल अगर टुकड़ावार स्थिर है। बेशक, यह नहीं है क्योंकि हमारे दंड में वैश्विक वक्रता है।
बेन का जवाब सबसे सामान्य परिणाम है। लेकिन ओपी के लिए सहज जवाब, श्रेणीबद्ध भविष्यवक्ताओं के मामले से प्रेरित है, जो आमतौर पर कई डमी चर के रूप में एन्कोडेड होते हैं: प्रत्येक श्रेणी के लिए एक। इन डमी चर (एक श्रेणीबद्ध भविष्यवक्ता का प्रतिनिधित्व) को अलग-अलग करने के बजाय विचार करने के लिए कई विश्लेषणों में यह समझ में आता है।
यदि आपके पास एक श्रेणीगत चर है, तो कहें, पाँच स्तर, एक सीधी लस्सो दो में और तीन बाहर छोड़ सकती है। आप इसे राजसी तरीके से कैसे संभालेंगे? वोट देने का फैसला? वस्तुतः अधिक सार्थक श्रेणी के बजाय डमी चर का उपयोग करें? आपकी डमी एन्कोडिंग आपकी पसंद को कैसे प्रभावित करती है?
जैसा कि वे लॉजिस्टिक रिग्रेशन के लिए द ग्रुप लैस्सो की शुरूआत में कहते हैं , इसमें उल्लेख है:
रेखीय प्रतिगमन में विशेष मामले के लिए पहले से ही जब न केवल निरंतर, बल्कि श्रेणीबद्ध भविष्यवक्ता (कारक) भी मौजूद हैं, तो लास्सो समाधान संतोषजनक नहीं है क्योंकि यह केवल पूरे कारकों के बजाय केवल ईक-इल डमी चर का चयन करता है। इसके अलावा, लासो समाधान इस बात पर निर्भर करता है कि डमी चर कैसे एन्कोड किए गए हैं। एक श्रेणीबद्ध भविष्यवक्ता के लिए विभिन्न विरोधाभासों को चुनना सामान्य रूप से विभिन्न समाधानों का उत्पादन करेगा।
जैसा कि बेन बताते हैं, भविष्यवक्ताओं के बीच अधिक सूक्ष्म संबंध भी हैं जो यह संकेत दे सकते हैं कि उन्हें एक साथ या बाहर होना चाहिए। लेकिन श्रेणीबद्ध परिवर्तनशील समूह lasso के लिए पोस्टर चाइल्ड हैं।