मेरी मशीन सीखने वर्ग में, हम, कैसे LASSO प्रतिगमन सुविधा चयन प्रदर्शन पर बहुत अच्छा है के बारे में सीखा है, क्योंकि यह का उपयोग करता है है नियमितीकरण।
मेरा प्रश्न: क्या लोग आमतौर पर LASSO मॉडल का उपयोग सिर्फ फीचर चयन के लिए करते हैं (और फिर उन विशेषताओं को एक अलग मशीन लर्निंग मॉडल में डंप करने के लिए आगे बढ़ते हैं), या क्या वे आमतौर पर LASSO का उपयोग फीचर चयन और वास्तविक प्रतिगमन दोनों को करने के लिए करते हैं?
उदाहरण के लिए, मान लें कि आप रिज रिग्रेशन करना चाहते हैं, लेकिन आप मानते हैं कि आपकी कई सुविधाएँ बहुत अच्छी नहीं हैं। क्या LASSO को चलाना बुद्धिमानी होगी, केवल उन विशेषताओं को लेना जो एल्गोरिथम द्वारा निकट-शून्य नहीं की जाती हैं, और फिर अपने डेटा को रिज रिग्रेशन मॉडल में डंप करने में ही उपयोग करते हैं? इस तरह, आपको सुविधा चयन करने के लिए नियमितीकरण का लाभ मिलता है , लेकिन ओवरफिटिंग को कम करने के लिए एल 2 नियमितीकरण का लाभ भी मिलता है। (मुझे पता है कि यह मूल रूप से इलास्टिक नेट रिग्रेशन की मात्रा है, लेकिन ऐसा लगता है कि आपको अंतिम प्रतिगमन उद्देश्य फ़ंक्शन में l 1 और l 2 दोनों शब्दों की आवश्यकता नहीं है ।)
प्रतिगमन के अलावा, क्या यह वर्गीकरण कार्य (SVM, तंत्रिका नेटवर्क, यादृच्छिक वन, आदि) का उपयोग करते समय एक बुद्धिमान रणनीति है?