स्टेप वाइज रिग्रेशन का प्राथमिक लाभ यह है कि यह कम्प्यूटेशनल रूप से कुशल है। हालांकि, इसका प्रदर्शन आमतौर पर वैकल्पिक तरीकों से भी बदतर है। समस्या यह है कि यह बहुत लालची है। अगले रजिस्ट्रार पर एक कठिन चयन करके और वजन को 'फ्रीजिंग' करके, यह उन विकल्पों को बनाता है जो प्रत्येक चरण में स्थानीय रूप से इष्टतम होते हैं, लेकिन सामान्य रूप से सबॉप्टीमल। और, यह अपने पिछले विकल्पों को संशोधित करने के लिए वापस नहीं जा सकता है।
जहां तक मुझे जानकारी है, स्टेप रिग्रेशन पर रिग्रेशन (LASSO) की तुलना में बहुत हो गया है, जिससे बेहतर समाधान निकलता है।एल1
तिब्शीरानी (1996) । कमंद के माध्यम से प्रतिगमन संकोचन और चयन
LASSO वजन के मानदंड को दंडित करता है , जो समाधान में स्पार्सिटी को प्रेरित करता है (कई वजन शून्य करने के लिए मजबूर हैं)। यह चर चयन करता है ('प्रासंगिक' चर को नॉनजरो वेट करने की अनुमति है)। स्पैर्सिटी की डिग्री को तपस्या शब्द द्वारा नियंत्रित किया जाता है, और इसे चुनने के लिए कुछ प्रक्रिया का उपयोग किया जाना चाहिए (क्रॉस-सत्यापन एक सामान्य विकल्प है)। LASSO स्टेप वाइज रिग्रेशन की तुलना में अधिक कम्प्यूटेशनल रूप से गहन है, लेकिन कई कुशल एल्गोरिदम मौजूद हैं। कुछ उदाहरण हैं कम से कम कोण प्रतिगमन ( LARS ), और समन्वित वंश पर आधारित एक दृष्टिकोण ।एल1
आपने (2) में जो सुझाव दिया था, उसके समान दृष्टिकोण को ऑर्थोगोनल मिलान खोज कहा जाता है। यह मिलान खोज का एक सामान्यीकरण है, जो सिग्नल प्रोसेसिंग साहित्य में स्टेप वाइज रिग्रेशन का नाम है।
पति एट अल। (1993) । ऑर्थोगोनल मेलिंग पीछा: तरंगिका अपघटन के लिए अनुप्रयोगों के साथ पुनरावर्ती कार्य सन्निकटन
प्रत्येक पुनरावृत्ति पर, अगला सबसे अच्छा regressor सक्रिय सेट में जोड़ा जाता है। फिर, सक्रिय सेट में सभी रजिस्टरों के लिए वजन फिर से प्रतिष्ठित किया जाता है। पुनरावर्ती कदम के कारण, यह दृष्टिकोण नियमित रूप से मेल खाने वाले पीछा / स्टेपवाइज रिग्रेशन की तुलना में कम लालची (और बेहतर प्रदर्शन) है। लेकिन, यह अभी भी एक लालची खोज विधर्मी को रोजगार देता है।
इन सभी दृष्टिकोणों (स्टेप वाइज रिग्रेशन, LASSO, और ऑर्थोगोनल मैचिंग पीछा) को निम्न समस्या के अनुमान के रूप में सोचा जा सकता है:
मिनटw∥ य- एक्सw∥22सेंट ∥ डब्ल्यू∥0≤ सी
एक प्रतिगमन संदर्भ में, कॉलम स्वतंत्र चर और पर निर्भर चर के अनुरूप हैं । सिग्नल प्रोसेसिंग में, फ़ंक्शन के आधार कार्य के अनुरूप है और लगभग अनुमानित है। लक्ष्य वजन का एक विरल सेट मिल रहा है है कि सबसे अच्छा (कम से कम वर्गों) के सन्निकटन दे । आदर्श बस में गैर शून्य प्रविष्टियों की संख्या की गणना । दुर्भाग्य से, यह समस्या एनपी-हार्ड है, इसलिए सन्निकटन एल्गोरिदम को व्यवहार में उपयोग किया जाना चाहिए। लालची खोज रणनीति का उपयोग करके समस्या को हल करने के लिए स्टेपवाइज रिग्रेशन और ऑर्थोगोनल मैचिंग पीछा प्रयास। LASSO की छूट का उपयोग करके समस्या का सुधार करता हैएक्सyएक्सywyएल0wएल0 मान से मानदंड। यहाँ, अनुकूलन समस्या उत्तल हो जाती है (और इस प्रकार ट्रैक्टेबल)। और, हालांकि समस्या अब समान नहीं है, समाधान समान है। यदि मुझे सही ढंग से याद है, तो LASSO और ऑर्थोगोनल मैचिंग पीछा दोनों कुछ शर्तों के तहत सटीक समाधान को पुनर्प्राप्त करने के लिए साबित हुए हैं।एल1