ध्यान रखें कि रिज प्रतिगमन गुणांक को शून्य नहीं कर सकता है; इस प्रकार, आप या तो मॉडल में सभी गुणांक सहित समाप्त करते हैं, या उनमें से कोई भी नहीं। इसके विपरीत, LASSO दोनों पैरामीटर संकोचन और चर चयन स्वचालित रूप से करता है। यदि आपके कुछ सहसंयोजक अत्यधिक सहसंबद्ध हैं, तो आप LASSO के बजाय लोचदार नेट [3] को देखना चाह सकते हैं।
मैं व्यक्तिगत रूप से गैर-नकारात्मक गारट (NNG) [1] का उपयोग करने की सलाह दूंगा क्योंकि यह अनुमान और चर चयन [2] के अनुरूप है। LASSO और रिज रिग्रेशन के विपरीत, NNG को एक प्रारंभिक अनुमान की आवश्यकता होती है जो तब मूल की ओर सिकुड़ जाता है। मूल पत्र में, ब्रीमन प्रारंभिक अनुमान के लिए कम से कम-वर्ग समाधान की सिफारिश करता है (आप रिज रिग्रेशन समाधान से खोज शुरू करना चाहते हैं और पेनल्टी पैरामीटर का चयन करने के लिए GCV जैसी किसी चीज़ का उपयोग कर सकते हैं)।
उपलब्ध सॉफ़्टवेयर के संदर्भ में, मैंने MATLAB में मूल NNG को लागू किया है (ब्रेमेन के मूल फोरट्रान कोड के आधार पर)। आप इसे यहाँ से डाउनलोड कर सकते हैं:
http://www.emakalic.org/blog/wp-content/uploads/2010/04/nngarotte.zip
BTW, यदि आप एक बायेसियन समाधान पसंद करते हैं, तो [4,5] देखें।
संदर्भ:
[१] ब्रेमेन, एल। बेहतर नॉनवेजेटिव गैरोटोट टेक्नोमेट्रिक्स का उपयोग करके बेहतर सबसेट रिग्रेशन, १ ९९ ५, ३,, ३ ]३-३ ,४
[२] युआन, एम। एंड लिन, वाई। नॉन-नेगेटिव ग्रासरूट असेसमेंट जर्नल ऑफ़ द रॉयल स्टैटिस्टिकल सोसाइटी (सीरीज़ बी), २०० Series, ६ ९, १४३-१६१
[३] Zou, H. & Hastie, T. नियमितीकरण और परिवर्तनशील चयन के माध्यम से रॉयल नेटिव सोसाइटी के लोचदार नेट जर्नल (सीरीज B), २००५, ६ 67, ३ ,०-३२०
[४] पार्क, टी। एंड कैसेला, जी। द बायेसियन लैस्सो जर्नल ऑफ द अमेरिकन स्टेटिस्टिकल एसोसिएशन, २०० 2008, १०३, ६6१-६६ 6६
[५] क्यूंग, एम।; गिल, जे।; घोष, एम। और कैसेला, जी। दंडित प्रतिगमन, मानक त्रुटियां, और बायेसियन लासोस बायेसियन विश्लेषण, 2010, 5, 369-412