पृष्ठ संख्या 223 में सांख्यिकीय शिक्षा के लिए एक परिचय में , लेखक रिज रिग्रेशन और लासो के बीच के अंतर को संक्षेप में प्रस्तुत करते हैं। वे एक उदाहरण (चित्र 6.9) प्रदान करते हैं, जब "लास्सो पूर्वाग्रह, प्रसरण और MSE के संदर्भ में रिज प्रतिगमन को बेहतर बनाता है"।
मैं समझता हूं कि लसो वांछनीय क्यों हो सकता है: यह विरल समाधानों में परिणत होता है क्योंकि यह कई गुणांक को 0 तक सिकोड़ देता है, जिसके परिणामस्वरूप सरल और व्याख्यात्मक मॉडल होते हैं। लेकिन मुझे यह समझ में नहीं आता है कि यह कैसे रिज को बेहतर बना सकता है, जब केवल भविष्यवाणियां ब्याज की होती हैं (यानी उदाहरण में इसे कम एमएसई कैसे मिल रहा है?)।
रिज के साथ, अगर कई भविष्यवक्ताओं की प्रतिक्रिया पर लगभग कोई प्रभाव नहीं पड़ता है (कुछ भविष्यवक्ताओं के पास एक बड़ा प्रभाव होता है), तो क्या उनके गुणांक केवल एक छोटी संख्या में शून्य के बहुत करीब सिकुड़ेंगे नहीं ... जिसके परिणामस्वरूप कुछ हद तक लस्सो के समान है ? तो अंतिम मॉडल में लसो से भी बदतर प्रदर्शन क्यों होगा?