LASSO दंड और पथ निर्भरता के मामले में सर्वश्रेष्ठ-सबसेट चयन से अलग है।
सर्वश्रेष्ठ-सबसेट चयन में, संभवतः सीवी का उपयोग यह पहचानने के लिए किया गया था कि 2 भविष्यवक्ताओं ने सबसे अच्छा प्रदर्शन दिया था। CV के दौरान, बिना परिमाण के पूर्ण-परिमाण प्रतिगमन गुणांक का उपयोग कितने चर को शामिल करने के मूल्यांकन के लिए किया गया होगा। एक बार जब 2 भविष्यवक्ताओं का उपयोग करने का निर्णय लिया गया था, तो अंतिम मॉडल के लिए 2 को खोजने के लिए, 2 भविष्यवक्ताओं के सभी संयोजनों की तुलना पूर्ण डेटा सेट पर की जाएगी। उन 2 अंतिम भविष्यवक्ताओं को उनके पूर्ण-परिमाण प्रतिगमन गुणांक दिए जाएंगे, बिना किसी दंड के, जैसे कि वे केवल सभी विकल्प थे।
आप LASSO के रूप में प्रतिगमन गुणांक के परिमाण के योग पर एक बड़े दंड के साथ शुरू कर सकते हैं, दंड धीरे-धीरे आराम से। परिणाम यह है कि चर एक समय में एक में प्रवेश करते हैं, विश्राम के दौरान प्रत्येक बिंदु पर एक निर्णय के साथ कि क्या यह पहले से ही मॉडल में चर के गुणांक को बढ़ाने के लिए, या किसी अन्य चर को जोड़ने के लिए अधिक मूल्यवान है। लेकिन जब आप 2-वैरिएबल मॉडल को प्राप्त करते हैं, तो कहते हैं कि LASSO द्वारा अनुमत प्रतिगमन गुणांक उन्हीं चरों की तुलना में परिमाण में कम होगा, जिसमें 2-चर और 3-वैरिएबल मॉडलों की तुलना करने के लिए उपयोग किए जाने वाले मानक गैर-दंडित प्रतिगमन होंगे। सबसे अच्छा सबसे अच्छा चयन।
यह सबसे अच्छा-सबसेट चयन की तुलना में LASSO में प्रवेश करने के लिए नए चर के लिए आसान बनाने के रूप में सोचा जा सकता है। आनुवंशिक रूप से, LASSO संभावित रूप से कम-से-वास्तविक प्रतिगमन गुणांक से अनिश्चितता के खिलाफ ट्रेड करता है कि कितने चरों को शामिल किया जाना चाहिए। यह एक LASSO मॉडल में और अधिक चर शामिल करने के लिए, और LASSO के लिए संभावित रूप से बदतर प्रदर्शन शामिल है यदि आप सुनिश्चित करें कि केवल 2 चर को शामिल करने की आवश्यकता है। लेकिन यदि आप पहले से ही जानते हैं कि कितने पूर्वानुमानकर्ता को सही मॉडल में शामिल किया जाना चाहिए, तो आप शायद LASSO का उपयोग नहीं करेंगे।
अभी तक कुछ भी कोलिनियरिटी पर निर्भर नहीं किया गया है, जो सर्वश्रेष्ठ-सबसेट बनाम फेसो में चर चयन में विभिन्न प्रकार की मनमानी करता है। इस उदाहरण में, सर्वश्रेष्ठ-सबसेट ने 2 भविष्यवक्ताओं के सभी संभावित संयोजनों की जांच की और उन संयोजनों में से सबसे अच्छा चुना। तो उस विशेष डेटा नमूना जीत के लिए सबसे अच्छा 2।
LASSO, एक समय में एक चर जोड़ने में अपनी पथ निर्भरता के साथ, इसका मतलब है कि एक चर का एक प्रारंभिक विकल्प प्रभावित हो सकता है जब अन्य चर इससे संबंधित होते हैं बाद में छूट प्रक्रिया में प्रवेश करते हैं। यह एक चर के लिए भी जल्दी से प्रवेश करने के लिए संभव है और फिर इसके LASSO गुणांक के रूप में अन्य सहसंबद्ध चर दर्ज करने के लिए ड्रॉप करने के लिए।
व्यवहार में, किसी भी विधि के साथ अंतिम मॉडल में सहसंबद्ध भविष्यवक्ताओं के बीच का चुनाव अत्यधिक नमूना निर्भर है, क्योंकि एक ही डेटा के बूटस्ट्रैप नमूनों पर इन मॉडल-निर्माण प्रक्रियाओं को दोहराकर जांच की जा सकती है। यदि बहुत सारे भविष्यवक्ता नहीं हैं, और आपका प्राथमिक हित नए डेटा सेट, रिज रिग्रेशन पर भविष्यवाणी में है, जो सभी भविष्यवक्ताओं को रखने के लिए जाता है, तो बेहतर विकल्प हो सकता है।