जवाबों:
में सांख्यिकीय लर्निंग के तत्वों किताब, Hastie एट अल। इन संकोचन तकनीकों की एक बहुत ही व्यावहारिक और पूरी तरह से तुलना प्रदान करते हैं। पुस्तक ऑनलाइन ( पीडीएफ) उपलब्ध है ) । तुलना अनुभाग 3.4.3, पृष्ठ 69 में की गई है।
लासो और रिज के बीच मुख्य अंतर जुर्माना शब्द है जो वे उपयोग करते हैं। रिज दंड शब्द का उपयोग करता है जो गुणांक वेक्टर के आकार को सीमित करता है। लास्सो एल 1 दंड का उपयोग करता है जो गुणांक के बीच स्पार्सिटी लगाता है और इस प्रकार, फिट किए गए मॉडल को अधिक व्याख्यात्मक बनाता है। इलास्टिकनेट को इन दोनों तकनीकों के बीच एक समझौते के रूप में पेश किया गया है, और इसमें एक दंड है जो एल 1 और एल 2 मानदंडों का मिश्रण है ।
संक्षेप में, यहाँ लास्सो, रिज और इलास्टिक-नेट के बीच कुछ मुख्य अंतर हैं:
मैंने आपको सांख्यिकीय शिक्षण पुस्तक (तिब्शीरानी एट अल।, 2013) के परिचय पर एक नज़र डालने की अत्यधिक सलाह दी ।
इसका कारण यह है कि सांख्यिकीय शिक्षण पुस्तक के तत्व गणितीय विज्ञान में उन्नत प्रशिक्षण वाले व्यक्तियों के लिए अभिप्रेत है। ISL के अग्रदूत में, लेखक लिखते हैं:
सांख्यिकीय सीखने का एक परिचय इन विषयों की व्यापक और कम तकनीकी उपचार की आवश्यकता से उत्पन्न हुआ। [...]
सांख्यिकीय अधिगम का परिचय आँकड़ों या संबंधित मात्रात्मक क्षेत्रों में या अन्य विषयों में उन व्यक्तियों के लिए जो उनके डेटा का विश्लेषण करने के लिए सांख्यिकीय शिक्षण साधनों का उपयोग करना चाहते हैं, के लिए उन्नत स्नातक या स्नातकोत्तर के छात्रों के लिए उपयुक्त है।
उपरोक्त उत्तर बहुत स्पष्ट और जानकारीपूर्ण हैं। मैं सांख्यिकीय दृष्टिकोण से एक मामूली बात जोड़ना चाहूंगा। उदाहरण के तौर पर रिज रिग्रेशन को लें। यह कई सहसंबद्ध विशेषताओं के होने पर बहुसंस्कृति समस्याओं को हल करने के लिए कम से कम वर्ग प्रतिगमन का एक विस्तार है। यदि रैखिक प्रतिगमन है
Y=Xb+e
कई रैखिक प्रतिगमन के लिए सामान्य समीकरण समाधान
b=inv(X.T*X)*X.T*Y
रिज प्रतिगमन के लिए सामान्य समीकरण समाधान है
b=inv(X.T*X+k*I)*X.T*Y.
यह b के लिए एक पक्षपाती अनुमानक है और हम हमेशा एक दंड शब्द k पा सकते हैं जो कि RSS प्रतिगमन की औसत वर्ग त्रुटि को OLS प्रतिगमन की तुलना में छोटा कर देगा।
LASSO और इलास्टिक-नेट के लिए, हम इस तरह के एक विश्लेषणात्मक समाधान नहीं खोज सके।