मैं रिज, लैस्सो और इलास्टिक नेट के साथ चुने गए मॉडलों की तुलना करना चाहूंगा। अंजीर। नीचे सभी 3 विधियों का उपयोग करते हुए गुणांक पथ दिखाता है: रिज (अंजीर ए, अल्फा = 0), लैस्स (अंजीर बी; अल्फा = 1) और लोचदार जाल (छवि सी; अल्फा = 0.5)। इष्टतम समाधान लैम्ब्डा के चयनित मूल्य पर निर्भर करता है, जिसे क्रॉस सत्यापन के आधार पर चुना जाता है।
जब मैं इन भूखंडों को देख रहा हूं, तो मैं उम्मीद करूंगा कि लोचदार जाल (चित्र C) एक समूहीकरण प्रभाव प्रदर्शित करेगा। हालांकि यह प्रस्तुत मामले में स्पष्ट नहीं है। लसो और लोचदार जाल के लिए गुणांक पथ बहुत समान हैं। इसका क्या कारण रह सकता है ? क्या यह सिर्फ एक कोडिंग गलती है? मैंने R में निम्न कोड का उपयोग किया है:
library(glmnet)
X<- as.matrix(mydata[,2:22])
Y<- mydata[,23]
par(mfrow=c(1,3))
ans1<-cv.glmnet(X, Y, alpha=0) # ridge
plot(ans1$glmnet.fit, "lambda", label=FALSE)
text (6, 0.4, "A", cex=1.8, font=1)
ans2<-cv.glmnet(X, Y, alpha=1) # lasso
plot(ans2$glmnet.fit, "lambda", label=FALSE)
text (-0.8, 0.48, "B", cex=1.8, font=1)
ans3<-cv.glmnet(X, Y, alpha=0.5) # elastic net
plot(ans3$glmnet.fit, "lambda", label=FALSE)
text (0, 0.62, "C", cex=1.8, font=1)
लोचदार नेट गुणांक पथों को प्लॉट करने के लिए उपयोग किया जाने वाला कोड रिज और लास्सो के लिए बिल्कुल समान है। केवल अंतर अल्फा के मूल्य में है। लोचदार नेट प्रतिगमन के लिए अल्फा पैरामीटर इसी लैम्ब्डा मूल्यों के लिए न्यूनतम एमएसई (मतलब चुकता त्रुटि) के आधार पर चुना गया था।
आपके सहयोग के लिए धन्यवाद !