मैं 50,000 से अधिक वैरिएबल वाले मॉडल के लिए लासो या रिज रिग्रेशन का उपयोग करना चाहता हूं। मैं आर में सॉफ्टवेयर पैकेज का उपयोग करना चाहता हूं। मैं सिकुड़न पैरामीटर ( ) का अनुमान कैसे लगा सकता हूं ?
संपादन:
यहाँ बिंदु है जो मुझे मिला है:
set.seed (123)
Y <- runif (1000)
Xv <- sample(c(1,0), size= 1000*1000, replace = T)
X <- matrix(Xv, nrow = 1000, ncol = 1000)
mydf <- data.frame(Y, X)
require(MASS)
lm.ridge(Y ~ ., mydf)
plot(lm.ridge(Y ~ ., mydf,
lambda = seq(0,0.1,0.001)))
मेरा सवाल है: मुझे कैसे पता चलेगा कि मेरे मॉडल के लिए कौन सा सबसे अच्छा है?