क्षमा करें यदि यह प्रश्न थोड़ा बुनियादी आता है।
मैं आर में कई रैखिक प्रतिगमन मॉडल के लिए LASSO चर चयन का उपयोग करना चाह रहा हूं। मेरे पास 15 भविष्यवक्ता हैं, जिनमें से एक श्रेणीबद्ध है (क्या इससे कोई समस्या हो सकती है?)। अपना और सेट करने के बाद मैं निम्नलिखित कमांड का उपयोग करता हूं:
model = lars(x, y)
coef(model)
मेरी समस्या है जब मैं उपयोग करता हूं coef(model)
। यह 15 पंक्तियों के साथ एक मैट्रिक्स लौटाता है, जिसमें हर बार एक अतिरिक्त भविष्यवक्ता जोड़ा जाता है। हालांकि इसमें कोई सुझाव नहीं है कि किस मॉडल को चुनना है। क्या मुझे कुछ याद आया? क्या कोई तरीका है जिससे मैं सिर्फ एक " सर्वश्रेष्ठ " मॉडल वापस करने के लिए लार्स पैकेज प्राप्त कर सकता हूं ?
glmnet
इसके बजाय अन्य पोस्ट का उपयोग करने का सुझाव है लेकिन यह अधिक जटिल लगता है। एक ही और का उपयोग करते हुए एक प्रयास इस प्रकार है । क्या मुझे यहाँ कुछ याद आया है: "
cv = cv.glmnet(x, y)
model = glmnet(x, y, type.gaussian="covariance", lambda=cv$lambda.min)
predict(model, type="coefficients")
अंतिम आदेश मेरे चर की सूची देता है, बहुसंख्यक गुणांक के साथ हालांकि कुछ = 0 हैं। क्या यह LASSO द्वारा चुने गए " सर्वश्रेष्ठ " मॉडल का सही विकल्प है ? यदि मैं तब अपने सभी चर के साथ एक रेखीय मॉडल फिट करता हूं जिसमें गुणांक थे जो not=0
मुझे बहुत समान हैं, लेकिन थोड़ा अलग, गुणांक अनुमान है। क्या इस अंतर का कोई कारण है? क्या LASSO द्वारा चुने गए इन चरों के साथ रैखिक मॉडल को परिष्कृत करना और मेरे अंतिम मॉडल के रूप में लेना स्वीकार्य होगा? अन्यथा मैं महत्व के लिए कोई पी-वैल्यू नहीं देख सकता। क्या मुझे कुछ याद आया?
कर देता है
type.gaussian="covariance"
सुनिश्चित करें कि glmnet
कई रैखिक प्रतिगमन का उपयोग करता है?
क्या चरों का स्वचालित सामान्यीकरण गुणांक को बिल्कुल प्रभावित करता है? क्या LASSO प्रक्रिया में इंटरैक्शन शब्द शामिल करने का कोई तरीका है?
मैं इस प्रक्रिया को एक प्रदर्शन के रूप में अधिक उपयोग करना चाह रहा हूं कि कैसे LASSO का उपयोग किसी भी मॉडल के लिए किया जा सकता है जो वास्तव में किसी भी महत्वपूर्ण अनुमान / भविष्यवाणी के लिए उपयोग किया जाएगा यदि वह कुछ भी बदलता है।
इसे पढ़ने के लिए समय निकालने के लिए शुक्रिया। LASSO / lars / glmnet पर किसी भी सामान्य टिप्पणी की भी बहुत सराहना की जाएगी।