क्षमा करें यदि यह प्रश्न थोड़ा बुनियादी आता है।
मैं आर में कई रैखिक प्रतिगमन मॉडल के लिए LASSO चर चयन का उपयोग करना चाह रहा हूं। मेरे पास 15 भविष्यवक्ता हैं, जिनमें से एक श्रेणीबद्ध है (क्या इससे कोई समस्या हो सकती है?)। अपना और सेट करने के बाद मैं निम्नलिखित कमांड का उपयोग करता हूं:
model = lars(x, y)
coef(model)
मेरी समस्या है जब मैं उपयोग करता हूं coef(model)। यह 15 पंक्तियों के साथ एक मैट्रिक्स लौटाता है, जिसमें हर बार एक अतिरिक्त भविष्यवक्ता जोड़ा जाता है। हालांकि इसमें कोई सुझाव नहीं है कि किस मॉडल को चुनना है। क्या मुझे कुछ याद आया? क्या कोई तरीका है जिससे मैं सिर्फ एक " सर्वश्रेष्ठ " मॉडल वापस करने के लिए लार्स पैकेज प्राप्त कर सकता हूं ?
glmnetइसके बजाय अन्य पोस्ट का उपयोग करने का सुझाव है लेकिन यह अधिक जटिल लगता है। एक ही और का उपयोग करते हुए एक प्रयास इस प्रकार है । क्या मुझे यहाँ कुछ याद आया है: "
cv = cv.glmnet(x, y)
model = glmnet(x, y, type.gaussian="covariance", lambda=cv$lambda.min)
predict(model, type="coefficients")
अंतिम आदेश मेरे चर की सूची देता है, बहुसंख्यक गुणांक के साथ हालांकि कुछ = 0 हैं। क्या यह LASSO द्वारा चुने गए " सर्वश्रेष्ठ " मॉडल का सही विकल्प है ? यदि मैं तब अपने सभी चर के साथ एक रेखीय मॉडल फिट करता हूं जिसमें गुणांक थे जो not=0मुझे बहुत समान हैं, लेकिन थोड़ा अलग, गुणांक अनुमान है। क्या इस अंतर का कोई कारण है? क्या LASSO द्वारा चुने गए इन चरों के साथ रैखिक मॉडल को परिष्कृत करना और मेरे अंतिम मॉडल के रूप में लेना स्वीकार्य होगा? अन्यथा मैं महत्व के लिए कोई पी-वैल्यू नहीं देख सकता। क्या मुझे कुछ याद आया?
कर देता है
type.gaussian="covariance"
सुनिश्चित करें कि glmnetकई रैखिक प्रतिगमन का उपयोग करता है?
क्या चरों का स्वचालित सामान्यीकरण गुणांक को बिल्कुल प्रभावित करता है? क्या LASSO प्रक्रिया में इंटरैक्शन शब्द शामिल करने का कोई तरीका है?
मैं इस प्रक्रिया को एक प्रदर्शन के रूप में अधिक उपयोग करना चाह रहा हूं कि कैसे LASSO का उपयोग किसी भी मॉडल के लिए किया जा सकता है जो वास्तव में किसी भी महत्वपूर्ण अनुमान / भविष्यवाणी के लिए उपयोग किया जाएगा यदि वह कुछ भी बदलता है।
इसे पढ़ने के लिए समय निकालने के लिए शुक्रिया। LASSO / lars / glmnet पर किसी भी सामान्य टिप्पणी की भी बहुत सराहना की जाएगी।