मैं LASSO रिग्रेशन के glmnet
साथ उपयोग करने से वंचित होना शुरू कर रहा हूं, जहां मेरी रुचि के परिणाम द्विगुणित हैं । मैंने नीचे एक छोटा सा नकली डाटा फ्रेम बनाया है:
age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7)
gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0)
bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88)
m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1)
p_edu <- c(0, 2, 2, 2, 2, 3, 2, 0, 0)
f_color <- c("blue", "blue", "yellow", "red", "red", "yellow", "yellow",
"red", "yellow")
asthma <- c(1, 1, 0, 1, 0, 0, 0, 1, 1)
# df is a data frame for further use!
df <- data.frame(age, gender, bmi_p, m_edu, p_edu, f_color, asthma)
उपरोक्त डेटासेट में कॉलम (चर) निम्नानुसार हैं:
age
(वर्षों में बच्चे की उम्र) - निरंतरgender
- बाइनरी (1 = पुरुष; 0 = महिला)bmi_p
(बीएमआई पर्सेंटाइल) - निरंतरm_edu
)p_edu
(पिता उच्चतम शिक्षा स्तर) - क्रमिक (m_edu के समान)f_color
(पसंदीदा प्राथमिक रंग) - नाममात्र ("नीला", "लाल", या "पीला")asthma
(बाल अस्थमा की स्थिति) - बाइनरी (1 = अस्थमा; 0 = कोई अस्थमा)
इस उदाहरण के लक्ष्य को 6 संभावित भविष्यवक्ता चर (की सूची में से एक मॉडल की भविष्यवाणी बच्चे अस्थमा स्थिति बनाने के लिए LASSO का उपयोग करना है age
, gender
, bmi_p
, m_edu
, p_edu
, और f_color
)। जाहिर है कि नमूना आकार यहां एक मुद्दा है, लेकिन मैं इस बात की अधिक जानकारी हासिल करने की उम्मीद कर रहा हूं कि glmnet
फ्रेम के भीतर विभिन्न प्रकार के चर (यानी, निरंतर, क्रमिक, नाममात्र और बाइनरी) को कैसे संभालना है जब परिणाम द्विआधारी होता है (1 = अस्थमा ; 0 = अस्थमा नहीं)।
इस प्रकार, क्या कोई R
अस्थमा की स्थिति की भविष्यवाणी करने के लिए उपरोक्त डेटा के साथ LASSO का उपयोग करके इस नकली उदाहरण के लिए स्पष्टीकरण के साथ एक नमूना स्क्रिप्ट प्रदान करने के लिए तैयार है ? हालांकि बहुत बुनियादी, मुझे पता है कि मैं, और सीवी पर कई अन्य लोगों की संभावना है, यह बहुत सराहना करेगा!
glmnet
एक द्विआधारी परिणाम के साथ कार्रवाई में एक उदाहरण देखना चाहता था ।
dput
एक की वास्तविक आर वस्तु; पाठकों को ठंढा करने के साथ-साथ आपको केक बनाने के लिए मत डालें! यदि आप R में उपयुक्त डेटा फ्रेम उत्पन्न करते हैंfoo
, तो सवाल करें कि आउटपुट में क्या सवाल हैdput(foo)
।