मान लें कि मेरे पास निम्न डेटा है और मैं प्रतिगमन मॉडल चला रहा हूं:
df=data.frame(income=c(5,3,47,8,6,5),
won=c(0,0,1,1,1,0),
age=c(18,18,23,50,19,39),
home=c(0,0,1,0,0,1))
एक तरफ, मैं आय पर भविष्यवाणी करने के लिए एक रैखिक मॉडल चलाता हूं:
md1 = lm(income ~ age + home + home, data=df)
दूसरा, मैं जीते हुए चर पर भविष्यवाणी करने के लिए एक लॉगिट मॉडल चलाता हूं:
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
दोनों मॉडलों के लिए, मुझे आश्चर्य है कि मैं भविष्यवक्ता प्रतिक्रिया श्रेणी, फिट किए गए मूल्य और मॉडल की अनुमानित मूल्य के साथ एक तालिका या डेटा फ़्रेम कैसे उत्पन्न कर सकता हूं।
तो रैखिक मॉडल के लिए, कुछ इस तरह है:
age fitted_income predicted_income
18 3 5
23 3 3
50 4 2
19 5 5
39 6 4
home fitted_income predicted_income
0 5 6
1 3 9
या शायद यह प्रत्येक डेटा बिंदु के लिए होना चाहिए। तो x_i डेटा बिंदु के लिए, फिट और अनुमानित मान हैं:
id age fitted_income predicted_income
1 18 3 5
2 23 3 3
3 50 4 2
4 19 5 5
5 39 6 4
एक सांख्यिकीय दृष्टिकोण से, क्या ऐसा उपक्रम उपयोगी है? क्यों या क्यों नहीं?
यह R में कैसे किया जा सकता है? (नाम (md1) को देखा और पाया कि मैं मॉडल से क्या खींच सकता हूं, लेकिन उस अतीत को आगे नहीं बढ़ाया है)
धन्यवाद!
residualsआदेश में R। cbindमूल डेटाफ़्रेम में उन्हें शामिल करने के लिए उपयोग करें ।