जिस मॉडल के साथ आप काम कर रहे हैं वह फॉर्म लेता है
yमैं= μ + β1एक्स1 मैं+ β2एक्स2 मैं+ ϵमैं (1)
जहाँ एक शून्य-सामान्य सामान्य वितरण से आया एक त्रुटि शब्द है।εमैं
आपने मॉडल फिट किया है और आपने अनुमान प्राप्त किए हैं: , , और । बीटा 1 बीटा 2μ^β^1β^2
अब, यदि आप उनकी सीमा के भीतर कोवरिएट मानों को ठीक करते हैं, तो और , लिए एक अनुमानित मान कंप्यूटिंग द्वारा प्राप्त किया जा सकता है एक्स ⋆ 2 मैं y मैंएक्स⋆1 मैंएक्स⋆2 मैंyमैं
y⋆मैं= μ^+ β^1एक्स⋆1 मैं+ β^2एक्स⋆2 मैं (2)
यदि आपका मॉडल आपके डेटा को पूरी तरह से फिट बैठता है, तो अनुमानित मूल्य वास्तविक मूल्य हैं। लेकिन, सामान्य तौर पर, मानों को मानों के एक सरल रैखिक संयोजन के रूप में प्राप्त नहीं किया जा सकता है (" सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं ")। अन्य शब्दों में, (1) में त्रुटि शब्द का विचरण सामान्य रूप से शून्य नहीं है। लेकिन, मूल रूप से, मॉडल (1) एक अच्छा सन्निकटन है यदि अवशिष्ट (या इनमें से एक छोटा संस्करण) "छोटा" है।x y मैं - y ⋆ मैंyएक्सyमैं- y⋆मैं
संपादित करें
अपनी टिप्पणियों में, आपने पूछा कि predict()
वास्तव में क्या करता है। यहाँ एक सरल उदाहरण है।
#generate a simple illustrative data set
> x <- runif(10)
> y <- 5 + 2.7 * x + rnorm(10, mean=0, sd=sqrt(0.15))
>
> #fit the model and store the coefficients
> regLin <- lm(y~x)
> coef <- coef(regLin)
>
> #use the predict() function
> y_star2 <- predict(regLin)
> #use equation (2)
> y_star1 <- coef[1] + coef[2] * x
> #compare
> cbind(y, y_star1, y_star2)
y y_star1 y_star2
1 7.100217 6.813616 6.813616
2 6.186333 5.785473 5.785473
3 7.141016 7.492979 7.492979
4 5.121265 5.282990 5.282990
5 4.681924 4.849776 4.849776
6 6.102339 6.106751 6.106751
7 7.223215 7.156512 7.156512
8 5.158546 5.253380 5.253380
9 7.160201 7.198074 7.198074
10 5.555289 5.490793 5.490793
x1
औरx2
निरंतर भविष्यवाणियां हैं, न कि श्रेणीबद्ध। (क्यों द्वारा अवरोधन को संकेतित नहीं ?)