जब आप एक प्रतिगमन मॉडल फिट करते हैं जैसे कि , मॉडल और OLS आकलनकर्ता ' ' को नहीं जानते ' ' बस वर्ग है , यह सिर्फ 'सोचता है' यह एक और चर है। बेशक वहाँ कुछ मिलीभगत है, और जो फिट में शामिल हो जाता है (उदाहरण के लिए, मानक त्रुटियां वे जितना बड़ा हो सकता है अन्यथा), लेकिन बहुत से जोड़े के जोड़े कुछ हद तक एक दूसरे के एक समारोह में होने के बिना समेटे हुए हो सकते हैं। x 2 मैं एक्समैंy^i=β^0+β^1xi+β^2x2ix2ixi
हम यह नहीं पहचानते हैं कि मॉडल में वास्तव में दो अलग-अलग चर हैं, क्योंकि हम जानते हैं कि अंततः जैसा ही चर है जिसे हमने और बीच एक संबंध को पकड़ने के लिए रूपांतरित और शामिल किया है । की वास्तविक प्रकृति का ज्ञान , हमारे विश्वास के साथ युग्मित है कि और बीच एक संबंध है जो कि हमारे लिए उस तरीके को समझना मुश्किल बना देता है जो मॉडल के दृष्टिकोण से अभी भी रैखिक है। इसके अलावा, हम और कल्पना x i x i y i x 2 i x i y i x i x 2 i x , yx2ixixiyix2ixiyixix2iएक साथ 2 डी विमान पर 3 डी फ़ंक्शन के सीमांत प्रक्षेपण को देखकर । x,y
यदि आपके पास केवल और , तो आप उन्हें पूर्ण 3 डी स्थान में देखने की कोशिश कर सकते हैं (हालांकि यह अभी भी मुश्किल है कि वास्तव में क्या चल रहा है यह देखने के लिए)। यदि आप पूर्ण 3 डी स्थान में फिट किए गए फ़ंक्शन को देखते हैं, तो आप देखेंगे कि फिट किया गया फ़ंक्शन एक 2 डी विमान है, और इसके अलावा यह एक सपाट विमान है। जैसा कि मैं कहता हूं, यह अच्छी तरह से देखना मुश्किल है क्योंकि डेटा केवल उस 3 डी स्थान से गुजरने वाली एक घुमावदार रेखा के साथ मौजूद हैं (यह तथ्य उनकी की दृश्य अभिव्यक्ति है)। हम यहां ऐसा करने की कोशिश कर सकते हैं। कल्पना कीजिए कि यह फिट मॉडल है: x 2 i x i , x 2 ixix2ixi,x2i
x = seq(from=0, to=10, by=.5)
x2 = x**2
y = 3 + x - .05*x2
d.mat = data.frame(X1=x, X2=x2, Y=y)
# 2D plot
plot(x, y, pch=1, ylim=c(0,11), col="red",
main="Marginal projection onto the 2D X,Y plane")
lines(x, y, col="lightblue")
# 3D plot
library(scatterplot3d)
s = scatterplot3d(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, color="gray", pch=1,
xlab="X1", ylab="X2", zlab="Y", xlim=c(0, 11), ylim=c(0,101),
zlim=c(0, 11), type="h", main="In pseudo-3D space")
s$points(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, col="red", pch=1)
s$plane3d(Intercept=3, x.coef=1, y.coef=-.05, col="lightblue")
इन चित्रों में देखना आसान हो सकता है, जो rgl
पैकेज का उपयोग करके समान डेटा के साथ बनाए गए घुमाए गए 3 डी आंकड़े के स्क्रीनशॉट हैं ।
जब हम कहते हैं कि एक मॉडल जो "मापदंडों में रैखिक है" वास्तव में रैखिक है, यह सिर्फ कुछ गणितीय परिष्कार नहीं है। चरों के साथ , आप -d में एक हाइपरप्लेन को -dimensional हाइपरस्पेस (हमारे उदाहरण में 3 डी स्पेस में 2 डी प्लेन) में फिट कर रहे हैं । वह हाइपरप्लेन वास्तव में 'फ्लैट' / 'रैखिक' है; यह सिर्फ एक रूपक नहीं है। पी पीppp+1