मैट्रिक्स संदर्भ में अपने मॉडल सामान्य रूप में कर रहे हैं । इ[ य] = एक्सβ
पहला मॉडल X में पंक्ति द्वारा पहले समूह के एक तत्व का प्रतिनिधित्व करता है , जो इंटरसेप्ट के अनुरूप है, श्रेणी 2 के लिए संकेतक और श्रेणी 3 के लिए संकेतक। यह दूसरे समूह के एक तत्व का प्रतिनिधित्व करता है। पंक्ति ( 1 , 1 , 0 ) और तीसरे समूह का एक तत्व ( 1 , 0 , 1 ) ।( 1 , 0 , 0 )एक्स( 1 , 1 , 0 )( 1 , 0 , 1 )
इसके बजाय दूसरा मॉडल पंक्तियों , ( 1 , 2 , 2 2 ) = ( 1 , 2 , 4 ) , और ( 1 , 3 , 3 2 ) = का उपयोग करता है ( 1 , 3 , 9 ) , क्रमशः।( 1 , 1 , 12) = ( 1 , 1 , 1 )( १ , २ , २2) = ( 1 , 2 , 4 )( 1 , 3 , 32) = ( 1 , 3 , 9 )
आइए परिणामी मॉडल matrices और X 2 को कॉल करें । वे बस संबंधित हैं: एक के कॉलम दूसरे के कॉलम के रैखिक संयोजन हैं। उदाहरण के लिए, चलोएक्स1एक्स2
वी= ⎛⎝⎜100112138⎞⎠⎟।
तब से
⎛⎝⎜111010001⎞⎠⎟वी=⎛⎝⎜111123149⎞⎠⎟,
यह इस प्रकार है कि
एक्स1वी= एक्स2।
इसलिए मॉडल खुद से संबंधित हैं
एक्स1β1= ई[ य] = एक्स2β2= ( एक्स)1वी) β2= एक्स1( वीβ2) का है ।
β2
β1= वीβ2।
वही संबंध इसलिए उनके कम से कम वर्गों के अनुमान के लिए है। इससे पता चलता है कि मॉडल में समान फिट हैं : वे केवल उन्हें अलग तरीके से व्यक्त करते हैं।
चूंकि दो मॉडल मैट्रिस के पहले कॉलम समान हैं, कोई भी एनोवा तालिका जो पहले कॉलम और शेष कॉलम के बीच विचरण का विघटन करती है, वह नहीं बदलेगी। एक एनोवा तालिका जो दूसरे और तीसरे कॉलम के बीच अंतर करती है, हालांकि, इस बात पर निर्भर करेगा कि डेटा कैसे एन्कोडेड हैं।
आर15एक्स1एक्स2
समझाने के लिए, यहाँ आपके जैसे डेटा (लेकिन अलग-अलग प्रतिक्रियाओं के साथ) और उसी के अनुसार उत्पन्न किए गए विश्लेषण हैं R
।
set.seed(17)
D <- data.frame(group=rep(1:3, each=5), y=rnorm(3*5, rep(1:3, each=5), sd=2))
दो मॉडल फिट करें:
fit.1 <- lm(y ~ factor(group), D)
fit.2 <- lm(y ~ group + I(group^2), D)
उनके एनोवा तालिकाओं को प्रदर्शित करें:
anova(fit.1)
anova(fit.2)
पहले मॉडल के लिए आउटपुट है
Df Sum Sq Mean Sq F value Pr(>F)
factor(group) 2 51.836 25.918 14.471 0.000634 ***
Residuals 12 21.492 1.791
दूसरे मॉडल के लिए यह है
Df Sum Sq Mean Sq F value Pr(>F)
group 1 50.816 50.816 28.3726 0.0001803 ***
I(group^2) 1 1.020 1.020 0.5694 0.4650488
Residuals 12 21.492 1.791
आप देख सकते हैं कि वर्गों के अवशिष्ट योग समान हैं। दूसरे मॉडल में पहली दो पंक्तियों को जोड़कर आप उसी DF और योग का वर्ग प्राप्त करेंगे, जहाँ से समान माध्य वर्ग, F मान और P- मान की गणना की जा सकती है।
अंत में, चलो गुणांक अनुमानों की तुलना करते हैं।
beta.1.hat <- coef(fit.1)
beta.2.hat <- coef(fit.2)
आउटपुट है
(Intercept) factor(group)2 factor(group)3
0.4508762 2.8073697 4.5084944
(Intercept) group I(group^2)
-3.4627385 4.4667371 -0.5531225
वी
⎛⎝⎜100112138⎞⎠⎟⎛⎝⎜- 3.46273854.4667371- 0.5531225⎞⎠⎟=⎛⎝⎜0.45087622.80736974.5084944⎞⎠⎟।
जैसा कि दावा किया गया है वैसे ही फिट बैठता है।