बहु-तथ्यात्मक एनोवा के बारे में एक बहुत ही मूल प्रश्न। एक दो-तरफ़ा डिज़ाइन मानें जहां हम दोनों मुख्य प्रभावों ए, बी और इंटरेक्शन ए: बी का परीक्षण करते हैं। ए के साथ टाइप I एसएस के लिए मुख्य प्रभाव का परीक्षण करते समय, प्रभाव एसएस की गणना , जहां आर एस एस ( 1 ) वर्ग के लिए अवशिष्ट त्रुटि योग है। केवल इंटरसेप्ट के साथ मॉडल, और कारक ए के साथ मॉडल के लिए आर एस एस ( ए ) आरएसएस। मेरा प्रश्न त्रुटि शब्द के लिए विकल्प की चिंता करता है:
आप यह कैसे उचित मानते हैं कि इस परीक्षण के लिए त्रुटि शब्द की गणना आमतौर पर पूर्ण मॉडल A + B + A: B से की जाती है जिसमें मुख्य प्रभाव और सहभागिता दोनों शामिल हैं?
... वास्तविक तुलना से अप्रतिबंधित मॉडल से त्रुटि शब्द लेने के विपरीत (उपरोक्त मामले में सिर्फ मुख्य प्रभाव ए से आरएसएस):
इससे फर्क पड़ता है, क्योंकि तुलना में अप्रतिबंधित मॉडल से त्रुटि शब्द की तुलना में पूर्ण मॉडल से त्रुटि शब्द अक्सर (हमेशा नहीं) हमेशा छोटा होता है। ऐसा लगता है कि त्रुटि शब्द के लिए विकल्प कुछ हद तक मनमाना है, बस ऐसे कारकों को जोड़ने / हटाने के लिए वांछित पी-मूल्य परिवर्तनों के लिए जगह बना रहा है जो वास्तव में ब्याज नहीं हैं, लेकिन वैसे भी त्रुटि शब्द को बदलें।
निम्नलिखित उदाहरण में, ए के लिए एफ-मूल्य काफी हद तक पूर्ण मॉडल की पसंद के आधार पर बदलता है, भले ही एसएस के प्रभाव की वास्तविक तुलना समान हो।
> DV <- c(41,43,50, 51,43,53,54,46, 45,55,56,60,58,62,62,
+ 56,47,45,46,49, 58,54,49,61,52,62, 59,55,68,63,
+ 43,56,48,46,47, 59,46,58,54, 55,69,63,56,62,67)
> IV1 <- factor(rep(1:3, c(3+5+7, 5+6+4, 5+4+6)))
> IV2 <- factor(rep(rep(1:3, 3), c(3,5,7, 5,6,4, 5,4,6)))
> anova(lm(DV ~ IV1)) # full model = unrestricted model (just A)
Df Sum Sq Mean Sq F value Pr(>F)
IV1 2 101.11 50.556 0.9342 0.4009
Residuals 42 2272.80 54.114
> anova(lm(DV ~ IV1 + IV2)) # full model = A+B
Df Sum Sq Mean Sq F value Pr(>F)
IV1 2 101.11 50.56 1.9833 0.1509
IV2 2 1253.19 626.59 24.5817 1.09e-07 ***
Residuals 40 1019.61 25.49
> anova(lm(DV ~ IV1 + IV2 + IV1:IV2)) # full model = A+B+A:B
Df Sum Sq Mean Sq F value Pr(>F)
IV1 2 101.11 50.56 1.8102 0.1782
IV2 2 1253.19 626.59 22.4357 4.711e-07 ***
IV1:IV2 4 14.19 3.55 0.1270 0.9717
Residuals 36 1005.42 27.93
एक ही प्रश्न II SS टाइप करने के लिए लागू होता है, और सामान्य रूप से एक सामान्य रेखीय परिकल्पना के लिए, यानी, एक पूर्ण मॉडल के भीतर एक प्रतिबंधित और अप्रतिबंधित मॉडल के बीच तुलना करने के लिए। (प्रकार III एसएस के लिए, अप्रतिबंधित मॉडल हमेशा पूर्ण मॉडल होता है, इसलिए वहां सवाल नहीं उठता)
anova(lm(DV ~ IV1))
anova(lm(DV ~ 1))
anova(lm(DV ~ IV1))