मेरे पास एक रेखीय प्रतिगमन मॉडल है जिसमें एक श्रेणीगत चर है (पुरुष और महिला) और एक सतत चर ।
मैं आर के साथ विरोधाभासी कोड सेट करता हूं options(contrasts=c("contr.sum","contr.poly"))
। और अब मेरे पास , , और उनके इंटरैक्शन (A: B) का उपयोग करते हुए टाइप III के वर्ग हैं ।drop1(model, .~., test="F")
क्या मैं के साथ फंस गया है कि कैसे वर्गों की राशि लिए गणना की जाती है । मुझे लगता है कि यह है sum((predicted y of the full model - predicted y of the reduced model)^2)
। कम किया गया मॉडल जैसा दिखेगा y~A+A:B
। लेकिन जब मैं उपयोग करता हूं predict(y~A+A:B)
, आर अनुमानित मूल्यों को वापस कर रहा है जो पूर्ण मॉडल अनुमानित मूल्यों के समान हैं। इसलिए, वर्गों का योग 0 होगा।
( के वर्गों के योगों के लिए , मैंने एक कम किए गए मॉडल का उपयोग किया , जो कि जैसा है वैसा ही है ।)y~B+A:B
y~A:B
यहाँ बेतरतीब ढंग से उत्पन्न डेटा के लिए उदाहरण कोड है:
A<-as.factor(rep(c("male","female"), each=5))
set.seed(1)
B<-runif(10)
set.seed(5)
y<-runif(10)
model<-lm(y~A+B+A:B)
options(contrasts = c("contr.sum","contr.poly"))
#type3 sums of squares
drop1(model, .~., test="F")
#or same result:
library(car)
Anova(lm(y~A+B+A:B),type="III")
#full model
predFull<-predict(model)
#Calculate sum of squares
#SS(A|B,AB)
predA<-predict(lm(y~B+A:B))
sum((predFull-predA)^2)
#SS(B|A,AB) (???)
predB<-predict(lm(y~A+A:B))
sum((predFull-predB)^2)
#Sums of squares should be 0.15075 (according to anova table)
#but calculated to be 2.5e-31
#SS(AB|A,B)
predAB<-predict(lm(y~A+B))
sum((predFull-predAB)^2)
#Anova Table (Type III tests)
#Response: y
# Sum Sq Df F value Pr(>F)
#(Intercept) 0.16074 1 1.3598 0.2878
#A 0.00148 1 0.0125 0.9145
#B 0.15075 1 1.2753 0.3019
#A:B 0.01628 1 0.1377 0.7233
#Residuals 0.70926 6