मैं व्यक्तियों के विशेष समूह के लिए चर लॉग ऑन पर वर्ष के प्रभाव का विश्लेषण करने की कोशिश कर रहा हूं (मेरे पास 3 समूह हैं)। सबसे सरल मॉडल:
> fix1 = lm(logInd ~ 0 + Group + Year:Group, data = mydata)
> summary(fix1)
Call:
lm(formula = logInd ~ 0 + Group + Year:Group, data = mydata)
Residuals:
Min 1Q Median 3Q Max
-5.5835 -0.3543 -0.0024 0.3944 4.7294
Coefficients:
Estimate Std. Error t value Pr(>|t|)
Group1 4.6395740 0.0466217 99.515 < 2e-16 ***
Group2 4.8094268 0.0534118 90.044 < 2e-16 ***
Group3 4.5607287 0.0561066 81.287 < 2e-16 ***
Group1:Year -0.0084165 0.0027144 -3.101 0.00195 **
Group2:Year 0.0032369 0.0031098 1.041 0.29802
Group3:Year 0.0006081 0.0032666 0.186 0.85235
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7926 on 2981 degrees of freedom
Multiple R-squared: 0.9717, Adjusted R-squared: 0.9716
F-statistic: 1.705e+04 on 6 and 2981 DF, p-value: < 2.2e-16
हम देख सकते हैं कि ग्रुप 1 में काफी गिरावट आ रही है, ग्रुप 2 और 3 में वृद्धि हो रही है लेकिन उल्लेखनीय रूप से ऐसा नहीं है।
स्पष्ट रूप से व्यक्ति को यादृच्छिक प्रभाव होना चाहिए, इसलिए मैं प्रत्येक व्यक्ति के लिए यादृच्छिक अवरोधन प्रभाव पेश करता हूं:
> mix1a = lmer(logInd ~ 0 + Group + Year:Group + (1|Individual), data = mydata)
> summary(mix1a)
Linear mixed model fit by REML
Formula: logInd ~ 0 + Group + Year:Group + (1 | Individual)
Data: mydata
AIC BIC logLik deviance REMLdev
4727 4775 -2356 4671 4711
Random effects:
Groups Name Variance Std.Dev.
Individual (Intercept) 0.39357 0.62735
Residual 0.24532 0.49530
Number of obs: 2987, groups: Individual, 103
Fixed effects:
Estimate Std. Error t value
Group1 4.6395740 0.1010868 45.90
Group2 4.8094268 0.1158095 41.53
Group3 4.5607287 0.1216522 37.49
Group1:Year -0.0084165 0.0016963 -4.96
Group2:Year 0.0032369 0.0019433 1.67
Group3:Year 0.0006081 0.0020414 0.30
Correlation of Fixed Effects:
Group1 Group2 Group3 Grp1:Y Grp2:Y
Group2 0.000
Group3 0.000 0.000
Group1:Year -0.252 0.000 0.000
Group2:Year 0.000 -0.252 0.000 0.000
Group3:Year 0.000 0.000 -0.252 0.000 0.000
इसका एक अपेक्षित प्रभाव था - ढलानों का एसई (गुणांक Group1-3: वर्ष) अब कम हो गया है और अवशिष्ट एसई भी कम है।
व्यक्ति ढलान में भी भिन्न होते हैं इसलिए मैंने यादृच्छिक ढलान प्रभाव भी पेश किया:
> mix1c = lmer(logInd ~ 0 + Group + Year:Group + (1 + Year|Individual), data = mydata)
> summary(mix1c)
Linear mixed model fit by REML
Formula: logInd ~ 0 + Group + Year:Group + (1 + Year | Individual)
Data: mydata
AIC BIC logLik deviance REMLdev
2941 3001 -1461 2885 2921
Random effects:
Groups Name Variance Std.Dev. Corr
Individual (Intercept) 0.1054790 0.324775
Year 0.0017447 0.041769 -0.246
Residual 0.1223920 0.349846
Number of obs: 2987, groups: Individual, 103
Fixed effects:
Estimate Std. Error t value
Group1 4.6395740 0.0541746 85.64
Group2 4.8094268 0.0620648 77.49
Group3 4.5607287 0.0651960 69.95
Group1:Year -0.0084165 0.0065557 -1.28
Group2:Year 0.0032369 0.0075105 0.43
Group3:Year 0.0006081 0.0078894 0.08
Correlation of Fixed Effects:
Group1 Group2 Group3 Grp1:Y Grp2:Y
Group2 0.000
Group3 0.000 0.000
Group1:Year -0.285 0.000 0.000
Group2:Year 0.000 -0.285 0.000 0.000
Group3:Year 0.000 0.000 -0.285 0.000 0.000
लेकिन अब, उम्मीद के विपरीत, ढलानों के एसई (गुणांक Group1-3: वर्ष) अब बहुत अधिक हैं, यहां तक कि बिना किसी यादृच्छिक प्रभाव के भी अधिक है!
यह कैसे हो सकता है? मैं उम्मीद करूंगा कि यादृच्छिक प्रभाव अस्पष्टीकृत परिवर्तनशीलता को "खाएगा" और अनुमान की "वृद्धि" करेगा!
हालांकि, अवशिष्ट एसई अपेक्षित रूप से व्यवहार करता है - यह यादृच्छिक अवरोधन मॉडल की तुलना में कम है।
यहां डेटा की जरूरत है।
संपादित करें
अब मुझे आश्चर्यजनक तथ्य का एहसास हुआ। अगर मैं प्रत्येक व्यक्ति के लिए रैखिक प्रतिगमन अलग-अलग करता हूं और फिर परिणामी ढलानों पर एनोवा चलाता हूं , तो मुझे यादृच्छिक ढलान मॉडल के समान परिणाम मिलता है! जानोगे क्यों?
indivSlope = c()
for (indiv in 1:103) {
mod1 = lm(logInd ~ Year, data = mydata[mydata$Individual == indiv,])
indivSlope[indiv] = coef(mod1)['Year']
}
indivGroup = unique(mydata[,c("Individual", "Group")])[,"Group"]
anova1 = lm(indivSlope ~ 0 + indivGroup)
summary(anova1)
Call:
lm(formula = indivSlope ~ 0 + indivGroup)
Residuals:
Min 1Q Median 3Q Max
-0.176288 -0.016502 0.004692 0.020316 0.153086
Coefficients:
Estimate Std. Error t value Pr(>|t|)
indivGroup1 -0.0084165 0.0065555 -1.284 0.202
indivGroup2 0.0032369 0.0075103 0.431 0.667
indivGroup3 0.0006081 0.0078892 0.077 0.939
Residual standard error: 0.04248 on 100 degrees of freedom
Multiple R-squared: 0.01807, Adjusted R-squared: -0.01139
F-statistic: 0.6133 on 3 and 100 DF, p-value: 0.6079
यहां डेटा की जरूरत है।
Group
Group
:Year
logInd ~ Year*Group
, केवल गुणांक अलग-अलग आकार में हैं, अधिक कुछ नहीं। आपके स्वाद पर निर्भर करता है और आप किस गुणांक के आकार को पसंद करते हैं, इससे ज्यादा कुछ नहीं। मेरे 1 मॉडल में "वर्ष मुख्य प्रभाव" का कोई बहिष्करण नहीं है जैसा कि आप लिखते हैं ... logInd ~ Year*Group
बिल्कुल वैसा ही है, Year
गुणांक तब मुख्य प्रभाव नहीं है, लेकिन समूह 1: वर्ष।