मैं समझता हूं कि हम यादृच्छिक प्रभाव (या मिश्रित प्रभाव) मॉडल का उपयोग करते हैं जब हम मानते हैं कि कुछ मॉडल पैरामीटर कुछ समूहों के समूह में यादृच्छिक रूप से भिन्न होते हैं। मुझे एक मॉडल फिट करने की इच्छा है, जहां एक समूहीकरण कारक में प्रतिक्रिया को सामान्यीकृत और केंद्रित किया गया है (पूरी तरह से नहीं, बल्कि बहुत करीब), लेकिन एक स्वतंत्र चर x
को किसी भी तरह से समायोजित नहीं किया गया है। इसने मुझे निम्नलिखित परीक्षा ( गढ़े हुए डेटा का उपयोग करके ) को यह सुनिश्चित करने के लिए प्रेरित किया कि मुझे वह प्रभाव मिलेगा जो मैं देख रहा था कि क्या यह वास्तव में वहाँ था। मैंने एक रैंडम इंटरसेप्ट (एक समूह द्वारा परिभाषित ) के साथ एक मिश्रित प्रभाव मॉडल चलाया f
और एक निश्चित फिक्स्ड भविष्यवक्ता के रूप में कारक एफ के साथ एक दूसरा निश्चित प्रभाव मॉडल। मैंने lmer
मिश्रित प्रभाव मॉडल और बेस फ़ंक्शन के लिए आर पैकेज का उपयोग कियाlm()
निश्चित प्रभाव मॉडल के लिए। निम्नलिखित डेटा और परिणाम है।
ध्यान दें कि y
, समूह की परवाह किए बिना, लगभग 0. और भिन्न होता हैx
y
समूह के साथ लगातार बदलता रहता है , लेकिन समूहों की तुलना में बहुत अधिक भिन्न होता हैy
> data
y x f
1 -0.5 2 1
2 0.0 3 1
3 0.5 4 1
4 -0.6 -4 2
5 0.0 -3 2
6 0.6 -2 2
7 -0.2 13 3
8 0.1 14 3
9 0.4 15 3
10 -0.5 -15 4
11 -0.1 -14 4
12 0.4 -13 4
यदि आप डेटा के साथ काम करने में रुचि रखते हैं, तो यहां dput()
आउटपुट है:
data<-structure(list(y = c(-0.5, 0, 0.5, -0.6, 0, 0.6, -0.2, 0.1, 0.4,
-0.5, -0.1, 0.4), x = c(2, 3, 4, -4, -3, -2, 13, 14, 15, -15,
-14, -13), f = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L,
4L, 4L, 4L), .Label = c("1", "2", "3", "4"), class = "factor")),
.Names = c("y","x","f"), row.names = c(NA, -12L), class = "data.frame")
मिश्रित प्रभाव मॉडल फिटिंग:
> summary(lmer(y~ x + (1|f),data=data))
Linear mixed model fit by REML
Formula: y ~ x + (1 | f)
Data: data
AIC BIC logLik deviance REMLdev
28.59 30.53 -10.3 11 20.59
Random effects:
Groups Name Variance Std.Dev.
f (Intercept) 0.00000 0.00000
Residual 0.17567 0.41913
Number of obs: 12, groups: f, 4
Fixed effects:
Estimate Std. Error t value
(Intercept) 0.008333 0.120992 0.069
x 0.008643 0.011912 0.726
Correlation of Fixed Effects:
(Intr)
x 0.000
मैं ध्यान देता हूं कि अवरोधन विचरण घटक 0 अनुमानित है, और महत्वपूर्ण रूप से मेरे लिए, x
एक महत्वपूर्ण भविष्यवक्ता नहीं है y
।
अगला मैं निश्चित प्रभाव मॉडल के साथ फिट हूं f
एक यादृच्छिक अवरोधन के लिए समूहीकरण कारक के बजाय भविष्यवक्ता के रूप :
> summary(lm(y~ x + f,data=data))
Call:
lm(formula = y ~ x + f, data = data)
Residuals:
Min 1Q Median 3Q Max
-0.16250 -0.03438 0.00000 0.03125 0.16250
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.38750 0.14099 -9.841 2.38e-05 ***
x 0.46250 0.04128 11.205 1.01e-05 ***
f2 2.77500 0.26538 10.457 1.59e-05 ***
f3 -4.98750 0.46396 -10.750 1.33e-05 ***
f4 7.79583 0.70817 11.008 1.13e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1168 on 7 degrees of freedom
Multiple R-squared: 0.9484, Adjusted R-squared: 0.9189
F-statistic: 32.16 on 4 and 7 DF, p-value: 0.0001348
अब मुझे लगता है कि, जैसा कि अपेक्षित था, x
एक महत्वपूर्ण भविष्यवक्ता है y
।
मैं इस अंतर के बारे में अंतर्ज्ञान की तलाश कर रहा हूं । यहां मेरी सोच किस तरह से गलत है? मैं गलत तरीके x
से इन दोनों मॉडलों के लिए एक महत्वपूर्ण पैरामीटर खोजने की उम्मीद क्यों करता हूं, लेकिन वास्तव में इसे केवल निश्चित प्रभाव मॉडल में देखते हैं?
x
चर महत्वपूर्ण नहीं है। मुझे संदेह है कि एक ही परिणाम (गुणांक और एसई) है जो आपको चल रहा होगाlm(y~x,data=data)
। निदान के लिए आगे कोई समय नहीं है, लेकिन इसे इंगित करना चाहते हैं।