क्या lmerTest में स्वतंत्रता की डिग्री :: aova सही हैं? वे RM-ANOVA से बहुत अलग हैं


10

मैं आर में एक प्रतिक्रिया समय प्रयोग के परिणामों का विश्लेषण कर रहा हूं।

मैंने एक दोहराए हुए उपाय ANOVA (2 स्तरों के साथ 1 भीतर-विषय कारक और 2 स्तरों के साथ 1-विषय कारक) को चलाया। मैंने एक समान रैखिक मिश्रित मॉडल चलाया और मैं एनोवा तालिका के उपयोग के रूप में lmer परिणामों को संक्षेप में प्रस्तुत करना चाहता था lmerTest::anova

मुझे गलत मत समझो: मैंने समान परिणामों की उम्मीद नहीं की थी, हालांकि मैं lmerTest::anovaपरिणामों में स्वतंत्रता की डिग्री के बारे में निश्चित नहीं हूं । यह मुझे लगता है कि यह एक ANOVA को दर्शाता है जिसमें विषय-स्तर पर कोई एकत्रीकरण नहीं है।

मैं इस तथ्य से अवगत हूं कि मिश्रित-प्रभाव वाले मॉडल में स्वतंत्रता की डिग्री की गणना मुश्किल है, लेकिन lmerTest::anovaअद्यतन ?pvaluesविषय ( lme4पैकेज) में एक संभव समाधान के रूप में उल्लेख किया गया है ।

क्या यह गणना सही है? क्या lmerTest::anovaसही परिणाम निर्दिष्ट मॉडल को दर्शाता है?

अद्यतन: मैंने व्यक्तिगत अंतरों को बड़ा किया। स्वतंत्रता की डिग्री lmerTest::anovaसरल एनोवा से अधिक भिन्न हैं, लेकिन मुझे अभी भी यकीन नहीं है, वे भीतर-विषय कारक या बातचीत के लिए इतने बड़े क्यों हैं।

# mini example with ANT dataset from ez package
library(ez); library(lme4); library(lmerTest)

# repeated measures ANOVA with ez package
data(ANT)
ANT.2 <- subset(ANT, !error)
# update: make individual differences larger
baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50)
ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)]

anova.ez <- ezANOVA(data = ANT.2, dv = .(rt), wid = .(subnum), 
  within = .(direction), between = .(group))
anova.ez

# similarly with lmer and lmerTest::anova
model <- lmer(rt ~ group * direction + (1 | subnum), data = ANT.2)
lmerTest::anova(model)

# simple ANOVA on all available data
m <- lm(rt ~ group * direction, data = ANT.2)
anova(m)

ऊपर कोड के परिणाम [ अद्यतन ]:

anova.ez

$ एनोवा

           Effect DFn DFd         F          p p<.05          ges
2           group   1  18 2.6854464 0.11862957       0.1294475137
3       direction   1  18 0.9160571 0.35119193       0.0001690471
4 group:direction   1  18 4.9169156 0.03970473     * 0.0009066868

lmerTest :: एनोवा (मॉडल)

Analysis of Variance Table of type 3  with  Satterthwaite 
approximation for degrees of freedom
                Df Sum Sq Mean Sq F value Denom Pr(>F)
group            1  13293   13293  2.6830    18 0.1188
direction        1   1946    1946  0.3935  5169 0.5305
group:direction  1  11563   11563  2.3321  5169 0.1268

एनोवा (एम)

Analysis of Variance Table

Response: rt
                  Df   Sum Sq Mean Sq  F value Pr(>F)    
group              1  1791568 1791568 242.3094 <2e-16 ***
direction          1      728     728   0.0985 0.7537    
group:direction    1    12024   12024   1.6262 0.2023    
Residuals       5187 38351225    7394                    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

जवाबों:


13

मुझे लगता है कि lmerTestयह सही हो रहा है और ezanovaइस मामले में यह गलत हो रहा है।

  • lmerTestमेरे अंतर्ज्ञान / समझ से सहमत होने के परिणाम
  • lmerTest(Satterthwaite और Kenward-Roger) में दो भिन्न गणनाएँ सहमत हैं
  • वे भी इससे सहमत हैं nlme::lme
  • जब मैं इसे चलाता हूं, तो ezanovaएक चेतावनी देता हूं, जिसे मैं पूरी तरह से नहीं समझता, लेकिन जिसकी अवहेलना नहीं की जानी चाहिए ...

पुन: चल रहा उदाहरण:

library(ez); library(lmerTest); library(nlme)
data(ANT)
ANT.2 <- subset(ANT, !error)
set.seed(101)  ## for reproducibility
baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50)
ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)]

प्रयोगात्मक डिजाइन बाहर चित्रा

with(ANT.2,table(subnum,group,direction))

तो ऐसा लगता है कि व्यक्तियों ( subnum) को या तो नियंत्रण या उपचार समूहों में रखा गया है, और प्रत्येक को दोनों दिशाओं के लिए परीक्षण किया गया है - अर्थात दिशा को व्यक्तियों के भीतर परीक्षण किया जा सकता है (भाजक डीएफ बड़ा है), लेकिन समूह और समूह: दिशा केवल के बीच परीक्षण किया जा सकता है व्यक्तियों

(anova.ez <- ezANOVA(data = ANT.2, dv = .(rt), wid = .(subnum), 
    within = .(direction), between = .(group)))
## $ANOVA
##            Effect DFn DFd         F          p p<.05          ges
## 2           group   1  18 2.4290721 0.13651174       0.1183150147
## 3       direction   1  18 0.9160571 0.35119193       0.0002852171
## 4 group:direction   1  18 4.9169156 0.03970473     * 0.0015289914

यहां मुझे पता Warning: collapsing data to cell means. *IF* the requested effects are a subset of the full design, you must use the "within_full" argument, else results may be inaccurate. चलता है कि भाजक डीएफ थोड़ा कायरता दिखता है (सभी 18 के बराबर): मुझे लगता है कि उन्हें दिशा और समूह: दिशा के लिए बड़ा होना चाहिए, जिसे स्वतंत्र रूप से परीक्षण किया जा सकता है (लेकिन यदि आप (direction|subnum)मॉडल में जोड़े गए तो छोटा होगा )?

# similarly with lmer and lmerTest::anova
model <- lmer(rt ~ group * direction + (1 | subnum), data = ANT.2)
lmerTest::anova(model)
##                 Df  Sum Sq Mean Sq F value Denom Pr(>F)
## group            1 12065.7 12065.7  2.4310    18 0.1364
## direction        1  1952.2  1952.2  0.3948  5169 0.5298
## group:direction  1 11552.2 11552.2  2.3299  5169 0.1270

Dfस्तंभ यहाँ अंश df को संदर्भित करता है, Denom(द्वितीय करने के लिए पिछले) का अनुमान भाजक df देता है; वे शास्त्रीय अंतर्ज्ञान से सहमत हैं। अधिक महत्वपूर्ण, हम एफ मूल्यों के लिए अलग-अलग उत्तर भी प्राप्त करते हैं ...

हम केनवर्ड-रोजर के साथ डबल-चेक भी कर सकते हैं ( बहुत धीमी गति से क्योंकि इसमें कई बार मॉडल को रिफिट करना शामिल है)

lmerTest::anova(model,ddf="Kenward-Roger")

परिणाम समान हैं।

इस उदाहरण के लिए lme( nlmeपैकेज से) वास्तव में एक पूरी तरह से अच्छा काम करता है जो उचित भाजक डीएफ (एफ और पी-मान बहुत अलग हैं) का अनुमान लगाता है:

model3 <- lme(rt ~ group * direction, random=~1|subnum, data = ANT.2)
anova(model3)[-1,]
##                 numDF denDF   F-value p-value
## group               1    18 2.4334314  0.1362
## direction           1  5169 0.3937316  0.5304
## group:direction     1  5169 2.3298847  0.1270

अगर मैं के बीच एक बातचीत फिट directionऔर subnumके लिए df directionऔर group:directionबहुत छोटे (मैं सोचा होगा कि वे 18 हो सकता है, लेकिन शायद मैंने कुछ गलत हो रही है) कर रहे हैं:

model2 <- lmer(rt ~ group * direction + (direction | subnum), data = ANT.2)
lmerTest::anova(model2)
##                 Df  Sum Sq Mean Sq F value   Denom Pr(>F)
## group            1 20334.7 20334.7  2.4302  17.995 0.1364
## direction        1  1804.3  1804.3  0.3649 124.784 0.5469
## group:direction  1 10616.6 10616.6  2.1418 124.784 0.1459

आपके उत्तर के लिए @Ben बोल्कर धन्यवाद। मैं आपकी टिप्पणियों पर सोचूंगा और कुछ और प्रयोग करूंगा। मैं ezAnovaचेतावनी को समझता हूं क्योंकि आपको 2x2 एनोवा नहीं चलाना चाहिए यदि वास्तव में आपका डेटा 2x2x2 डिज़ाइन से है।
जिरी लुकावस्की

1
संभवतः जो चेतावनी के साथ आता है, ezउसे फिर से शब्दांकित किया जा सकता है; इसके वास्तव में दो भाग हैं जो महत्वपूर्ण हैं: (1) यह कि डेटा को एकत्र किया जा रहा है और (2) आंशिक डिजाइन के बारे में सामान। # 1 विसंगति के लिए सबसे अधिक प्रासंगिक है क्योंकि यह बताता है कि पारंपरिक गैर-मिश्रित-प्रभाव एनोवा करने के लिए, किसी व्यक्ति को डिजाइन के प्रति अवलोकन के लिए डेटा को एक ही अवलोकन में एकत्र करना चाहिए। इस मामले में, हम "दिशा" चर के स्तर के अनुसार प्रति विषय एक अवलोकन चाहते हैं (विषयों के लिए समूह लेबल बनाए रखते हुए)। ezANOVA यह स्वचालित रूप से गणना करता है।
माइक लॉरेंस

+1 लेकिन मुझे यकीन नहीं है कि इज़ानोवा में यह गलत है। मैं भाग गया summary(aov(rt ~ group*direction + Error(subnum/direction), data=ANT.2))और यह 16 (?) के लिए डीएफएस देता है groupऔर के लिए 18 directionऔर group:direction। तथ्य यह है कि प्रति समूह / दिशा संयोजन में ~ 125 अवलोकन हैं, आरएम-एनोवा के लिए बहुत अधिक अप्रासंगिक है, उदाहरण के लिए देखें मेरे स्वयं के प्रश्न आँकड़े ।stackexchange.com / questions/ 286280 : दिशा का परीक्षण किया गया है, इसलिए विषय के विरुद्ध, कहें दिशा बातचीत।
अमीबा

बेन, मेरी पिछली टिप्पणी का अनुसरण कर रहा है: क्या यह वास्तव में है जिसका अर्थ है "मैंने सोचा होगा कि वे 18 वर्ष के होंगे, लेकिन शायद मैं गलत हो रहा हूं"? यदि ऐसा है, तो हम सहमति में हैं। लेकिन फिर, 18 आरएम-एनोवा के साथ सहमत हैं और lmerTestउस अनुमान से असहमत हैं ~ 125 डीएफएस।
अमीबा

1
उपरोक्त अपडेट करें: अन्य दो कारकों के lmerTest::anova(model2, ddf="Kenward-Roger")लिए 18.000 df groupऔर 17.987df के लिए रिटर्न , जो RM-ANOVA (ezAnova के अनुसार) के साथ उत्कृष्ट समझौते में है। मेरा निष्कर्ष यह है कि Satterthwaite का सन्निकटन model2किसी कारण से विफल हो जाता है ।
अमीबा

10

मैं आमतौर पर बेन के विश्लेषण से सहमत हूं, लेकिन मुझे कुछ टिप्पणी और थोड़ा अंतर्ज्ञान जोड़ने दें।

सबसे पहले, समग्र परिणाम:

  1. लैटरटेस्ट परिणाम Satterthwaite पद्धति का उपयोग करके सही हैं
  2. Kenward-Roger विधि भी सही है और Satterthwaite से सहमत है

बेन उस डिजाइन की रूपरेखा तैयार करता है, जिसमें subnumकुछ groupदेर में घोंसला बनाया जाता है direction और उसके group:directionसाथ पार किया जाता है subnum। इसका मतलब यह है कि प्राकृतिक त्रुटि शब्द (यानी तथाकथित "एन्ग्लोसिंग एरर स्ट्रैटम") है group, subnumजबकि अन्य शब्दों (सहित subnum) के लिए एनक्लोजिंग एरर स्ट्रैटम अवशिष्ट है।

इस संरचना को एक तथाकथित कारक-संरचना आरेख में दर्शाया जा सकता है:

names <- c(expression("[I]"[5169]^{5191}),
           expression("[subnum]"[18]^{20}), expression(grp:dir[1]^{4}),
           expression(dir[1]^{2}), expression(grp[1]^{2}), expression(0[1]^{1}))
x <- c(2, 4, 4, 6, 6, 8)
y <- c(5, 7, 5, 3, 7, 5)
plot(NA, NA, xlim=c(2, 8), ylim=c(2, 8), type="n", axes=F, xlab="", ylab="")
text(x, y, names) # Add text according to ’names’ vector
# Define coordinates for start (x0, y0) and end (x1, y1) of arrows:
x0 <- c(1.8, 1.8, 4.2, 4.2, 4.2, 6, 6) + .5
y0 <- c(5, 5, 7, 5, 5, 3, 7)
x1 <- c(2.7, 2.7, 5, 5, 5, 7.2, 7.2) + .5
y1 <- c(5, 7, 7, 3, 7, 5, 5)
arrows(x0, y0, x1, y1, length=0.1)

कारक संरचना आरेख

यहां यादृच्छिक शब्दों को कोष्ठक में संलग्न किया गया है, 0समग्र माध्य (या अवरोधन) का [I]प्रतिनिधित्व करता है, त्रुटि शब्द का प्रतिनिधित्व करता है, सुपर-लिपि संख्याएं स्तरों की संख्या हैं और उप-लिपि संख्याएं एक संतुलित डिजाइन मानने वाली स्वतंत्रता की डिग्री की संख्या हैं। आरेख बताता है कि प्राकृतिक त्रुटि शब्द (त्रुटि स्ट्रेटम को घेरना) groupहै subnumऔर इसके लिए अंशांक df subnum, जिसके लिए भाजक df के बराबर है group, 18 है: 20 ऋण 1 df के लिए groupऔर समग्र अर्थ के लिए 1 df। कारक संरचना आरेखों का अधिक व्यापक परिचय अध्याय 2 में यहां उपलब्ध है: https : //02429.compute.dtu.dk/eBook

यदि डेटा बिल्कुल संतुलित थे, तो हम एक SSQ- अपघटन से एफ-परीक्षण का निर्माण करने में सक्षम होंगे जैसा कि प्रदान किया गया है anova.lm। चूंकि डेटासेट बहुत बारीकी से संतुलित होता है इसलिए हम निम्न प्रकार से अनुमानित एफ-परीक्षण प्राप्त कर सकते हैं:

ANT.2 <- subset(ANT, !error)
set.seed(101)
baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50)
ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)]
fm <- lm(rt ~ group * direction + subnum, data=ANT.2)
(an <- anova(fm))
Analysis of Variance Table

Response: rt
                  Df   Sum Sq Mean Sq  F value Pr(>F)    
group              1   994365  994365 200.5461 <2e-16 ***
direction          1     1568    1568   0.3163 0.5739    
subnum            18  7576606  420923  84.8927 <2e-16 ***
group:direction    1    11561   11561   2.3316 0.1268    
Residuals       5169 25629383    4958                    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

यहां सभी F और p मानों की गणना यह मानकर की जाती है कि सभी शर्तों में अवशिष्ट त्रुटि के रूप में अवशिष्ट हैं, और यह सभी लेकिन 'समूह' के लिए सही है। इसके बजाय समूह के लिए 'संतुलित-सही' F -est:

F_group <- an["group", "Mean Sq"] / an["subnum", "Mean Sq"]
c(Fvalue=F_group, pvalue=pf(F_group, 1, 18, lower.tail = FALSE))
   Fvalue    pvalue 
2.3623466 0.1416875 

जहाँ हम F -value हर में subnumMS के बजाय MS का उपयोग करते हैं।Residuals

ध्यान दें कि ये मान Satterthwaite परिणामों से काफी मेल खाते हैं:

model <- lmer(rt ~ group * direction + (1 | subnum), data = ANT.2)
anova(model, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
                 Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group           12065.3 12065.3     1    18  2.4334 0.1362
direction        1951.8  1951.8     1  5169  0.3936 0.5304
group:direction 11552.2 11552.2     1  5169  2.3299 0.1270

शेष अंतर डेटा के बिल्कुल संतुलित नहीं होने के कारण हैं।

ओपी के anova.lmसाथ तुलना की जाती है anova.lmerModLmerTest, जो ठीक है, लेकिन तुलना करने के लिए जैसे हमें समान विरोधाभासों का उपयोग करना पड़ता है। इस मामले में के बीच एक अंतर है anova.lmऔर anova.lmerModLmerTestजब से वे क्रमशः प्रकार मैं और तृतीय डिफ़ॉल्ट रूप से परीक्षण उत्पादन है, और इस डेटासेट के लिए एक (छोटे) प्रकार मैं और तृतीय विरोधाभासों के बीच का अंतर है:

show_tests(anova(model, type=1))$group
               (Intercept) groupTreatment directionright groupTreatment:directionright
groupTreatment           0              1    0.005202759                     0.5013477

show_tests(anova(model, type=3))$group # type=3 is default
               (Intercept) groupTreatment directionright groupTreatment:directionright
groupTreatment           0              1              0                           0.5

यदि डेटा सेट को पूरी तरह से संतुलित किया गया था, तो मैं टाइप III कंट्रास्ट के समान ही होगा (जो नमूनों की देखी गई संख्या से प्रभावित नहीं हैं)।

एक अंतिम टिप्पणी यह ​​है कि केनवर्ड-रोजर पद्धति की 'सुस्ती' मॉडल के पुन: फिट होने के कारण नहीं है, लेकिन क्योंकि इसमें टिप्पणियों / अवशिष्टों के सीमांत विचरण-सहसंयोजक मैट्रिक्स के साथ संगणना शामिल है (इस मामले में 5191x5191) जो नहीं है Satterthwaite की विधि के लिए मामला।

मॉडल 2 के बारे में

जैसा कि मॉडल 2 के लिए स्थिति और अधिक जटिल हो जाती है और मुझे लगता है कि दूसरे मॉडल के साथ चर्चा शुरू करना आसान है जहां मैंने 'शास्त्रीय' बातचीत को शामिल किया है subnumऔर direction:

model3 <- lmer(rt ~ group * direction + (1 | subnum) +
                 (1 | subnum:direction), data = ANT.2)
VarCorr(model3)
 Groups           Name        Std.Dev.  
 subnum:direction (Intercept) 1.7008e-06
 subnum           (Intercept) 4.0100e+01
 Residual                     7.0415e+01

क्योंकि इंटरैक्शन से जुड़ा विचरण अनिवार्य रूप से शून्य है ( subnumयादृच्छिक मुख्य-प्रभाव की उपस्थिति में ), इंटरैक्शन शब्द का स्वतंत्रता, एफ- वैल्यू और पी- वैल्यू के भाजक डिग्री की गणना पर कोई प्रभाव नहीं पड़ता है :

anova(model3, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
                 Sum Sq Mean Sq NumDF DenDF F value Pr(>F)
group           12065.3 12065.3     1    18  2.4334 0.1362
direction        1951.8  1951.8     1  5169  0.3936 0.5304
group:direction 11552.2 11552.2     1  5169  2.3299 0.1270

हालाँकि, यदि हम सभी संबंधित SSQ को हटा देते हैं subnum:direction, subnumतो इसके लिए एन्क्लोज़िंग त्रुटि स्ट्रैटम subnumहैsubnum:direction

model4 <- lmer(rt ~ group * direction +
                 (1 | subnum:direction), data = ANT.2)

अब के लिए प्राकृतिक त्रुटि अवधि group, directionऔर group:directionहै subnum:directionऔर साथ nlevels(with(ANT.2, subnum:direction))= 40 और चार मापदंडों उन शब्दों के लिए स्वतंत्रता का हर डिग्री के बारे में 36 होना चाहिए:

anova(model4, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
                 Sum Sq Mean Sq NumDF  DenDF F value  Pr(>F)  
group           24004.5 24004.5     1 35.994  4.8325 0.03444 *
direction          50.6    50.6     1 35.994  0.0102 0.92020  
group:direction   273.4   273.4     1 35.994  0.0551 0.81583  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

इन F -tests को 'संतुलित-सही' F -ests के साथ भी लगाया जा सकता है :

an4 <- anova(lm(rt ~ group*direction + subnum:direction, data=ANT.2))
an4[1:3, "F value"] <- an4[1:3, "Mean Sq"] / an4[4, "Mean Sq"]
an4[1:3, "Pr(>F)"] <- pf(an4[1:3, "F value"], 1, 36, lower.tail = FALSE)
an4
Analysis of Variance Table

Response: rt
                   Df   Sum Sq Mean Sq F value Pr(>F)    
group               1   994365  994365  4.6976 0.0369 *  
direction           1     1568    1568  0.0074 0.9319    
group:direction     1    10795   10795  0.0510 0.8226    
direction:subnum   36  7620271  211674 42.6137 <2e-16 ***
Residuals        5151 25586484    4967                   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

अब Model2 की ओर रुख:

model2 <- lmer(rt ~ group * direction + (direction | subnum), data = ANT.2)

यह मॉडल 2x2 विचरण-कोवरियन मैट्रिक्स के साथ एक जटिल जटिल यादृच्छिक-प्रभाव सहसंयोजक संरचना का वर्णन करता है। डिफ़ॉल्ट पैरामीटर से निपटना आसान नहीं है और हम मॉडल के पुन: पैरामीटर के साथ बेहतर हैं:

model2 <- lmer(rt ~ group * direction + (0 + direction | subnum), data = ANT.2)

यदि हम तुलना model2करते हैं model4, तो उनके पास समान रूप से कई यादृच्छिक-प्रभाव हैं; प्रत्येक के लिए 2 subnum, यानी कुल मिलाकर 2 * 20 = 40। जबकि model4सभी 40 यादृच्छिक प्रभावों के लिए एक एकल विचरण पैरामीटर model2निर्धारित करता है , यह निर्धारित करता है कि यादृच्छिक प्रभाव के प्रत्येक subnum-चरण में एक 2x2 विचरण-सहसंयोजक मैट्रिक्स के साथ द्वि-सामान्य सामान्य वितरण है, जिसके पैरामीटर दिए गए हैं

VarCorr(model2)
 Groups   Name           Std.Dev. Corr 
 subnum   directionleft  38.880        
          directionright 41.324   1.000
 Residual                70.405        

यह ओवर-फिटिंग को इंगित करता है, लेकिन चलो एक और दिन के लिए बचाते हैं। महत्वपूर्ण बात यह है कि यहाँ है model4की एक विशेष दर-मामला है model2 और कि modelहै भी का एक विशेष मामला model2। शिथिल (और सहज रूप से) बोलने (direction | subnum)में मुख्य प्रभाव के subnum साथ-साथ बातचीत के साथ जुड़े बदलाव को शामिल या पकड़ लिया जाता है direction:subnum। यादृच्छिक प्रभावों के संदर्भ में हम इन दो प्रभावों या संरचनाओं को क्रमशः पंक्तियों और पंक्तियों के बीच भिन्नता को कैप्चर करने के रूप में सोच सकते हैं:

head(ranef(model2)$subnum)
  directionleft directionright
1    -25.453576     -27.053697
2     16.446105      17.479977
3    -47.828568     -50.835277
4     -1.980433      -2.104932
5      5.647213       6.002221
6     41.493591      44.102056

इस मामले में इन यादृच्छिक प्रभाव अनुमानों के साथ-साथ विचरण पैरामीटर अनुमान दोनों का संकेत है कि हमारे पास वास्तव में केवल subnumयहां मौजूद (पंक्तियों के बीच भिन्नता) का यादृच्छिक मुख्य प्रभाव है। यह सब किस ओर जाता है कि Satterthwaite हर में स्वतंत्रता की डिग्री है

anova(model2, type=1)
Type I Analysis of Variance Table with Satterthwaite's method
                 Sum Sq Mean Sq NumDF   DenDF F value Pr(>F)
group           12059.8 12059.8     1  17.998  2.4329 0.1362
direction        1803.6  1803.6     1 125.135  0.3638 0.5475
group:direction 10616.6 10616.6     1 125.136  2.1418 0.1458

इन मुख्य-प्रभाव और बातचीत संरचनाओं के बीच एक समझौता है: समूह DenDF 18 पर रहता है ( subnumडिजाइन द्वारा नेस्टेड ) लेकिन directionऔर group:directionDenDF 36 ( model4) और 5169 ( model) के बीच समझौता कर रहे हैं ।

मुझे नहीं लगता कि यहां कुछ भी इंगित करता है कि Satterthwaite सन्निकटन (या इसके कार्यान्वयन lmerTest में ) दोषपूर्ण है।

केनवर्ड-रोजर विधि के साथ समकक्ष तालिका देता है

anova(model2, type=1, ddf="Ken")
Type I Analysis of Variance Table with Kenward-Roger's method
                 Sum Sq Mean Sq NumDF  DenDF F value Pr(>F)
group           12059.8 12059.8     1 18.000  2.4329 0.1362
direction        1803.2  1803.2     1 17.987  0.3638 0.5539
group:direction 10614.7 10614.7     1 17.987  2.1414 0.1606

यह आश्चर्य की बात नहीं है कि KR और Satterthwaite अलग हो सकते हैं लेकिन सभी व्यावहारिक उद्देश्यों के लिए p -values में अंतर मिनट है। ऊपर मेरे विश्लेषण दर्शाता है कि DenDFके लिए directionऔर group:direction~ 36 की तुलना में छोटे और शायद यह देखते हुए कि हम मूल रूप से केवल के यादृच्छिक मुख्य प्रभाव है की तुलना में बड़ा नहीं होना चाहिए directionमौजूद है, यदि ऐसा है तो कुछ भी मुझे लगता है कि यह एक संकेत है कि के.आर. विधि हो जाता है DenDFबहुत कम इस मामले में। लेकिन ध्यान रखें कि डेटा वास्तव में (group | direction)संरचना का समर्थन नहीं करता है, इसलिए तुलना थोड़ा कृत्रिम है - यह अधिक दिलचस्प होगा यदि मॉडल वास्तव में समर्थित था।


+6, धन्यवाद, बहुत दिलचस्प! एक दो सवाल। (1) मैं "त्रुटि स्ट्रेटम संलग्न करने" के बारे में और कहां पढ़ सकता हूं? मैंने इस शब्द को जाना और यह उत्तर एकमात्र हिट था। अधिक सामान्यतः, आप इन मुद्दों के बारे में जानने के लिए किस साहित्य की सिफारिश करेंगे? (2a) जहां तक ​​मैं समझता हूं, इस डिजाइन के लिए शास्त्रीय RM-ANOVA आपके अनुरूप है model3। हालाँकि, यह subnum:directionपरीक्षण के लिए त्रुटि शब्द के रूप में उपयोग करता है direction। जबकि यहां आप इसे केवल के (1|subnum)रूप में छोड़कर बाहर होने के लिए बाध्य कर सकते हैं model4। क्यों? (2 बी) इसके अलावा, आरएम-एनोवा को डीएफ = 18 के लिए पैदावार directionमिलती है, न कि 36 के रूप में आपको मिलती है model4। क्यों?
अमीबा

मेरे अंक (2 ए + 2 बी) के लिए, देखें summary(aov(rt ~ group*direction + Error(subnum/direction), data=ANT.2))
अमीबा

1
(१) त्रुटि का विषय और किन शर्तों को संलग्न किया गया है, जिसमें किसी दिए गए मॉडल / डिजाइन के लिए अपेक्षित मीन स्क्वायर भावों से स्ट्रेट किया जाता है। यह "मानक" डिजाइन का प्रयोग (DoE) सामग्री है, हालांकि इन अधिक तकनीकी विषयों को अक्सर ऐसे पाठ्यक्रमों के आसान-चलन ("लागू") वेरिएंट में गिरा दिया जाता है। उदाहरण के लिए ch 11 और 12 को देखें । एक परिचय के लिए users.stat.umn.edu/~gary/book/fcdae.pdf । मैंने डीसी मॉन्टगोमरी के समकक्ष पाठ और (हाल ही में और अफसोस के) देर से प्रोफेसर हेनरिक स्प्लिड से व्यापक अतिरिक्त सामग्री से विषय सीखा।
रूण एच क्रिस्टेंसेन

1
... Searle et al द्वारा अधिक गहन उपचार के लिए Variance Components (1992 और 2006) एक क्लासिक है।
रूण एच क्रिस्टेंसेन

आह, हां, मुझे यह देखना चाहिए था कि: अगर हमारे पास एक मॉडल है जिसमें दोनों शून्य हैं subnumऔर subnum:directionफिर anova(lm(rt2 ~ group * direction + subnum + subnum:direction, data = ANT.2)) तीनों कारकों के लिए 18 डीएफ देता है और यही केआर-विधि चुनता है। यह पहले से ही देखा जा सकता है model3जहां केआर अंतःक्रियात्मक विचरण शून्य होने पर भी सभी शब्दों के लिए डिज़ाइन-आधारित 18 डीएफ देता है, जबकि सटरथवेट लुप्त होने वाले विचरण शब्द को पहचानता है और तदनुसार डीएफ को समायोजित करता है ...
रूण एच क्रिस्टेन्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.