रैखिक मिश्रित-प्रभाव मॉडलिंग के एक विशेष मामले के रूप में युग्मित टी-परीक्षण


20

हम जानते हैं कि एक युग्मित t -est केवल एक तरफ़ा दोहराया-माप (या भीतर-विषय) ANOVA के साथ-साथ रैखिक मिश्रित-प्रभाव मॉडल का एक विशेष मामला है, जिसे lme के साथ प्रदर्शित किया जा सकता है () आर में nlme पैकेज का कार्य करता है जैसा की नीचे दिखाया गया।

#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)

# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")

जब मैं निम्नलिखित युग्मित परीक्षण चलाऊं:

t.test(x1, x2, paired = TRUE)

मुझे यह परिणाम मिला (आप यादृच्छिक जनरेटर के कारण एक अलग परिणाम प्राप्त करेंगे):

t = -2.3056, df = 9, p-value = 0.04657

एनोवा दृष्टिकोण के साथ हम एक ही परिणाम प्राप्त कर सकते हैं:

summary(aov(y ~ x + Error(subj/x), myDat))

# the F-value below is just the square of the t-value from paired t-test:
          Df  F value Pr(>F)
x          1  5.3158  0.04657

अब मैं निम्नलिखित मॉडल के साथ lme में एक ही परिणाम प्राप्त कर सकता हूं, दो स्थितियों के लिए एक सकारात्मक-निश्चित सममितीय सहसंबंध मैट्रिक्स:

summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))

# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115  9 -0.7918878  0.4488
# xx2          1.3325786 0.5779727  9  2.3056084  0.0466

या अन्य मॉडल, दो स्थितियों के सहसंबंध मैट्रिक्स के लिए एक यौगिक समरूपता मानते हुए:

summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))

# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431  9 -0.618428  0.5516
# xx2          1.3325786 0.5779727  9  2.305608  0.0466

जोड़े गए टी-टेस्ट और एक-तरफ़ा दोहराया-उपाय एनोवा के साथ, मैं पारंपरिक सेल माडल मॉडल को नीचे लिख सकता हूं

Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10

जहाँ मैं अनुक्रमणिका स्थिति, j अनुक्रमणिका विषय, Y ij अनुक्रिया चर है, μ समग्र माध्य के लिए निश्चित प्रभाव के लिए स्थिर है, α i दशा के लिए निश्चित प्रभाव है, is j निम्नलिखित विषय के लिए यादृच्छिक प्रभाव है N (0,,) पी 2 ) ( 2 पी 2 जनसंख्या विचरण है), और resid आईजे एन (0, σ 2 ) के बाद अवशिष्ट है ( ) 2 भीतर विषय विचरण है)।

मैंने सोचा था कि ऊपर का माध्य माडल मॉडल lme मॉडल के लिए उचित नहीं होगा, लेकिन परेशानी यह है कि मैं दो lme () सहसंबंध संरचना धारणा के लिए एक उचित मॉडल के साथ नहीं आ सकता। इसका कारण यह है कि लैम मॉडल में सेल के ऊपर माडल मॉडल की तुलना में यादृच्छिक घटकों के लिए अधिक पैरामीटर हैं। कम से कम लैम मॉडल बिल्कुल वही एफ-मूल्य, स्वतंत्रता की डिग्री और पी-मूल्य प्रदान करता है, जो कि जीएलएस नहीं कर सकता है। अधिक विशेष रूप से gls इस तथ्य के कारण गलत DFs देता है कि यह इस तथ्य के लिए जिम्मेदार नहीं है कि प्रत्येक विषय में दो अवलोकन हैं, जो बहुत फुलाया DFs के लिए अग्रणी है। रेम मॉडल सबसे अधिक संभावना है यादृच्छिक प्रभावों को निर्दिष्ट करने में अतिपरिवर्तन है, लेकिन मुझे नहीं पता कि मॉडल क्या है और पैरामीटर क्या हैं। इसलिए मुद्दा अभी भी मेरे लिए अनसुलझा है।


2
यकीन नहीं हो रहा है कि आप क्या पूछ रहे हैं। आपके द्वारा लिखा गया मॉडल यादृच्छिक प्रभाव मॉडल के लिए मॉडल है; सहसंबंध संरचना यादृच्छिक प्रभाव से प्रेरित है।
हारून - मोनिका

@ एरोन: सेल माडल में रैंडम-इफेक्ट arj को N (0, σp2) का अनुसरण करना चाहिए। मेरा भ्रम है, इस शब्द को (केवल एक पैरामीटर ?p2 के साथ) या तो यौगिक समरूपता या लैम मॉडल में एक सरल सममित मैट्रिक्स द्वारा निर्दिष्ट सहसंबंध संरचना के साथ जुड़ा हुआ है?
ब्लूपॉल

जब आप एक ही विषय पर दो अवलोकनों के बीच सहसंबंध की गणना करते हैं, तो सहसंबंध sigma_p ^ 2 / (sigma_p ^ 2 + sigma ^ 2) होता है क्योंकि वे एक ही Beta_j साझा करते हैं। पिनहेइरो / बेट्स p.8 देखें। इसके अलावा, जैसा कि आपने लिखा यादृच्छिक प्रभाव मॉडल यौगिक समरूपता के बराबर है; अन्य सहसंबंध संरचनाएं अधिक जटिल हैं।
हारून -

@ एरॉन: धन्यवाद! मैंने पहले ही इस बारे में पिनेहिरो / बेट्स पुस्तक पढ़ ली है, और अभी भी यादृच्छिक प्रभावों के बारे में विशेष जानकारी नहीं दे सका है। P.160-161 में अधिक प्रासंगिक पृष्ठ इसका उदाहरण प्रतीत होते हैं। इसके अलावा, यौगिक समरूपता धारणा के साथ lme () से यादृच्छिक-प्रभाव आउटपुट सेल माडल मॉडल में (p2 / (σp2 + )2) के सहसंबंध से सहमत नहीं लगता है। अभी भी मॉडल संरचना के बारे में चकित है।
ब्लूपॉल

खैर, यौगिक समरूपता के लगभग बराबर; सीएस में सहसंबंध नकारात्मक हो सकता है लेकिन यादृच्छिक प्रभावों के साथ नहीं। शायद यहीं से आपका अंतर पैदा होता है। देखविवरण के लिए आँकड़े ।stackexchange.com/a/14185/3601
आरोन -

जवाबों:


16

मॉडलों की समानता को एक ही व्यक्ति से दो टिप्पणियों के बीच सहसंबंध की गणना करके देखा जा सकता है:

Yमैंजे=μ+αमैं+βजे+εमैंजेβजे~एन(0,σपी2)εमैंजे~एन(0,σ2)सीv(yमैं,yजे)=सीv(μ+αमैं+β+εमैं,μ+αजे+β+εजे)=सीv(β,β)=σपी2वीआर(yमैं)=वीआर(yजे)=σपी2+σ2σपी2/(σपी2+σ2)

ध्यान दें कि हालांकि मॉडल काफी समकक्ष नहीं हैं क्योंकि यादृच्छिक प्रभाव मॉडल सहसंबंध को सकारात्मक बनाता है। सीएस मॉडल और टी-टेस्ट / एनोवा मॉडल नहीं है।

संपादित करें: दो अन्य अंतर भी हैं। सबसे पहले, सीएस और यादृच्छिक प्रभाव मॉडल यादृच्छिक प्रभाव के लिए सामान्यता मानते हैं, लेकिन टी-टेस्ट / एनोवा मॉडल नहीं करता है। दूसरे, सीएस और यादृच्छिक प्रभाव मॉडल अधिकतम संभावना का उपयोग करते हुए फिट होते हैं, जबकि एनोवा औसत वर्ग का उपयोग करके फिट होता है; जब सब कुछ संतुलित होता है तो वे सहमत होंगे, लेकिन जरूरी नहीं कि अधिक जटिल परिस्थितियों में। अंत में, मैं एफ / डीएफ / पी मूल्यों का उपयोग करने से सावधान रहूंगा, जो विभिन्न मॉडल से सहमत हैं कि मॉडल कितना सहमत हैं; अधिक जानकारी के लिए df पर डग बेट्स के प्रसिद्ध पेंच देखें। (END EDIT)

आपके Rकोड के साथ समस्या यह है कि आप सहसंबंध संरचना को ठीक से निर्दिष्ट नहीं कर रहे हैं। आपको सहसंबंध संरचना के glsसाथ उपयोग करने की आवश्यकता है corCompSymm

डेटा उत्पन्न करें ताकि विषय प्रभाव हो:

set.seed(5)
x <- rnorm(10)
x1<-x+rnorm(10)
x2<-x+1 + rnorm(10)
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), 
                    rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")

फिर यहां बताया गया है कि आप यादृच्छिक प्रभावों और यौगिक समरूपता मॉडल को कैसे फिट करेंगे।

library(nlme)
fm1 <- lme(y ~ x, random=~1|subj, data=myDat)
fm2 <- gls(y ~ x, correlation=corCompSymm(form=~1|subj), data=myDat)

यादृच्छिक प्रभाव मॉडल से मानक त्रुटियां हैं:

m1.varp <- 0.5453527^2
m1.vare <- 1.084408^2

और सीएस मॉडल से सहसंबंध और अवशिष्ट विचरण है:

m2.rho <- 0.2018595
m2.var <- 1.213816^2

और वे उसी के बराबर हैं जो अपेक्षित है:

> m1.varp/(m1.varp+m1.vare)
[1] 0.2018594
> sqrt(m1.varp + m1.vare)
[1] 1.213816

अन्य सहसंबंध संरचनाएं आमतौर पर यादृच्छिक प्रभावों के साथ फिट नहीं होती हैं, लेकिन केवल वांछित संरचना को निर्दिष्ट करके; एक सामान्य अपवाद एआर (1) + यादृच्छिक प्रभाव मॉडल है, जिसमें एक यादृच्छिक प्रभाव होता है और एक ही यादृच्छिक प्रभाव पर टिप्पणियों के बीच एआर (1) सहसंबंध होता है।

EDIT2: जब मैं तीन विकल्प फिट करता हूं, तो मुझे बिल्कुल वही परिणाम मिलते हैं, सिवाय इसके कि gls ब्याज की अवधि के लिए df का अनुमान लगाने की कोशिश नहीं करते।

> summary(fm1)
...
Fixed effects: y ~ x 
                 Value Std.Error DF   t-value p-value
(Intercept) -0.5611156 0.3838423  9 -1.461839  0.1778
xx2          2.0772757 0.4849618  9  4.283380  0.0020

> summary(fm2)
...
                 Value Std.Error   t-value p-value
(Intercept) -0.5611156 0.3838423 -1.461839  0.1610
xx2          2.0772757 0.4849618  4.283380  0.0004

> m1 <- lm(y~ x + subj, data=myDat)
> summary(m1)
...
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  -0.3154     0.8042  -0.392  0.70403   
xx2           2.0773     0.4850   4.283  0.00204 **

(इंटरसेप्ट यहां अलग है क्योंकि डिफ़ॉल्ट कोडिंग के साथ, यह सभी विषयों का मतलब नहीं है, बल्कि पहले विषय का मतलब है।)

यह ध्यान रखना भी आवश्यक है कि नया lme4पैकेज समान परिणाम देता है, लेकिन पी-मान की गणना करने का प्रयास भी नहीं करता है।

> mm1 <- lmer(y ~ x + (1|subj), data=myDat)
> summary(mm1)
...
            Estimate Std. Error t value
(Intercept)  -0.5611     0.3838  -1.462
xx2           2.0773     0.4850   4.283

मदद के लिए एक बार फिर से धन्यवाद! मैं इस भाग को कोशिका माध्य मॉडल के दृष्टिकोण से जानता हूं। हालांकि, यौगिक समरूपता के साथ lme () से निम्न परिणाम के साथ: यादृच्छिक प्रभाव: सूत्र: ~ x - 1 | उप संरचना: यौगिक समरूपता StdDev xx1 1.1913363 xx2 1.1913363 संवाददाता: -0.036 अवशिष्ट 0.4466733। मैं अभी भी सेल माडल मॉडल के साथ इन नंबरों को समेट नहीं सकता। शायद आप आगे इन नंबरों को छाँटने में मेरी मदद कर सकते हैं?
ब्लू स्टार

इसके अलावा, अन्य सहसंबंध संरचनाओं जैसे सरल सममित मैट्रिक्स के साथ मॉडल तैयार करने के बारे में कोई विचार?
ब्लूपॉल

समझा! मुझे दूसरे सूत्र में आपकी प्रतिक्रिया को और ध्यान से पढ़ना चाहिए था। मैंने पहले gls () का उपयोग करने के बारे में सोचा था, लेकिन सहसंबंध विनिर्देश का पता लगाने में विफल रहा। यह दिलचस्प है कि यादृच्छिक प्रभाव के लिए यौगिक समरूपता संरचना के साथ lme () अभी भी एक ही टी-मूल्य प्रदान करता है, लेकिन ऐसा लगता है कि यादृच्छिक प्रभावों के लिए संस्करण सीधे व्याख्या योग्य नहीं हैं। तुम्हारी मदद के लिए शुक्रिया!
ब्लूपॉल

कुछ 2 विचार के बाद, मुझे लगता है कि मेरा मूल भ्रम अभी भी अनसुलझा है। हां, सहसंबंध संरचना को प्रदर्शित करने के लिए gls का उपयोग किया जा सकता है और इसका मतलब चुकता रस्मों के रूप में हो सकता है, लेकिन इसके नीचे का मॉडल युग्मित-टी परीक्षण (या सामान्य रूप से दोहराए गए उपाय-एनोवा) के समान नहीं है, और ऐसा मूल्यांकन है आगे गलत DFs और gl से पी-मूल्य द्वारा समर्थित है। इसके विपरीत, यौगिक समरूपता के साथ मेरी lme कमांड समान F, DFs और पी-वैल्यू प्रदान करता है। मेरे द्वारा पोस्ट की गई एकमात्र बात यह है कि मेरे मूल पोस्ट में बताया गया है कि कैसे lme मॉडल को मानकीकृत किया जाता है। कोई मदद वहाँ?
ब्लूपॉल

यकीन नहीं होता कि आप कैसे मदद करेंगे। क्या आप लिख सकते हैं कि आपको क्या लगता है कि दो अलग-अलग मॉडल हैं? कुछ गलत है कि आप उनमें से एक के बारे में कैसे सोच रहे हैं।
हारून - मोनिका

3

आप Kenward-Roger df सन्निकटन के साथ p मान वापस करने के लिए mixedपैकेज में फ़ंक्शन का उपयोग करने पर भी विचार कर सकते हैं afex, जो एक युग्मित परीक्षण के रूप में समान p मान लौटाता है:

library(afex)
mixed(y ~ x + (1|subj), type=3,method="KR",data=myDat) 

या

library(lmerTest)
options(contrasts=c('contr.sum', 'contr.poly'))
anova(lmer(y ~ x + (1|subj),data=myDat),ddf="Kenward-Roger")
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.