यादृच्छिक प्रभावों वाले मॉडल के लिए lmer के साथ विचरण घटकों का अनुमान कैसे लगाएं और उनकी तुलना lme परिणामों से करें


14

मैंने एक प्रयोग किया जहां मैंने दो अलग-अलग स्रोत आबादी से आने वाले विभिन्न परिवारों को उठाया। प्रत्येक परिवार को दो उपचारों में से एक सौंपा गया था। प्रयोग के बाद मैंने प्रत्येक व्यक्ति पर कई लक्षण मापे। उपचार या स्रोत के प्रभाव के साथ-साथ उनकी बातचीत के परीक्षण के लिए, मैंने यादृच्छिक कारक के रूप में परिवार के साथ रैखिक मिश्रित प्रभाव मॉडल का उपयोग किया, अर्थात

lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")

अब तक बहुत अच्छा है, अब मुझे सापेक्ष भिन्नता घटकों की गणना करनी है, अर्थात भिन्नता का प्रतिशत जिसे उपचार या स्रोत के साथ-साथ बातचीत द्वारा समझाया गया है।

यादृच्छिक प्रभाव के बिना, मैं आसानी से प्रत्येक कारक द्वारा बताए गए विचरण की गणना करने के लिए वर्गों (एसएस) के योगों का उपयोग कर सकता था। लेकिन एक मिश्रित मॉडल के लिए (एमएल अनुमान के साथ), कोई एसएस नहीं हैं, इसलिए मैंने सोचा कि मैं उपचार और स्रोत का उपयोग यादृच्छिक प्रभावों के रूप में भी कर सकता हूं, ताकि विचरण का अनुमान लगाया जा सके।

lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")

हालाँकि, कुछ मामलों में, lme अभिसरण नहीं करता है, इसलिए मैंने lme4 पैकेज से lmer का उपयोग किया:

lmer(Trait~1+(Treatment*Source|Family),data=DATA)

जहां मैं सारांश फ़ंक्शन का उपयोग करके मॉडल से भिन्नता निकालता हूं:

model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]

मुझे वैरिकॉयर फ़ंक्शन के समान मान मिलते हैं। मैं तो कुल मूल्यों के रूप में राशि लेने वाले भिन्नता के वास्तविक प्रतिशत की गणना करने के लिए इन मूल्यों का उपयोग करता हूं।

जहां मैं संघर्ष कर रहा हूं, प्रारंभिक लैम मॉडल (उपचार और स्रोत के रूप में निश्चित प्रभाव के साथ) से परिणामों की व्याख्या के साथ और विचरण घटकों (यादृच्छिक प्रभाव के रूप में स्रोत और उपचार के साथ) का अनुमान लगाने के लिए यादृच्छिक मॉडल है। मैं ज्यादातर मामलों में पाया गया कि प्रत्येक कारक द्वारा समझाया गया विचरण का प्रतिशत निश्चित प्रभाव के महत्व के अनुरूप नहीं है।

उदाहरण के लिए विशेषता एचडी के लिए, प्रारंभिक लैम बातचीत के लिए एक प्रवृत्ति के साथ-साथ उपचार के लिए एक महत्व का सुझाव देता है। एक पिछड़ी प्रक्रिया का उपयोग करते हुए, मुझे लगता है कि उपचार में महत्वपूर्ण प्रवृत्ति के करीब है। हालांकि, विचरण घटकों का आकलन करते हुए, मुझे लगता है कि स्रोत में सबसे अधिक विचरण है, जो कुल विचरण का 26.7% है।

लमे:

anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
                                      numDF denDF  F-value p-value
(Intercept)                                1   426 0.044523  0.8330
as.factor(Treatment)                       1   426 5.935189  0.0153
as.factor(Source)                          1    11 0.042662  0.8401
as.factor(Treatment):as.factor(Source)     1   426 3.754112  0.0533

और लमर:

summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML 
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family) 
   Data: regrexpdat 
    AIC    BIC logLik deviance REMLdev
 -103.5 -54.43  63.75   -132.5  -127.5
Random effects:
 Groups   Name                                      Variance  Std.Dev. Corr                 
 Family   (Intercept)                               0.0113276 0.106431                      
          as.factor(Treatment)                      0.0063710 0.079819  0.405               
          as.factor(Source)                         0.0235294 0.153393 -0.134 -0.157        
          as.factor(Treatment)L:as.factor(Source)   0.0076353 0.087380 -0.578 -0.589 -0.585 
 Residual                                           0.0394610 0.198648                      
Number of obs: 441, groups: Family, 13

Fixed effects:
            Estimate Std. Error t value
(Intercept) -0.02740    0.03237  -0.846

इसलिए मेरा सवाल यह है कि क्या मैं जो कर रहा हूं, क्या वह सही है? या क्या मुझे प्रत्येक कारक (अर्थात उपचार, स्रोत और उनकी बातचीत) द्वारा बताए गए विचरण की मात्रा का अनुमान लगाने के लिए दूसरे तरीके का उपयोग करना चाहिए। उदाहरण के लिए, क्या प्रभाव आकार जाने के लिए अधिक उपयुक्त तरीका होगा?


स्रोत कारक के रूप में उपचार कारक में आजादी के कई डिग्री 40x (pseudoreplication?) है। यह निस्संदेह उपचार पी-मूल्य नीचे चला रहा है।

जवाबों:


1

एक मॉडल के प्रत्येक कारक के सापेक्ष योगदान को निर्धारित करने का एक सामान्य तरीका है कि कारक को हटा दिया जाए और ची-स्क्वेर्ड टेस्ट जैसी किसी चीज के साथ सापेक्ष संभावना की तुलना की जाए:

pchisq(logLik(model1) - logLik(model2), 1)

जिस तरह से कार्यों के बीच की संभावना की गणना की जाती है, वह थोड़ा अलग हो सकता है, मैं आमतौर पर केवल उसी विधि के बीच तुलना करूंगा।


1
क्या यह नहीं होना चाहिए 1-pchisq(logLik(model1) - logLik(model2), 1)?
user81411
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.