मिश्रित मॉडल (यादृच्छिक प्रभाव के रूप में विषय) की तुलना एक साधारण रैखिक मॉडल (एक निश्चित प्रभाव के रूप में विषय)


10

मैं डेटा के एक बड़े सेट पर कुछ विश्लेषण पूरा कर रहा हूं। मैं काम के पहले हिस्से में इस्तेमाल किए गए रैखिक मॉडल को लेना चाहूंगा और एक रैखिक मिश्रित मॉडल (LME) का उपयोग करके इसे फिर से फिट करूंगा। एलएमई इस अपवाद के समान होगा कि मॉडल में उपयोग किए जाने वाले चर में से एक यादृच्छिक प्रभाव के रूप में उपयोग किया जाएगा। यह डेटा विषयों के एक छोटे समूह (~ 10) में कई टिप्पणियों (> 1000) से आता है और मुझे पता है कि विषय के प्रभाव को मॉडलिंग एक यादृच्छिक प्रभाव के रूप में बेहतर किया जाता है (यह एक चर है जिसे मैं स्थानांतरित करना चाहता हूं)। आर कोड की तरह दिखेगा:

my_modelB <- lm(formula = A ~ B + C + D)    
lme_model <- lme(fixed=A ~ B + C, random=~1|D, data=my_data, method='REML')

सब कुछ ठीक चलता है और परिणाम काफी हद तक समान हैं। यह अच्छा होगा यदि मैं इन दोनों मॉडलों की तुलना करने के लिए RLRsim या AIC / BIC जैसी किसी चीज का उपयोग कर सकता हूं और यह तय कर सकता हूं कि सबसे उपयुक्त कौन सा है। मेरे सहकर्मी एलएमई को रिपोर्ट नहीं करना चाहते हैं क्योंकि चुनने का एक सहज सुलभ तरीका नहीं है जो "बेहतर" है, भले ही मुझे लगता है कि एलएमई अधिक उपयुक्त मॉडल है। कोई सुझाव?

जवाबों:


6

यह @ ऑसम के उत्तर में जोड़ना है क्योंकि यह एक टिप्पणी के रूप में पोस्ट करने के लिए बहुत लंबा है। मैं A ~ B + Cआपके अशक्त मॉडल के रूप में व्यवहार करूंगा ताकि आप Dएक नेस्टेड मॉडल सेटअप में एक स्थिर यादृच्छिक अवरोधन के सांख्यिकीय महत्व का आकलन कर सकें । जैसा कि ओट्राम ने कहा है, , और संभावना अनुपात परीक्षण आँकड़ा (LRT) आवश्यक रूप से asymptotically वितरित नहीं होने पर नियमितता की शर्तों का उल्लंघन किया जाता है । मुझे सिखाया गया था कि LRT को बूटस्ट्रैप करना था (जिसका बूटस्ट्रैप वितरण संभवत: नहीं होगा ) पैराट्रैक्टली और एक बूटस्ट्रैप पी-मान की गणना इस तरह करें:H0:σ2=0χ2χ2

library(lme4)
my_modelB <- lm(formula = A ~ B + C)
lme_model <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
lrt.observed <- as.numeric(2*(logLik(lme_model) - logLik(my_modelB)))
nsim <- 999
lrt.sim <- numeric(nsim)
for (i in 1:nsim) {
    y <- unlist(simulate(mymodlB))
    nullmod <- lm(y ~ B + C)
    altmod <- lmer(y ~ B + C + (1|D), data=my_data, REML=F)
    lrt.sim[i] <- as.numeric(2*(logLik(altmod) - logLik(nullmod)))
}
mean(lrt.sim > lrt.observed) #pvalue

बूटस्ट्रैप्ड LRT का अनुपात अधिक चरम है कि मनाया LRT पी-मूल्य है।


मेरा उत्तर पूरा करने के लिए धन्यवाद। इसके अलावा, कभी-कभी लोग परीक्षण सांख्यिकीय के लिए ची-वर्ग वितरण के बजाय ची-वर्गों के मिश्रण का उपयोग करते हैं।
समुद्रम

@ocram +1 आपकी टिप्पणी के बारे में निर्णय लेने के लिए कि क्या परिवर्तनशील के रूप में परिवर्तन को अलग से तय किया गया है या नहीं। @MudPhud यदि आपका PI समस्या को नहीं समझता है और पी-मान पर जोर देता है, तो हो सकता है कि आप उसे यादृच्छिक प्रभाव के परीक्षण का परिणाम दिखाए (जिसे आप राइट-अप में वैसे भी शामिल करेंगे)।
लॉकऑफ़

कोड के लिए धन्यवाद। जब मैंने इसे चलाया, तो परिणामित बूटस्ट्रैप में से कोई भी नहीं है LRTs अवलोकन से अधिक हैं, तो इसका मतलब है कि मैं यादृच्छिक प्रभाव के बिना lm से चिपक सकता हूं या यहां तक ​​कि मूल चर भी नहीं फेंका जा सकता है।
मृदूप

@ मद्पुध: क्या आपको कोई त्रुटि मिली? lrt.simयह सुनिश्चित करने के लिए टाइप करने का प्रयास करें कि वे सभी शून्य नहीं हैं, जिस स्थिति में सबसे अधिक संभावना अपराधी होगी कि आपके पास पैकेज lme4स्थापित नहीं है ।
लॉकऑफ़

वे मनाया (63.95) की तुलना में 0, बस बहुत छोटे (~ 1e-6) नहीं हैं।
मुद्दह

2

जब आप lme फ़ंक्शन का उपयोग करते हैं, तो मुझे यह पता लगाना पूरी तरह से निश्चित नहीं है कि कौन सा मॉडल फिट है। (मुझे लगता है कि यादृच्छिक प्रभाव शून्य मतलब के साथ एक सामान्य वितरण का पालन करने के लिए माना जाता है?)। हालाँकि, रैखिक मॉडल मिश्रित मॉडल का एक विशेष मामला है जब यादृच्छिक प्रभाव का विचरण शून्य होता है। यद्यपि कुछ तकनीकी कठिनाइयाँ मौजूद हैं (क्योंकि विचरण के लिए पैरामीटर स्पेस की सीमा में है) यह बनाम का परीक्षण करना संभव है ...0H0:variance=0H1:variance>0

संपादित करें

भ्रम से बचने के लिए: ऊपर उल्लिखित परीक्षण का उपयोग कभी-कभी यह तय करने के लिए किया जाता है कि यादृच्छिक प्रभाव महत्वपूर्ण है या नहीं ... लेकिन यह तय करने के लिए कि क्या इसे एक निश्चित प्रभाव में बदलना चाहिए या नहीं।


सवाल यह है: क्या यह तय करने के लिए परीक्षण हैं कि क्या चर को मिश्रित प्रभाव या यादृच्छिक प्रभाव के रूप में चित्रित किया जाना चाहिए? अन्यथा आप आपके द्वारा वर्णित परीक्षण कर सकते हैं और फिर ची-स्क्वायर डिस्ट के साथ परीक्षण कर सकते हैं (मुझे यकीन नहीं है कि उपयुक्त परीक्षण क्या होगा)।
मुदापद

2
@MudPhud: एक चर को एक निश्चित या एक यादृच्छिक प्रभाव के रूप में मॉडलिंग करना वास्तव में विश्लेषण से पहले तय किया जाना चाहिए, जब अध्ययन की योजना बनाई गई हो। यह, विशेष रूप से, आपके निष्कर्ष के दायरे पर निर्भर करता है। यादृच्छिक प्रभाव अधिक सामान्यता की अनुमति देते हैं। यह कुछ तकनीकी कठिनाइयों से भी बच सकता है। उदाहरण के लिए, मापदंडों की संख्या बढ़ने पर एसिम्पोटिक्स टूट सकता है, क्योंकि यह मामला है जब बहुत सारे स्तरों के साथ एक श्रेणीगत चर को एक निश्चित चर माना जाता है।
समुद्रम

मैं सहमत हूं, लेकिन जब मैंने अपने पीआई को यह समझाने की कोशिश की तो वह बस पलट गया और किसी तरह का पी-वैल्यू मांगा। मैं इस विश्लेषण को एक पांडुलिपि में शामिल करना चाहता हूं, लेकिन अगर यह अधिक ठोस औचित्य नहीं है तो वह इसे नहीं रखेगा।
मुदापद

1
@MudPhud: मेरे ज्ञान का सबसे अच्छा करने के लिए, इस तरह के निर्णय के लिए कोई मूल्य नहीं है। यदि चुने गए विशिष्ट स्तरों के प्रभाव पर ब्याज केंद्र हैं, तो इसे निश्चित माना जाना चाहिए। यदि उपलब्ध कारक स्तरों को बड़ी आबादी से यादृच्छिक नमूने के रूप में देखा जाता है और बड़ी आबादी के लिए इन-इंफ़ेक्शन चाहते हैं, तो प्रभाव यादृच्छिक होना चाहिए।
ओकराम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.