आर में lmer / lme मिश्रित मॉडल की मान्यताओं की जाँच करना


25

मैंने एक दोहराया डिजाइन चलाया, जिसके तहत मैंने तीन अलग-अलग कार्यों में 30 पुरुषों और 30 महिलाओं का परीक्षण किया। मैं यह समझना चाहता हूं कि पुरुषों और महिलाओं का व्यवहार अलग-अलग है और यह कैसे कार्य पर निर्भर करता है। मैंने इसकी जाँच के लिए lmer और lme4 पैकेज दोनों का उपयोग किया, हालाँकि, मैं किसी भी विधि के लिए मान्यताओं की जाँच करने की कोशिश कर रहा हूँ। मेरे द्वारा चलाया गया कोड है

lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)

मैंने जाँच की कि क्या इंटरैक्शन के बिना सरल मॉडल के साथ तुलना करके और एक एनोवा को चलाकर बातचीत सबसे अच्छा मॉडल था:

lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)

Q1: एक रेखीय मिश्रित मॉडल में इन श्रेणीबद्ध भविष्यवाणियों का उपयोग करना ठीक है?
Q2: क्या मैं सही ढंग से समझता हूं कि यह ठीक है परिणाम चर ("व्यवहार") को सामान्य रूप से खुद को वितरित करने की आवश्यकता नहीं है (सेक्स / कार्यों के पार)?
Q3: मैं कैसे भिन्नता की एकरूपता की जांच कर सकता हूं? एक सरल रैखिक मॉडल के लिए मैं उपयोग करता हूं plot(LM$fitted.values,rstandard(LM))plot(reside(lm.base1))पर्याप्त उपयोग कर रहा है ?
Q4: सामान्यता के लिए जाँच करने के लिए निम्न कोड का उपयोग कर रहा है ठीक है?

hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)

एक बात जो मैंने देखी, वह यह भी है कि lme4 का जो संस्करण मैं उपयोग कर रहा था, वह सबसे हाल का नहीं था और इसलिए सरल प्लॉट (myModel.lm) काम नहीं कर रहा था, शायद यह अन्य पाठकों के लिए उपयोगी है ..
crazjo

जवाबों:


26

Q1: हाँ - किसी भी प्रतिगमन मॉडल की तरह।

Q2: सामान्य रैखिक मॉडल की तरह, आपके परिणाम चर को सामान्य रूप से एक univariate चर के रूप में वितरित करने की आवश्यकता नहीं है। हालांकि, एलएमई मॉडल मानते हैं कि मॉडल के अवशेष सामान्य रूप से वितरित किए जाते हैं। इसलिए मॉडल में एक परिवर्तन या वज़न जोड़ना इस बात का ध्यान रखने का एक तरीका होगा (और निश्चित रूप से नैदानिक ​​भूखंडों के साथ जांचना)।

Q3: plot(myModel.lme)

Q4: qqnorm(myModel.lme, ~ranef(., level=2))। यह कोड आपको यादृच्छिक स्तरों के प्रत्येक स्तर के लिए QQ प्लॉट बनाने की अनुमति देगा। एलएमई मॉडल मानते हैं कि न केवल क्लस्टर-क्लस्टर अवशिष्टों को सामान्य रूप से वितरित किया जाता है, बल्कि यह कि प्रत्येक स्तर के यादृच्छिक प्रभाव भी हैं। level0, 1, 2 से भिन्न करें ताकि आप चूहे, कार्य और विषय-विषय के अवशेषों की जांच कर सकें।

संपादित करें: मुझे यह भी जोड़ना चाहिए कि सामान्यता ग्रहण करते समय और यह परिवर्तन संभवतया गैर-सामान्य त्रुटियों / यादृच्छिक प्रभावों के साथ समस्याओं को कम करने में मदद करता है, यह स्पष्ट नहीं है कि सभी समस्याओं को वास्तव में हल किया गया है या यह पूर्वाग्रह नहीं है। यदि आपके डेटा में परिवर्तन की आवश्यकता है, तो यादृच्छिक प्रभावों के आकलन के बारे में सतर्क रहें। यहाँ एक कागज यह संबोधित कर रहा है


आपके उत्तर के लिए धन्यवाद। मैं अपने डेटासेट और स्क्रिप्ट को आउटपुट सहित विश्लेषण के लिए साझा करना चाहूंगा कि क्या मैंने किया है जो वास्तव में सही है। क्या स्टैक एक्सचेंज में यह संभव है? इसके अलावा मुझे लगता है कि मैंने गलत यादृच्छिक कारक (1 | चूहा / कार्य) चलाया, क्या यह सिर्फ (1 | चूहा) नहीं होना चाहिए? मैंने तीन कार्यों पर 60rats (प्रत्येक सेक्स के 30) का परीक्षण किया।
19

9
मैंने हाल ही में Q4 के लिए कोड की कोशिश की और मुझे 'S4' प्रकार के ऑब्जेक्ट के बारे में एक त्रुटि मिली, जो सब्सेटेबल नहीं है। क्या वह कोड लैम पैकेज के साथ फिट किए गए मॉडल के लिए था? क्या lme4 के साथ के बारे में?
एमुद्रक

Q4 के संबंध में, उन भूखंडों को बनाने वाले लोगों को यह ध्यान रखना होगा कि उत्पादित किए गए प्रत्येक भूखंड के लिए N कुल से काफी छोटा होगा और इसलिए भूखंड बहुत अधिक परिवर्तनशील होंगे। उनसे अपेक्षा न करें कि वे सामान्य रूप से समग्र रूप से वितरित किए गए समान रूप से देखें।
जॉन

14

आप बहु-स्तरीय मॉडल के आसपास की धारणाओं के बारे में काफी गुमराह लगते हैं। डेटा में विचरण की समरूपता की कोई धारणा नहीं है, बस अवशिष्ट लगभग सामान्य रूप से वितरित किया जाना चाहिए। और सभी समय के प्रतिगमन में श्रेणीबद्ध भविष्यवाणियों का उपयोग किया जाता है (आर में अंतर्निहित फ़ंक्शन जो एक एनोवा चलाता है रेखीय प्रतिगमन कमांड है)।

जांच मान्यताओं के विवरण के लिए पिनहेइरो और बेट्स बुक (पृष्ठ 174, खंड 4.3.1) देखें। इसके अलावा, यदि आप lme4 (जो कि पुस्तक आसपास नहीं लिखी गई है) का उपयोग करने की योजना बना रहे हैं, तो आप एक lmerमॉडल के साथ प्लॉट का उपयोग करके उनके भूखंडों को दोहरा सकते हैं ( ?plot.merMod)।

जल्दी से सामान्यता की जाँच करने के लिए यह बस होगा qqnorm(resid(myModel))


आपके कमेंट के लिए धन्यवाद। क्या आप lme4 विधि पर lmer का उपयोग करने का सुझाव देते हैं? और क्या मैं यह समझने में सही हूं कि प्रतिक्रिया चर को सामान्य रूप से वितरित करने की आवश्यकता नहीं है? मेरे पास पिनेहिरो और बेट्स पुस्तक के माध्यम से एक उचित रीड होगा।
crazjo

इसके अलावा, क्या आप सुनिश्चित हैं कि कई कारकों के साथ मिश्रित मॉडल पर qnnorm (अवशेष (myModel)) चल रहा है?
crazjo

नए lmer फ़ंक्शन में अधिक क्षमताएं और उच्च प्रदर्शन हैं। क्या आपने qnnorm की कोशिश की है? पुस्तक की शुरुआत में सलाह का पालन करें कि इसे कैसे पढ़ें।
जॉन

जो भूखंड मुझे शुरू में अजीब लगा था, संभवत: इसलिए क्योंकि मेरे पास वास्तव में नवीनतम संस्करण नहीं था। यह ध्यान देने के लिए धन्यवाद, यह अब आवश्यकतानुसार काम करता है।
crazjo

12

Q2 के बारे में:

पिनहेइरो और बेट्स की पुस्तक के अनुसार आप निम्नलिखित दृष्टिकोण का उपयोग कर सकते हैं:

" lmeफ़ंक्शन एक weightsतर्क के माध्यम से त्रुटि समूह के भीतर की विषमलैंगिकता के मॉडलिंग की अनुमति देता है। यह विषय in 5.2 में विस्तार से कवर किया जाएगा, लेकिन, अब के लिए, यह पता है कि varIdentविचरण समारोह संरचना प्रत्येक स्तर के प्रत्येक संस्करण के लिए अलग-अलग संस्करण की अनुमति देता है। एक कारक और विषम मॉडल को फिट करने के लिए इस्तेमाल किया जा सकता है [...] "

पिनहेइरो और बेट्स, पी। 177

यदि आप sexइस दृष्टिकोण का उपयोग कर सकते हैं, तो आप दोनों के बीच समान भिन्नताओं की जांच करना चाहेंगे :

plot( lm.base2, resid(., type = "p") ~ fitted(.) | sex,
  id = 0.05, adj = -0.3 )

यदि संस्करण भिन्न हैं, तो आप निम्न तरीके से अपने मॉडल को अपडेट कर सकते हैं:

lm.base2u <- update( lm.base2, weights = varIdent(form = ~ 1 | sex) )
summary(lm.base2u)

इसके अलावा, आपके पास उस robustlmmपैकेज पर एक नज़र हो सकती है जो एक तौल दृष्टिकोण का उपयोग करता है। इस अवधारणा के बारे में कोल्लर की पीएचडी थीसिस खुली पहुंच के रूप में उपलब्ध है ("रैखिक मिश्रित मॉडल का मजबूत अनुमान")। सार बताता है:

"एक नए पैमाने का अनुमान, डिज़ाइन एडेप्टिव स्केल अनुमान, बाद के मजबूत परीक्षणों के लिए एक ध्वनि आधार प्रदान करने के उद्देश्य से विकसित किया गया है। यह ऐसा अवशेषों की प्राकृतिक विषमता को बराबर करने और पैमाने के लिए मजबूत बनाने वाले समीकरण के लिए समायोजित करने के लिए करता है। इन डिज़ाइन अनुकूली सुधार छोटे नमूना सेटिंग्स में महत्वपूर्ण हैं, जहां टिप्पणियों की संख्या अनुमानित या कम होने के मापदंडों की संख्या से केवल adapt गुना हो सकती है। "



मेरे पास टिप्पणियों के लिए पर्याप्त बिंदु नहीं हैं। हालाँकि मुझे ऊपर दिए गए @ जोहान के कुछ पहलू को स्पष्ट करने की आवश्यकता है। पिनहेइरो और बेट्स पी पर राज्य। 174:

मान 1 - भीतर-समूह त्रुटियां स्वतंत्र हैं और सामान्य रूप से वितरित की जाती हैं, औसत शून्य और विचरण ,2 के साथ, और वे यादृच्छिक ई ff एक्ट्स से स्वतंत्र हैं।

यह कथन वास्तव में सजातीय भिन्नताओं के बारे में स्पष्ट नहीं है और मैं एलएमई अवधारणा के पीछे के सभी गणितों को जानने के लिए आंकड़ों में पर्याप्त गहरी नहीं हूं। हालाँकि, पी पर। 175, Ass4.3.1, मान लिया गया अनुभाग 1 वे लिखते हैं:

इस खंड में, हम इस धारणा का आकलन करने के तरीकों पर ध्यान केंद्रित करते हैं कि आम तौर पर समूह की त्रुटियों को वितरित किया जाता है, शून्य पर केंद्रित है, और निरंतर विचरण है

इसके अलावा, निम्नलिखित उदाहरणों में " स्थिर संस्करण " वास्तव में महत्वपूर्ण हैं। इस प्रकार, एक अटकलें सकता है कि क्या वे सजातीय प्रसरण मतलब जब वे लिखते हैं " हूबहू पी पर सामान्य रूप से वितरित"। 174 इसे और अधिक सीधे संबोधित किए बिना।


-6

Q1: हाँ, क्यों नहीं?

Q2: मुझे लगता है कि आवश्यकता यह है कि त्रुटियों को सामान्य रूप से वितरित किया जाता है।

Q3: उदाहरण के लिए लेवेन के परीक्षण के साथ परीक्षण किया जा सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.