REML या ML दो मिश्रित प्रभाव वाले मॉडलों की तुलना करने के लिए अलग-अलग निश्चित प्रभावों के साथ, लेकिन समान यादृच्छिक प्रभाव के साथ?


18

पृष्ठभूमि: नोट: मेरे डेटासेट और आर-कोड पाठ के नीचे शामिल हैं

मैं R. lme4 पैकेज का उपयोग करके उत्पन्न दो मिश्रित प्रभाव मॉडल की तुलना करने के लिए AIC का उपयोग करना चाहता हूं। प्रत्येक मॉडल में एक निश्चित प्रभाव और एक यादृच्छिक प्रभाव होता है। निश्चित प्रभाव मॉडल के बीच भिन्न होता है, लेकिन यादृच्छिक प्रभाव मॉडल के बीच समान रहता है। मैंने पाया है कि अगर मैं REML = T का उपयोग करता हूं, तो मॉडल 2 में कम AIC स्कोर है, लेकिन यदि मैं REML = F का उपयोग करता हूं, तो मॉडल 1 में कम AIC स्कोर है।

एमएल का उपयोग करने के लिए समर्थन:

ज़ुआर एट अल। (2009; पृष्ठ 122) का सुझाव है कि "नेस्टेड निश्चित प्रभावों के साथ मॉडल की तुलना करने के लिए (लेकिन एक ही यादृच्छिक संरचना के साथ), एमएल अनुमान का उपयोग किया जाना चाहिए न कि REML।" यह मुझे इंगित करता है कि मुझे एमएल का उपयोग करना चाहिए क्योंकि मेरे यादृच्छिक प्रभाव दोनों मॉडल में समान हैं, लेकिन मेरे निश्चित प्रभाव अलग हैं। [ज़ुआर एट अल। 2009. मिश्रित प्रभाव मॉडल और पारिस्थितिकी में आर। स्प्रिंगर के साथ विस्तार।]

REML का उपयोग करने के लिए समर्थन:

हालांकि, मुझे लगता है कि जब मैं ML का उपयोग करता हूं, तो रैंडम प्रभाव से जुड़े अवशिष्ट विचरण दो मॉडलों (मॉडल (136.3 = मॉडल 2 = 112.9) के बीच भिन्न होते हैं, लेकिन जब मैं REML का उपयोग करता हूं, तो यह मॉडल (Model1 - Model2 =) के बीच समान होता है 151.5)। इसका तात्पर्य यह है कि मुझे REML का उपयोग करने के बजाय चाहिए ताकि यादृच्छिक अवशिष्ट विचरण समान यादृच्छिक चर वाले मॉडल के बीच समान रहे।

सवाल:

क्या मॉडल की तुलना के लिए ML की तुलना में REML का उपयोग करना अधिक समझदारी नहीं है जहां निश्चित प्रभाव बदलते हैं और यादृच्छिक प्रभाव समान रहते हैं? यदि नहीं, तो क्या आप मुझे समझा सकते हैं कि मुझे दूसरे साहित्य की ओर क्यों इशारा करना चाहिए?

# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)

# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)

डेटासेट:

Response    Fixed1  Fixed2  Random1
5.20    A   A   1
32.50   A   A   1
6.57    A   A   2
24.77   A   B   3
41.69   A   B   3
34.29   A   B   4
1.80    A   B   4
10.00   A   B   5
15.56   A   B   5
4.44    A   C   6
21.65   A   C   6
9.20    A   C   7
4.11    A   C   7
12.52   B   D   8
0.25    B   D   8
27.34   B   D   9
11.54   B   E   10
0.86    B   E   10
0.68    B   E   11
4.00    B   E   11

2
फ़रावे के (2006) R (p। 156) के साथ रैखिक मॉडल का विस्तार : "इसका कारण यह है कि REML डेटा के रैखिक संयोजनों पर विचार करके यादृच्छिक प्रभावों का अनुमान लगाता है जो निश्चित प्रभावों को हटाते हैं। यदि इन निश्चित प्रभावों को बदल दिया जाता है, तो संभावनाएँ। दो मॉडल सीधे तुलनीय नहीं होंगे। ”
jvh_ch

भले ही AIC संभावना आधारित है, मेरे ज्ञान के सर्वश्रेष्ठ के लिए, यह भविष्यवाणी के प्रयोजनों के लिए विकसित किया गया था। भविष्यवाणी के लिए एक मिश्रित मॉडल कैसे लागू होगा?
आदमो

@ अदमो, क्या तुम अधिक सटीक हो सकते हो? एक फिटेड मिश्रित मॉडल का उपयोग भविष्यवाणी के लिए किया जा सकता है, या तो जनसंख्या स्तर पर (सशर्त मोड / BLUPs को शून्य पर सेट करके अनिर्दिष्ट / अज्ञात इकाई के लिए पूर्वानुमान प्रतिक्रियाएं) या व्यक्तिगत स्तर पर (शर्त मोड / BLUPs के अनुमान पर स्थिति भविष्यवाणी) )। यदि आप अधिक विशिष्ट हो सकते हैं, तो यह एक अच्छा नया CV प्रश्न बना सकता है।
बेन बोल्कर

यह मेरे लिए स्पष्ट नहीं था कि आप इस मॉडल को कैसे लागू करना चाहते हैं। समस्या में कुछ भी सुझाव नहीं दिया गया कि किस तरह की भविष्यवाणी, यदि कोई हो, किया जा रहा है या यदि यह आवश्यक है और यदि ऐसा किस उद्देश्य के लिए किया गया है।
एडमो

जवाबों:


22

ज़्यूर एट अल।, और फ़ारवे (@ जानहोव की ऊपर की टिप्पणी से) सही हैं; REML द्वारा फिट किए गए विभिन्न निश्चित प्रभावों के साथ दो मॉडल की तुलना करने के लिए एआईसी सहित (एआईसी सहित) विधियों का उपयोग करना आम तौर पर बकवास होगा।


4
धन्यवाद @janhove, AdamO और बेन बोलकर। मैंने हारून की इस कड़ी को भी इस सवाल का जवाब देने में मददगार पाया । यह कहता है, "REML संभावना इस बात पर निर्भर करती है कि मॉडल में कौन से निश्चित प्रभाव हैं, और इसलिए यदि निश्चित प्रभाव बदलते हैं तो तुलनीय नहीं हैं। REML को आमतौर पर यादृच्छिक प्रभावों के लिए बेहतर अनुमान देने के लिए माना जाता है, हालांकि, इसलिए सामान्य सलाह को फिट करना है। अपने अंतिम निष्कर्ष और रिपोर्टिंग के लिए REML का उपयोग करते हुए आपका सबसे अच्छा मॉडल। "
यह

11

XX~RnX~XB

X~=XB

BXB

V

|V|1/2|X~V1X~|1/2exp((yX~β~)V1(yX~β~)/2)

β=(X~V1X~)1yX=X~B

|B||V|1/2||XV1X|1/2|exp((yXβ¯)V1(yXβ¯)/2)

β¯=(XV1X)1y|B|

|B|1

विभिन्न निश्चित प्रभावों वाले मॉडलों की तुलना करते समय REML का उपयोग क्यों नहीं किया जाना चाहिए, इसका एक उदाहरण है। REML, हालांकि, अक्सर यादृच्छिक प्रभाव मापदंडों का बेहतर अनुमान लगाता है और इसलिए कभी-कभी एकल (शायद अंतिम) मॉडल का अनुमान लगाने के लिए तुलना और REML के लिए ML का उपयोग करने की सिफारिश की जाती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.