मिश्रित मॉडलों में विलक्षण फिट के साथ काम करना


16

मान लीजिए कि हमारे पास एक मॉडल है

mod <- Y ~ X*Condition + (X*Condition|subject)

# Y = logit variable  
# X = continuous variable  
# Condition = values A and B, dummy coded; the design is repeated 
#             so all participants go through both Conditions  
# subject = random effects for different subjects 

summary(model)
Random effects:
 Groups  Name             Variance Std.Dev. Corr             
 subject (Intercept)      0.85052  0.9222                    
         X                0.08427  0.2903   -1.00            
         ConditionB       0.54367  0.7373   -0.37  0.37      
         X:ConditionB     0.14812  0.3849    0.26 -0.26 -0.56
Number of obs: 39401, groups:  subject, 219

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       2.49686    0.06909   36.14  < 2e-16 ***
X                -1.03854    0.03812  -27.24  < 2e-16 ***
ConditionB       -0.19707    0.06382   -3.09  0.00202 ** 
X:ConditionB      0.22809    0.05356    4.26 2.06e-05 ***

यहां हम एक विलक्षण फिट का निरीक्षण करते हैं, क्योंकि अवरोधन और x यादृच्छिक प्रभावों के बीच सहसंबंध -1 है। अब इस उपयोगी लिंक के अनुसार, इस मॉडल से निपटने का एक तरीका उच्च-क्रम यादृच्छिक प्रभाव (जैसे, X: कंडीशनबी) को हटाना है और देखें कि क्या विलक्षणता के लिए परीक्षण करते समय फर्क पड़ता है। दूसरे को बायेसियन दृष्टिकोण का उपयोग करना है, उदाहरण के लिए, blmeएकवचन से बचने के लिए पैकेज।

प्रचलित विधि क्या है और क्यों?

मैं यह पूछ रहा हूं क्योंकि पहले या दूसरे का उपयोग करने से अलग-अलग परिणाम सामने आते हैं - पहले मामले में, मैं एक्स को हटा दूंगा: सशर्त यादृच्छिक प्रभाव और एक्स और एक्स के बीच सहसंबंध का अनुमान लगाने में सक्षम नहीं होगा: सशर्त यादृच्छिक प्रभाव। दूसरी ओर, उपयोग blmeकरने से मुझे X: सशर्त रखने और दिए गए सहसंबंध का अनुमान लगाने की अनुमति मिलती है। मुझे कोई कारण नहीं है कि मुझे गैर-बेसेसियन अनुमानों का भी उपयोग करना चाहिए और विलक्षण फिट होने पर यादृच्छिक प्रभावों को हटा देना चाहिए जब मैं बायेसियन दृष्टिकोण के साथ सब कुछ अनुमान लगा सकता हूं।

क्या कोई मुझे एकवचन से निपटने के लिए किसी भी विधि का उपयोग करके लाभ और समस्याएं समझा सकता है?

धन्यवाद।


क्या आप उस मार्ग के बारे में चिंतित हैं = -1? यह यादृच्छिक प्रभावों के बीच सहसंबंध है।
user158565

तो प्रत्येक विषय आपको वाई के दो माप देता है, एक शर्त ए के तहत और एक शर्त बी के तहत? यदि यह सच है, तो क्या आप हमें यह भी बता सकते हैं कि क्या A और B के बीच किसी भी विषय के लिए निरंतर परिवर्तनशील X का मान बदलता है?
इसाबेला घीमे

आप यादृच्छिक प्रभावों में शर्त क्यों लगाते हैं? यदि आवश्यक हो तो क्या आपने परीक्षण किया है?
दिमित्रिस रिज़ोपौलोस

@ user158565 हाँ, लेकिन यह अकेलेपन को इंगित करता है ...
User33268

@ इस्बेला जीमेन्ट वास्तव में। हां यह करता है, ए और बी के बीच किसी भी विषय के लिए एक्स बदलता है। इसके अलावा, यह मानने का सैद्धांतिक कारण है कि एक्स पर वाई का प्रतिगमन हर विषय के लिए अलग-अलग है
User33268

जवाबों:


21

जब आप एक विलक्षण फिट प्राप्त करते हैं, तो यह अक्सर संकेत देता है कि मॉडल ओवरफिटेड है - अर्थात, यादृच्छिक प्रभाव संरचना डेटा द्वारा समर्थित होने के लिए बहुत जटिल है, जो स्वाभाविक रूप से यादृच्छिक प्रभावों के सबसे जटिल हिस्से को हटाने के लिए सलाह की ओर जाता है। संरचना (आमतौर पर यादृच्छिक ढलान)। इस दृष्टिकोण का लाभ यह है कि यह एक अधिक पारिश्रमिक मॉडल की ओर जाता है जो ओवर-फिट नहीं है।

हालांकि, कुछ भी करने से पहले, क्या आपके पास चाहने का एक अच्छा कारण है X, Conditionऔर उनकी बातचीत, सभी को पहले स्थान पर अलग-अलग करना है? क्या सिद्धांत यह बताता है कि डेटा कैसे उत्पन्न होता है?

यदि आप अधिकतम यादृच्छिक प्रभाव संरचना के साथ मॉडल को फिट करने की इच्छा रखते हैं, और lme4एक विलक्षण फिट प्राप्त करते हैं, तो एक बेसेसियन ढांचे में एक ही मॉडल फिटिंग आपको बहुत अच्छी तरह से सूचित कर सकती है कि lme4 समस्या क्यों थी, ट्रेस भूखंडों का निरीक्षण करके और विभिन्न मापदंडों को कितनी अच्छी तरह से परिभाषित किया गया है। । बायेसियन दृष्टिकोण लेने में लाभ यह है कि ऐसा करने से आप मूल मॉडल के साथ एक समस्या को उजागर कर सकते हैं। कारण है कि अधिकतम यादृच्छिक प्रभाव संरचना डेटा द्वारा समर्थित नहीं है) या यह lme4मॉडल को फिट करने में असमर्थ होने के कारण इसे उजागर कर सकता है। मुझे ऐसी स्थितियों का सामना करना पड़ा है जहां एक बायेसियन मॉडल अच्छी तरह से परिवर्तित नहीं होता है, जब तक कि जानकारीपूर्ण पुजारियों का उपयोग नहीं किया जाता है - जो ठीक हो सकता है या नहीं।

संक्षेप में, दोनों दृष्टिकोणों में योग्यता है।

हालांकि, मैं हमेशा एक ऐसी जगह से शुरू करूंगा, जहां प्रारंभिक मॉडल पारसिमिनीय है और सबसे उपयुक्त यादृच्छिक प्रभाव संरचना निर्धारित करने के लिए विशेषज्ञ डोमेन ज्ञान द्वारा सूचित किया गया है। समूहन चर निर्दिष्ट करना अपेक्षाकृत आसान है, लेकिन यादृच्छिक ढलान को आमतौर पर शामिल नहीं करना पड़ता है। केवल उन्हें शामिल करें यदि वे ध्वनि सैद्धांतिक अर्थ बनाते हैं और वे डेटा द्वारा समर्थित हैं।

संपादित करें: टिप्पणियों में यह उल्लेख किया गया है कि अधिकतम यादृच्छिक प्रभाव संरचना को फिट करने के लिए ध्वनि सैद्धांतिक कारण हैं। तो, एक अपेक्षाकृत आसान तरीका एक बराबर बायेसियन मॉडल के साथ आगे बढ़ने के लिए कॉल स्वैप करने के लिए है glmerके साथ stan_glmerसे rstanarmपैकेज - यह प्लग और खेलने डिज़ाइन किया गया है। इसमें डिफ़ॉल्ट पुजारी हैं, इसलिए आप जल्दी से एक मॉडल फिट करवा सकते हैं। पैकेज में अभिसरण के आकलन के लिए कई उपकरण भी हैं। यदि आप पाते हैं कि सभी पैरामीटर प्रशंसनीय मूल्यों में परिवर्तित हो गए हैं, तो आप सभी अच्छे हैं। हालाँकि कई तरह के मुद्दे हो सकते हैं - उदाहरण के लिए एक विचरण शून्य से कम या कम होने का अनुमान, या एक अनुमान जो अभी भी जारी है। Mc-stan.org साइट में जानकारी और उपयोगकर्ता मंच का खजाना है।


1
हां, मेरे पास यह मानने के अच्छे सैद्धांतिक कारण हैं कि X पर Y का प्रतिगमन शर्त A और B के लिए अलग-अलग विषयों में अलग-अलग होना चाहिए। प्रतिगमन का अर्थ है प्रसंस्करण शैली। क्या आप मुझे कुछ और जानकारी दे सकते हैं कि विलक्षणता के कारणों के लिए एक निदान उपकरण के रूप में ट्रेस प्लॉट की व्याख्या कैसे करें?
उपयोगकर्ता 33268

11

यह एक बहुत ही दिलचस्प धागा है, दिलचस्प जवाब और टिप्पणियों के साथ! चूंकि यह अभी तक नहीं लाया गया है, मैं यह बताना चाहता था कि हमारे पास प्रत्येक विषय के लिए बहुत कम डेटा है (जैसा कि मैं इसे समझता हूं)। वास्तव में, प्रत्येक विषय में प्रतिक्रिया चर Y, श्रेणीगत चर स्थिति और निरंतर चर X में से प्रत्येक के लिए केवल दो मान हैं। विशेष रूप से, हम जानते हैं कि शर्त के दो मूल्य A और B हैं।

यदि हम मिश्रित प्रभाव वाले मॉडलिंग के बजाय दो-चरण प्रतिगमन मॉडलिंग को आगे बढ़ाने के लिए थे, तो हम एक विशिष्ट विषय से डेटा के लिए एक रेखीय प्रतिगमन मॉडल भी फिट नहीं कर सकते थे, जैसा कि किसी एक विषय के लिए नीचे दिए गए खिलौना उदाहरण में चित्रित किया गया है:

y <- c(4, 7)
condition <- c("A", "B")
condition <- factor(condition)
x <- c(0.2, 0.4)

m <- lm(y ~ condition*x)
summary(m)

इस विषय-विशिष्ट मॉडल का आउटपुट होगा:

Call:
lm(formula = y ~ condition * x)

Residuals:
ALL 2 residuals are 0: no residual degrees of freedom!

Coefficients: (2 not defined because of singularities)
         Estimate Std. Error t value Pr(>|t|)
(Intercept)         4         NA      NA       NA
conditionB          3         NA      NA       NA
x                  NA         NA      NA       NA
conditionB:x       NA         NA      NA       NA

Residual standard error: NaN on 0 degrees of freedom
Multiple R-squared:      1,     Adjusted R-squared:    NaN 
F-statistic:   NaN on 1 and 0 DF,  p-value: NA

ध्यान दें कि मॉडल एकवचन से ग्रस्त है, जैसा कि हम केवल 2 टिप्पणियों का उपयोग करके 4 प्रतिगमन गुणांक प्लस त्रुटि मानक विचलन का अनुमान लगाने की कोशिश कर रहे हैं।

विलक्षणताएं तब भी कायम रहेंगी, जब हम इस विषय को दो बार - एक बार के बजाय - प्रत्येक स्थिति में देखें। हालाँकि, यदि हमने प्रत्येक स्थिति के तहत विषय को 3 बार देखा, तो हमें विलक्षणताओं से छुटकारा मिलेगा:

y <- c(4, 7, 3, 5, 1, 2)
condition <- c("A", "B", "A","B","A","B")
condition <- factor(condition)
x <- c(0.2, 0.4, 0.1, 0.3, 0.3, 0.5)

m2 <- lm(y ~ condition*x)
summary(m2)

यहां इस दूसरे उदाहरण के लिए संबंधित R आउटपुट है, जिसमें से विलक्षणताएं गायब हो गई हैं:

>     summary(m2)

Call:
lm(formula = y ~ condition * x)

Residuals:
    1       2       3       4       5       6 
1.3333  2.3333 -0.6667 -1.1667 -0.6667 -1.1667 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept)     4.667      3.555   1.313    0.320
conditionB      6.000      7.601   0.789    0.513
x             -10.000     16.457  -0.608    0.605
conditionB:x   -5.000     23.274  -0.215    0.850

Residual standard error: 2.327 on 2 degrees of freedom
Multiple R-squared:  0.5357,    Adjusted R-squared:  -0.1607 
F-statistic: 0.7692 on 3 and 2 DF,  p-value: 0.6079

बेशक, मिश्रित प्रभाव मॉडल असंबंधित फिट नहीं होता है, प्रत्येक विषय के लिए अलग-अलग रैखिक प्रतिगमन मॉडल - यह "संबंधित" मॉडल फिट बैठता है जिनके इंटरसेप्ट्स और / या ढलान एक विशिष्ट अवरोधन और / या ढलान के बारे में बेतरतीब ढंग से विचलन करते हैं, जैसे कि यादृच्छिक बदलाव विशिष्ट अवरोधन और / या विशिष्ट ढलान औसत शून्य और कुछ अज्ञात मानक विचलन के साथ एक सामान्य वितरण का पालन करते हैं।

फिर भी, मेरा अंतर्ज्ञान बताता है कि मिश्रित प्रभाव मॉडल छोटी मात्रा में टिप्पणियों के साथ संघर्ष कर रहा है - प्रत्येक विषय के लिए सिर्फ 2 - उपलब्ध है। जितना अधिक मॉडल यादृच्छिक ढलानों से भरा होता है, उतना ही यह संभवतः संघर्ष करता है। मुझे संदेह है कि, यदि प्रत्येक विषय ने 2 (अर्थात 3 प्रति शर्त) के बजाय 6 टिप्पणियों का योगदान दिया, तो यह सभी यादृच्छिक ढलानों को समायोजित करने के लिए संघर्ष नहीं करेगा।

मुझे ऐसा लगता है कि यह (?) एक ऐसा मामला हो सकता है जहां वर्तमान अध्ययन डिजाइन जटिल मॉडलिंग महत्वाकांक्षाओं का समर्थन नहीं करता है - उन महत्वाकांक्षाओं का समर्थन करने के लिए, प्रत्येक विषय के लिए प्रत्येक शर्त के तहत अधिक टिप्पणियों की आवश्यकता होगी (या कम से कम कुछ के लिए) विषयों?)। यह सिर्फ मेरा अंतर्ज्ञान है, इसलिए मुझे आशा है कि अन्य लोग मेरी टिप्पणियों को अपनी टिप्पणियों में जोड़ सकते हैं। आपका अग्रिम में ही बहुत धन्यवाद!


मुझे आपको सही करना है - प्रत्येक प्रतिभागी को एक्स और वाई दोनों के लिए 30 अवलोकन हैं, ए और बी दोनों स्थितियों में!
उपयोगकर्ता 33268

2
ओह, यह आपके प्रारंभिक उत्तर में इंगित नहीं किया गया था, इसलिए मेरे लिए यह अनुमान लगाना असंभव था कि वास्तव में आपके पास प्रति विषय और स्थिति में कितनी टिप्पणियां हैं। उसके बाद कुछ और हो रहा है। क्या आपने अपने X चर को मानकीकृत करने की कोशिश की? क्या इससे लंगड़ा फिट होने में मदद मिलती है? इसके अलावा, क्या आपने हालत के लिए Y बनाम X (या मानकीकृत X) के प्लॉट देखे हैं? यह आपको अतिरिक्त सुराग दे सकता है कि क्या चल रहा है।
इसाबेला घीमे

मैंने x का मानकीकरण नहीं किया क्योंकि यह प्रतिक्रिया समय डेटा है और यह प्रतिगमन गुणांक की व्याख्या के लिए महत्वपूर्ण है। हालाँकि, डेटा केंद्रीकृत थे। मैं व्यक्तिगत भूखंडों में देखूंगा, और देखूंगा ...
उपयोगकर्ता 33268

2
@ User33268 मुझे पार्टी में थोड़ी देर हो गई है, लेकिन आप अभी भी मानकीकृत गुणांक की व्याख्या कर सकते हैं, आपको बस मॉडल को चलाने के बाद स्केलिंग के लिए उपयोग किए जाने वाले मूल्यों और फिर बैकट्रांसफॉर्म को स्टोर करना होगा।
फ्रैंस रोडेनबर्ग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.