मेरे पास एक द्विपद वितरण और एक लॉगिट लिंक फ़ंक्शन के साथ GLMM है और मुझे लगता है कि मॉडल में डेटा का एक महत्वपूर्ण पहलू अच्छी तरह से प्रतिनिधित्व नहीं करता है।
इसका परीक्षण करने के लिए, मैं यह जानना चाहूंगा कि लॉगिट स्केल पर एक रैखिक फ़ंक्शन द्वारा डेटा का अच्छी तरह से वर्णन किया गया है या नहीं। इसलिए, मैं जानना चाहूंगा कि क्या अवशेषों का व्यवहार अच्छा है। हालांकि, मुझे यह पता नहीं चल सका है कि किस अवशेष पर साजिश रची जाए और किस तरह से साजिश की व्याख्या की जाए।
ध्यान दें कि मैं lme4 के नए संस्करण ( GitHub से विकास संस्करण ) का उपयोग कर रहा हूं :
packageVersion("lme4")
## [1] ‘1.1.0’
मेरा सवाल यह है: मैं एक लॉगइन लिंक फ़ंक्शन के साथ एक द्विपद सामान्यीकृत रैखिक मिश्रित मॉडल के अवशेषों का निरीक्षण और व्याख्या कैसे करूं?
निम्न डेटा मेरे वास्तविक डेटा का केवल 17% दर्शाता है, लेकिन फिटिंग में पहले से ही मेरी मशीन पर लगभग 30 सेकंड लगते हैं, इसलिए मैं इसे इस तरह से छोड़ता हूं:
require(lme4)
options(contrasts=c('contr.sum', 'contr.poly'))
dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif")
dat$V1 <- factor(dat$V1)
m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial)
सबसे सरल कथानक ( ?plot.merMod
) निम्नलिखित उत्पन्न करता है:
plot(m1)
क्या यह मुझे पहले से ही कुछ बताता है?
true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1)
? विल के बीच बातचीत का मॉडल दे अनुमान distance*consequent
, distance*direction
, distance*dist
और की ढलान direction
और dist
साथ कि भिन्न V1
? क्या वर्ग (consequent+direction+dist)^2
निरूपित करता है?
Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.123941 (tol = 0.001, component 1)
। क्यों ?
type=c("p","smooth")
मेंplot.merMod
, या में जानेggplot
यदि आप विश्वास के अंतराल चाहते हैं) कि ऐसा लगता है एक छोटी लेकिन महत्वपूर्ण पैटर्न वहाँ की तरह यह है कि आप जो एक अलग लिंक फ़ंक्शन को अपनाने से ठीक करने में सक्षम हो सकता है। यह अब तक है ...