Nakagawa & Schielzeth (2013) R2glmm विधि का उपयोग करके मिश्रित मॉडल में गणना


13

मैं मिश्रित मॉडलों में मानों की गणना के बारे में पढ़ रहा हूं और R-sig FAQ पढ़ने के बाद, इस मंच पर अन्य पोस्ट (मैं कुछ लिंक करूंगा लेकिन मेरे पास पर्याप्त प्रतिष्ठा नहीं है) और कई अन्य संदर्भ मुझे समझ में आए मिश्रित मॉडल के संदर्भ में मान जटिल है।R2R2

हालाँकि, मैं हाल ही में इन दो पत्रों के नीचे आया हूं। हालांकि ये विधियां आशाजनक लगती हैं (मुझे) मैं एक सांख्यिकीविद् नहीं हूं, और जैसा कि मैं सोच रहा था कि क्या किसी और के पास उनके प्रस्तावित तरीकों के बारे में कोई अंतर्दृष्टि होगी और वे प्रस्तावित किए गए अन्य तरीकों की तुलना कैसे करेंगे।

नाकागावा, शिनिची, और होल्गर शेलीजेथ। "सामान्यीकृत रैखिक मिश्रित। प्रभाव मॉडल से R2 प्राप्त करने के लिए एक सामान्य और सरल विधि।" पारिस्थितिकी और विकास में विधियाँ 4.2 (2013): 133-142।

जॉनसन, पॉल सी.डी. "बेतरतीब ढलान वाले मॉडल के लिए नकागावा और शीज़ेथ के R2GLMM का विस्तार।" पारिस्थितिकी और विकास के तरीके (2014)।

इस विधि को म्यूनि पैकेज में r.squaredGLMM फ़ंक्शन का उपयोग करके भी लागू किया जा सकता है जो विधि का निम्नलिखित विवरण देता है।

मिश्रित-प्रभाव वाले मॉडल के लिए, को दो प्रकारों में वर्गीकृत किया जा सकता है। सीमांत निश्चित कारकों द्वारा बताए गए विचरण का प्रतिनिधित्व करता है, और इसे इस रूप में परिभाषित किया जाता है: सशर्त को विचलन के रूप में व्याख्या की जाती है, जो दोनों निश्चित और यादृच्छिक कारकों (अर्थात संपूर्ण मॉडल) द्वारा समझाया गया है, और समीकरण के अनुसार गणना की जाती है: जहां निश्चित प्रभाव घटकों, और का विचरण है। सभी प्रसरण घटकों (समूह, व्यक्ति आदि) का ,आर 2R2R2 आर2आरजीएलएमएम()2=(σ 2 +Σ(σ 2 एल ))

RGLMM(m)2=σf2σf2+(σl2)+σe2+σd2
R2
आरजीएल(सी)2=(σ2+Σ(σएल2))(σ2+Σ(σएल2)+σ2+σ2
σ2Σ(σएल2)σएल2परिवर्ती फैलाव के कारण विचरण है और d_d ^ 2σ2 वितरण-विशिष्ट विचरण है।

अपने विश्लेषण में मैं अनुदैर्ध्य डेटा को देख रहा हूं और मैं मुख्य रूप से मॉडल में निश्चित प्रभावों द्वारा समझाया गया विचरण में रुचि रखता हूं

library(MuMIn) 
library(lme4)

fm1 <- lmer(zglobcog ~ age_c + gender_R2 + ibphdtdep + iyeareducc + apoegeno + age_c*apoegeno + (age_c | pathid), data = dat, REML = FALSE, control = lmerControl(optimizer = "Nelder_Mead"))

# Jarret Byrnes (correlation between the fitted and the observed values)
r2.corr.mer <- function(m) {
   lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
   summary(lmfit)$r.squared
}

r2.corr.mer(fm1)
[1] 0.8857005

# Xu 2003
1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
[1] 0.8783479

# Nakagawa & Schielzeth's (2013)
r.squaredGLMM(fm1)
      R2m       R2c 
0.1778225 0.8099395 

मैंने आपके पोस्ट को mathjax फॉर्मेटिंग का उपयोग करने के लिए संपादित किया है। कृपया दोहराएं कि मैंने गलती से कोई त्रुटि पेश नहीं की है।
साइकोरैक्स का कहना है कि मोनिका सेप

जहाँ तक मैं इसे समझता हूँ, आपके प्रश्न में एक वास्तविक प्रश्न का अभाव है। क्या आप स्पष्ट कर सकते हैं कि आप क्या चाहते हैं? एक सिफारिश क्या उपयोग करने के लिए?
हेनरिक

हाय @ हेनरिक, मुझे इस सलाह में दिलचस्पी थी कि क्या उपयोग करना है, हां, लेकिन यह भी अधिक मोटे तौर पर कि कैसे अलग-अलग तरीके एक-दूसरे की तुलना करते हैं और अंतर क्या हैं।
एंड्रयूज

मेरा मानना ​​है कि मूल और ऊपर के समीकरण गलत हैं। यह @ user777 के परिवर्तनों के कारण नहीं है। दाईं ओर दो शब्द हर में होना चाहिए। देखें इस
साइरिल

यह त्रुटि मुअम्मिन पैकेज डॉक्यूमेंटेशन को बंद करने वाले कोष्ठक के गुम होने के कारण संभव थी ।
साइरिल

जवाबों:


11

मैं आर-सिग-मी मेलिंग सूची में डगलस बेट्स के जवाब को पेस्ट करके जवाब दे रहा हूं, 17 दिसंबर 2014 को इस सवाल पर कि सामान्यीकृत रैखिक मिश्रित मॉडल के लिए एक सांख्यिकीय की गणना कैसे करें , जो मुझे लगता है कि किसी की रुचि के साथ पढ़ने की आवश्यकता है ऐसी बात। बेट्स आर और सह-लेखक के पैकेज के मूल लेखक हैं , साथ ही मिश्रित मॉडल पर एक प्रसिद्ध पुस्तक के सह-लेखक हैं , और सीवी को केवल एक लिंक के बजाय एक उत्तर में पाठ होने से लाभ होगा। यह।आर2lme4nlme

जब लोग "GLMMs के लिए R2" की बात करते हैं, तो मुझे थोड़ी चिकोटी लेनी चाहिए। एक रेखीय मॉडल के लिए आर 2 अच्छी तरह से परिभाषित है और इसमें कई वांछनीय गुण हैं। अन्य मॉडलों के लिए एक अलग मात्रा को परिभाषित कर सकता है जो कुछ को प्रतिबिंबित करता है लेकिन इन सभी गुणों को नहीं। लेकिन यह उन सभी संपत्तियों को प्राप्त करने के लिए एक R2 की गणना नहीं कर रहा है जिनमें रैखिक मॉडल के लिए R2 के सभी गुण हैं। आमतौर पर कई अलग-अलग तरीके होते हैं जो इस तरह की मात्रा को परिभाषित कर सकते हैं। विशेष रूप से GLM और GLMMs के लिए, इससे पहले कि आप "प्रतिसाद विचरण के अनुपात को परिभाषित कर सकें" आपको पहले परिभाषित करने की आवश्यकता है कि आपको "प्रतिसाद विचरण" से क्या मतलब है।

अन्य मॉडलों पर लागू रैखिक मॉडल से जुड़े अन्य राशियों में से किसी की भी स्वतंत्रता के लिए R2 या डिग्री के गठन के बारे में भ्रम अवधारणा के साथ सूत्र को भ्रमित करने से आता है। यद्यपि सूत्र मॉडल से व्युत्पन्न होते हैं लेकिन व्युत्पत्ति में अक्सर काफी परिष्कृत गणित शामिल होता है। संभावित रूप से भ्रामक व्युत्पत्ति से बचने के लिए और सिर्फ "पीछा करने के लिए कट" सूत्रों को प्रस्तुत करना आसान है। लेकिन सूत्र अवधारणा नहीं है। एक सूत्र को सामान्य बनाना अवधारणा को सामान्य बनाने के बराबर नहीं है। और उन सूत्रों का उपयोग लगभग कभी भी व्यवहार में नहीं किया जाता है, विशेष रूप से सामान्यीकृत रैखिक मॉडल के लिए, विचरण और यादृच्छिक प्रभावों का विश्लेषण। मेरे पास एक "मेटा-प्रमेय" है कि केवल परिचयात्मक ग्रंथों में दिए गए सूत्रों के अनुसार गणना की गई मात्रा नमूना नमूना है।

ऐसा लग सकता है कि मैं इस बारे में एक क्रोधी बूढ़ा आदमी हूं, और शायद मैं हूं, लेकिन खतरा यह है कि लोग रैखिक मॉडल के लिए एक आर 2 के सभी गुणों के लिए "आर 2 जैसी" मात्रा की उम्मीद करते हैं। यह नहीं कर सकता। GLMM जैसे बहुत अधिक जटिल मॉडल के लिए सभी गुणों को सामान्य करने का कोई तरीका नहीं है।

मैं एक बार पीएचडी के लिए एक थीसिस प्रस्ताव की समीक्षा करने वाली समिति पर था। उम्मीदवारी। प्रस्ताव यह था कि मुझे लगता है कि 9 अलग-अलग फ़ार्मुलों की जांच करने के लिए जो एक nonlinear प्रतिगमन मॉडल के लिए एक आर 2 कंप्यूटिंग के तरीकों पर विचार किया जा सकता है जो यह तय करने के लिए कि "सबसे अच्छा" कौन था। बेशक, यह एक सिमुलेशन अध्ययन के माध्यम से किया जाएगा केवल विभिन्न मॉडलों के एक जोड़े और प्रत्येक के लिए पैरामीटर मानों के केवल कुछ अलग सेट। मेरा सुझाव है कि यह एक पूरी तरह से व्यर्थ अभ्यास था, गर्मजोशी से स्वागत नहीं किया गया था।


10

साहित्य को ब्राउज़ करने के बाद मैं निम्नलिखित पेपर पर आया, जो मिश्रित मॉडल के लिए मानों की गणना के लिए कई अलग-अलग तरीकों की तुलना करता है , जहाँ (MVP) विधियाँ नाकागावा और शीलजेथ द्वारा प्रस्तावित विधि के बराबर हैं।आर 2आर2आर2

  • लाहौसे, डी एट अल (2014) बहुस्तरीय मॉडल के लिए समझाया उपाय। संगठनात्मक अनुसंधान के तरीके।

यहाँ छवि विवरण दर्ज करें

कुल मिलाकर, अधिकांश उपायों (फॉर्मूला, फॉर्मूला, (ओएलएस), और (एमवीपी)) ने सभी स्थितियों और मॉडलों में पूर्वाग्रह, स्थिरता और दक्षता के स्वीकार्य स्तर का प्रदर्शन किया। इसके अलावा, इन उपायों के लिए औसत पूर्वाग्रह मूल्यों में अंतर छोटा था। फॉर्मूला और फॉर्मूला यादृच्छिक-अवरोधन मॉडल में सबसे कम पक्षपाती थे और फॉर्मूला और (एमवीपी) यादृच्छिक-ढलान वाले मॉडल में सबसे कम पक्षपाती थे। दक्षता के संदर्भ में, फॉर्मूला और (एमवीपी) यादृच्छिक-अवरोधन मॉडल में सबसे कम मानक विचलन मूल्य थे। (एमवीपी) और (ओएलएस) यादृच्छिक-ढलान मॉडल में सबसे कम मानक विचलन था। सामान्य तौर पर, फॉर्मूला एक कुशल अनुमानक नहीं था।R 2 R 2 R 2 R 2 R 2आर2R2R2R2R2R2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.