मिश्रित मॉडल (lme4) में एक श्रेणीगत कारक के लिए "समग्र" पी-मूल्य और प्रभाव आकार कैसे प्राप्त करें?


28

मैं एक स्वतंत्र श्रेणीगत चर का एक पी-मान और एक प्रभाव आकार प्राप्त करना चाहता हूं (कई स्तरों के साथ) - जो कि "समग्र" है और प्रत्येक स्तर के लिए अलग-अलग नहीं है, जैसा कि lme4आर में सामान्य उत्पादन से होता है। यह वैसा ही है ANOVA चलाते समय लोग रिपोर्ट करते हैं।

मुझे यह कैसे मिल सकता है?


आप वास्तव में क्या आंकड़े चाहते हैं? आप anova()रैखिक मॉडल के साथ-साथ रैखिक मॉडल के साथ एनोवा तालिका प्राप्त करने के लिए फ़ंक्शन का उपयोग कर सकते हैं ।
स्मिलिग

मैंने aova () की कोशिश की है, लेकिन यह मुझे Df, Sum Sq, Mean Sq और F value देता है। मुझे प्रभाव का आकार और p मान नहीं दिख रहा है। क्या आपको इस बारे में कोई आइडिया है?
user3288202

1
प्रभाव के आकार से, क्या आपका मतलब बराबर है ? पी-वैल्यू के संबंध में, उनके अनुमान के आसपास और उन में कार्यान्वयन के आसपास एक लंबी और पर्याप्त बहस है । अधिक जानकारी के लिए इस प्रश्न में चर्चा पर एक नज़र डालें । R2lme4
स्मिलिग

लिंक के लिए धन्यवाद, स्मिलिग। इसका मतलब यह है कि क्योंकि पी मूल्य गणना के साथ एक समस्या है, कुल मिलाकर कारक का प्रभाव आकार भी एक समस्या है?
user3288202

वे सीधे संबंधित मुद्दे नहीं हैं। हालांकि, आपको यह ध्यान रखना चाहिए कि एक रैखिक मिश्रित मॉडल यादृच्छिक प्रभावों के बिना एक रैखिक मॉडल की तरह व्यवहार नहीं करता है, इसलिए एक उपाय जो रैखिक मॉडल के लिए उपयुक्त हो सकता है, जरूरी नहीं कि मिश्रित मॉडल का सामान्यीकरण हो।
स्मिलिग

जवाबों:


48

आपके द्वारा उल्लिखित दोनों अवधारणाएं (रैखिक मिश्रित मॉडल के पी-मान और प्रभाव आकार) में अंतर्निहित मुद्दे हैं। प्रभाव आकार के संबंध में , डौग बेट्स के मूल लेखक के हवाले से lme4,

यह मानते हुए कि कोई माप को परिभाषित करना चाहता है , मुझे लगता है कि एक रैखिक मिश्रित मॉडल से वर्गों के दंडित अवशिष्ट योग के इलाज के लिए एक तर्क उसी तरह से बनाया जा सकता है जिस तरह से हम एक रैखिक मॉडल से वर्गों के अवशिष्ट योग पर विचार करते हैं। या कोई बिना दंड के वर्गों के अवशिष्ट योग का उपयोग कर सकता है या किसी दिए गए सेट से प्राप्त वर्गों की न्यूनतम अवशिष्ट राशि, जो एक अनंत सटीक मैट्रिक्स से मेल खाती है। मुझे नहीं पता, वास्तव में। यह इस बात पर निर्भर करता है कि आप किस तरह की कोशिश कर रहे हैं।R2

अधिक जानकारी के लिए, आप इस धागे , इस धागे और इस संदेश को देख सकते हैं । मूल रूप से, मुद्दा यह है कि मॉडल में यादृच्छिक प्रभावों से विचरण को शामिल करने और विघटित करने की विधि पर सहमति नहीं है। हालांकि, कुछ मानक हैं जो उपयोग किए जाते हैं। यदि आप r-sig-मिश्रित-मॉडल मेलिंग सूची के लिए विकी पर एक नज़र रखते हैं, तो सूचीबद्ध किए गए कुछ जोड़े हैं।

सुझाए गए तरीकों में से एक फिट और देखे गए मूल्यों के बीच सहसंबंध को देखता है। यह आर में लागू किया जा सकता है जैसा कि जेरेट बायरनेस ने उन थ्रेड्स में से एक में सुझाया है:

r2.corr.mer <- function(m) {
  lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
  summary(lmfit)$r.squared
}

इसलिए उदाहरण के लिए, हम निम्न रैखिक मिश्रित मॉडल का अनुमान लगाते हैं:

set.seed(1)
d <- data.frame(y = rnorm(250), x = rnorm(250), z = rnorm(250),
                g = sample(letters[1:4], 250, replace=T)       )
library(lme4)
summary(fm1 <- lmer(y ~ x + (z | g), data=d))
# Linear mixed model fit by REML ['lmerMod']
# Formula: y ~ x + (z | g)
#    Data: d
# REML criterion at convergence: 744.4
# 
# Scaled residuals: 
#     Min      1Q  Median      3Q     Max 
# -2.7808 -0.6123 -0.0244  0.6330  3.5374 
# 
# Random effects:
#  Groups   Name        Variance Std.Dev. Corr 
#  g        (Intercept) 0.006218 0.07885       
#           z           0.001318 0.03631  -1.00
#  Residual             1.121439 1.05898       
# Number of obs: 250, groups: g, 4
# 
# Fixed effects:
#             Estimate Std. Error t value
# (Intercept)  0.02180    0.07795   0.280
# x            0.04446    0.06980   0.637
# 
# Correlation of Fixed Effects:
#   (Intr)
# x -0.005

हम ऊपर परिभाषित फ़ंक्शन का उपयोग करके प्रभाव के आकार की गणना कर सकते हैं:

r2.corr.mer(fm1)
# [1] 0.0160841

रोंघुई जू द्वारा एक समान विकल्प की सिफारिश की जाती है , जिसे " रूप में संदर्भित किया जाता है , और इसकी गणना केवल आर में की जा सकती है :Ω02

1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
# [1] 0.01173721  # Usually, it would be even closer to the value above

पी-वैल्यू के संबंध में , यह बहुत अधिक विवादास्पद मुद्दा है (कम से कम आर / lme4समुदाय में)। प्रश्नों के विवेचन को यहाँ , यहाँ और यहाँ कई अन्य लोगों के बीच देखें। विकी पेज को फिर से संदर्भित करते हुए, रैखिक मिश्रित मॉडल में प्रभावों पर परिकल्पना का परीक्षण करने के लिए कुछ दृष्टिकोण हैं। "सबसे बुरे से सबसे अच्छे" ( विकी पृष्ठ के लेखकों के अनुसार जो मुझे लगता है कि डौग बेट्स के साथ-साथ बेन बोल्कर भी शामिल हैं, जो यहां बहुत योगदान देता है):

  • Wald Z- परीक्षण
  • संतुलित, नेस्टेड LMMs के लिए जहां df की गणना की जा सकती है: Wald t- परीक्षण
  • संभावना अनुपात परीक्षण, या तो मॉडल की स्थापना करके, ताकि पैरामीटर को अलग किया जा सके / गिराया जा सके ( anovaया ( drop1) या, कम्प्यूटरीकृत प्रोफाइल की गणना करके)
  • MCMC या पैरामीट्रिक बूटस्ट्रैप विश्वास अंतराल

वे मार्कोव श्रृंखला मोंटे कार्लो नमूना दृष्टिकोण की सिफारिश करते हैं और छद्म से इसे लागू करने के लिए कई संभावनाओं की सूची भी देते हैं और पूरी तरह से बायेसियन दृष्टिकोण नीचे सूचीबद्ध हैं।

छद्म बायेसियन:

  • आमतौर पर पोस्ट-हॉक सैंपलिंग, (1) MLE से शुरू होने वाले फ्लैट पुजारी और (2) को मानते हुए, संभवतः उम्मीदवार वितरण का चयन करने के लिए अनुमानित संस्करण-सहसंयोजक अनुमान का उपयोग करते हुए
  • Via mcmcsamp(यदि आपकी समस्या के लिए उपलब्ध है: यानी साधारण यादृच्छिक प्रभावों के साथ LMM - GLMM या जटिल यादृच्छिक प्रभाव नहीं) पैकेज में
    Via , के लिए एक आवरण ) pvals.fnclanguageRmcmcsamp
  • एडी मॉडल बिल्डर में, संभवतः glmmADMBपैकेज ( mcmc=TRUEविकल्प का उपयोग करें ) या पैकेज के माध्यम से ( R2admbएडी मॉडल बिल्डर में अपनी खुद की मॉडल परिभाषा लिखें), या आर के बाहर
  • पैकेज simसे फ़ंक्शन के माध्यम से arm(बीटा-फिक्स्ड-प्रभाव) गुणांकों के लिए केवल पीछे का अनुकरण करता है

पूरी तरह से बायेसियन दृष्टिकोण:

  • MCMCglmmपैकेज के माध्यम से
  • glmmBUGSWinBUGS रैपर / आर इंटरफ़ेस का उपयोग करना
  • , Jags / WinBUGS / OpenBUGS आदि का उपयोग के माध्यम से rjags/ r2jags/ R2WinBUGS/ BRugsसंकुल

चित्रण के लिए यह दिखाने के लिए कि यह कैसा दिख सकता है, नीचे पैकेज MCMCglmmका उपयोग करके एक अनुमान लगाया गया MCMCglmmहै, जो आपको उपरोक्त मॉडल के समान परिणाम देगा और कुछ प्रकार के बेइज़ियन पी-मान हैं:

library(MCMCglmm)
summary(fm2 <- MCMCglmm(y ~ x, random=~us(z):g, data=d))
# Iterations = 3001:12991
# Thinning interval  = 10
#  Sample size  = 1000 
# 
#  DIC: 697.7438 
# 
#  G-structure:  ~us(z):g
# 
#       post.mean  l-95% CI u-95% CI eff.samp
# z:z.g 0.0004363 1.586e-17 0.001268    397.6
# 
#  R-structure:  ~units
# 
#       post.mean l-95% CI u-95% CI eff.samp
# units    0.9466   0.7926    1.123     1000
# 
#  Location effects: y ~ x 
# 
#             post.mean l-95% CI u-95% CI eff.samp pMCMC
# (Intercept)  -0.04936 -0.17176  0.07502     1000 0.424
# x            -0.07955 -0.19648  0.05811     1000 0.214

मुझे उम्मीद है कि यह कुछ हद तक मदद करता है। मुझे लगता है कि लीनियर मिश्रित मॉडल के साथ शुरू होने वाले किसी व्यक्ति के लिए सबसे अच्छी सलाह और आर में उन्हें अनुमान लगाने की कोशिश करना है कि विकी faqs को पढ़ना है जहां से इस जानकारी को खींचा गया था। यह बुनियादी से उन्नत और मॉडलिंग से लेकर प्लॉटिंग तक सभी प्रकार के मिश्रित प्रभाव विषयों के लिए एक उत्कृष्ट संसाधन है।


बहुत बहुत स्माइली धन्यवाद। इसलिए मैं समग्र मापदंडों के लिए प्रभाव आकार की रिपोर्ट नहीं कर सकता।
user3288202

... और निश्चित रूप से परिणामी अधिक अवलोकन के साथ नमूना इकाइयों (और यह बिना किसी शर्त के चलते हैं) के प्रति पक्षपाती होगा। r2
रसैलपिएर्स

3
+6, प्रभावशाली रूप से स्पष्ट, व्यापक और पूरी तरह से एनोटेट।
गुंग - को पुनः स्थापित मोनिका

1
इसके अतिरिक्त, आप एफ़एक्स-पैकेज और विशेष रूप से मिश्रित फ़ंक्शन पर एक नज़र डाल सकते हैं। यहाँ
शुरुआती 19

6

महत्व ( पी ) मूल्यों की गणना करने के संबंध में , ल्यूक (2016) आर रिपोर्ट में रैखिक मिश्रित-प्रभाव वाले मॉडल में महत्व का मूल्यांकन करते हुए कहा कि इष्टतम विधि या तो केनवर्ड-रोजर या सैटरथवेट सन्निकटन स्वतंत्रता की डिग्री के लिए है (आर में पैकेज के साथ उपलब्ध है जैसे lmerTestया afex)।

सार

प्रयोगात्मक डेटा के विश्लेषण में मिश्रित-प्रभाव वाले मॉडल का अधिक बार उपयोग किया जा रहा है। हालांकि, आर में lme4 पैकेज में आर इन मॉडल (यानी, पी-मान प्राप्त करने) में निश्चित प्रभावों के महत्व का मूल्यांकन करने के लिए मानक कुछ अस्पष्ट हैं। इसके अच्छे कारण हैं, लेकिन जैसा कि शोधकर्ता इन मॉडलों का उपयोग कर रहे हैं, पी-मूल्यों की रिपोर्ट करने के लिए कई मामलों में आवश्यक है, मॉडल आउटपुट के महत्व का मूल्यांकन करने के लिए कुछ विधि की आवश्यकता है। इस पत्र में सिमुलेशन के परिणामों को दर्शाया गया है कि महत्व का मूल्यांकन करने के लिए दो सबसे सामान्य तरीके, संभावना अनुपात परीक्षणों का उपयोग करना और मॉडल आउटपुट (टी-एज़-जेड) से वाल्ड टी मूल्यों के लिए जेड वितरण को लागू करना, कुछ हद तक विरोधी रूढ़िवादी हैं। विशेष रूप से छोटे नमूना आकार के लिए। महत्व के मूल्यांकन के अन्य तरीके,इन सिमुलेशन के परिणामों से पता चलता है कि टाइप 1 त्रुटि दर .05 के सबसे करीब है जब मॉडल को REML का उपयोग करके फिट किया जाता है और P- मान केनवर्ड-रोजर या Satterthwaite सन्निकटन का उपयोग करके निकाले जाते हैं, क्योंकि ये सन्निकटन स्वीकार्य दोनों प्रकार का उत्पादन करते हैं। नमूने हैं।

(महत्व दिया)


4
+1 इस लिंक को साझा करने के लिए धन्यवाद। मैं बस संक्षेप में टिप्पणी करूंगा कि केनवर्ड-रोजर सन्निकटन lmerTestपैकेज में उपलब्ध है ।
अमीबा का कहना है कि मोनिका

5

मैं lmerTestपैकेज का उपयोग करता हूं । इसमें anova()मेरे एमएलएम विश्लेषण के लिए आउटपुट में पी-मूल्य का अनुमान आसानी से शामिल है , लेकिन यहां अन्य पदों में दिए गए कारणों के लिए एक प्रभाव का आकार नहीं दिया गया है।


1
मेरे मामले में, मैं lasseans का उपयोग करके जोड़ीदार तुलना पसंद करता हूँ क्योंकि यह मुझे p मानों के साथ विरोधाभासों के सभी जोड़े देता है। अगर मैं lmerTest का उपयोग करता हूं, तो मुझे सभी जोड़ियों को देखने के लिए विभिन्न आधार रेखाओं के साथ छह बार मॉडल चलाना होगा।
user3288202
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.