एक चमक में आर-संरचना जी-संरचना क्या हैं?


16

मैं MCMCglmmहाल ही में पैकेज का उपयोग कर रहा हूं । मैं प्रलेखन में आर-संरचना और जी-संरचना के रूप में संदर्भित से भ्रमित हूं। ये यादृच्छिक प्रभावों से संबंधित प्रतीत होते हैं - विशेष रूप से उन पर पूर्व वितरण के लिए मापदंडों को निर्दिष्ट करते हुए, लेकिन प्रलेखन में चर्चा यह मानती है कि पाठक को पता है कि ये शब्द क्या हैं। उदाहरण के लिए:

3 संभावित तत्वों वाले वैकल्पिक विनिर्देशों की वैकल्पिक सूची: आर (आर-संरचना) जी (जी-संरचना) और बी (निश्चित प्रभाव) ............ विचरण संरचनाओं के लिए पुजारी (आर और जी) ) प्रत्याशित (सह) प्रकारांतरों (V) और विश्वास पैरामीटर (nu) के व्युत्क्रम के लिए सूचियाँ हैं (उलटा)

... यहाँ से लिया गया ।

संपादित करें: कृपया ध्यान दें कि मैंने स्टीफन की टिप्पणियों के बाद शेष प्रश्न को फिर से लिखा है।

Can किसी को भी, क्या आर-संरचना और जी संरचना पर प्रकाश डाला एक सरल विचरण घटकों मॉडल जहां रैखिक कारक है के संदर्भ में

β0+e0ij+u0j
के साथ औरe0ijN(0,σ0e2)u0jN(0,σ0u2)

मैंने कुछ डेटा के साथ निम्न उदाहरण दिया है MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

तो स्टीफन की टिप्पणियों के आधार पर मुझे लगता है कि G संरचना । लेकिन टिप्पणियाँ यह भी कहती हैं कि R संरचना फिर भी यह आउटपुट में नहीं लगती है ।σ0u2σ0e2lme4

ध्यान दें कि परिणाम lme4/glmer()MCMC से दोनों उदाहरणों के अनुरूप हैं MCMCglmm

तो, R संरचना और यह आउटपुट के लिए क्यों नहीं दिखाई देता है ?σ0e2lme4/glmer()


1
एसएएस शब्दावली के साथ (लेकिन यह संभवतः एक अधिक सामान्य शब्दावली है), जी मैट्रिक्स यादृच्छिक प्रभावों का विचरण मैट्रिक्स है और आर मैट्रिक्स "त्रुटियों की शर्तें" का विचरण मैट्रिक्स है (आपके मामले में शायद यह अनुमानित अवशिष्ट है विचरण ?)σ0e2
स्टीफन लॉरेंट

@ StéphaneLaurent धन्यवाद। मैंने सोचा अगर यह अनुमान लगाया जा सकता है लेकिन जब मैं पहली सामान्यीकृत रेखीय मॉडल के बारे में सीखा मुझे याद है कि σ 2 0 अनुमान नहीं है - केवल "विचलन" (के साथ के रूप में गणना की जाती है )। हो सकता है कि मुझसे कुछ छूट रहा हो ? σ0e2σ0e2lme4
जो किंग

1
शायद अवशिष्ट विचरण की भावना स्पष्ट नहीं है जब वितरण परिवार गॉसियन एक नहीं है
स्टीफन लॉरेंट

1
@ स्टीफन लॉरेंट हाँ! कृपया एक मिनट पहले माइकल के जवाब पर मेरी टिप्पणी देखें - द्विआधारी परिणाम के लिए, इसे ठीक किया जाना चाहिए (जैसा कि मेरे ओपी में मेरे मॉडल में)
जो किंग

1
जब आपके पास एमई / मल्टीलेवल मॉडल होता है, तो कई संस्करण होते हैं। सबसे सामान्य स्थिति की कल्पना कीजिए: । अवरोध में विचरण नहीं है मैं , और त्रुटि अवधि में ε मैंजी अक्सर यादृच्छिक प्रभाव के वर-COVAR मैट्रिक्स के लिए (इस मामले में एक अदिश, प्रयोग किया जाता है σ 2 ) और आर मैं अवशिष्ट प्रसरण का वर-COVAR मैट्रिक्स के लिए है ε मैंYi=β0+β1X+bi+εibiεiGσb2Riεiनिश्चित और उस क्लस्टर के यादृच्छिक प्रभावों के लिए लेखांकन के बाद। यह आमतौर पर के एक विकर्ण मैट्रिक्स के रूप में कल्पना की है की। इसके अलावा, दोनों dists को बहुभिन्नरूपी सामान्य w / माध्य = 0 माना जाता है। σ2
गूँग - मोनिका

जवाबों:


8

मैं अपनी टिप्पणी नीचे टिप्पणी के रूप में पोस्ट करना पसंद करूंगा लेकिन यह पर्याप्त नहीं होगा। ये एक जवाब के बजाय सवाल हैं (@ इस तरह से मैं इस विषय पर काफी मजबूत महसूस नहीं कर रहा हूं)।

मैं इस धारणा के तहत हूं कि MCMCglmm एक "सच" बायेसियन ग्लैम को लागू नहीं करता है। इस पेपर के सेक्शन 2 में असली बेसेसियन मॉडल का वर्णन किया गया है । इसी तरह frequentist मॉडल के लिए, एक है और एक पूर्व फैलाव पैरामीटर पर आवश्यक है φ 1 तय पैरामीटर के अलावा बीटा और "जी" के विचरण यादृच्छिक प्रभाव यूg(E(yu))=Xβ+Zuϕ1βu

लेकिन के अनुसार इस MCMCglmm शब्दचित्र , मॉडल MCMCglmm में लागू द्वारा दिया जाता है , और यह फैलाव पैरामीटर शामिल नहीं करता है φ 1 । यह शास्त्रीय अक्सरवादी मॉडल के समान नहीं है।g(E(yu,e))=Xβ+Zu+eϕ1

इसलिए मैं हैरान नहीं किया जाएगा का कोई अनुरूप है कि वहाँ glmer साथ।σe

कृपया इन असभ्य टिप्पणियों के लिए माफी माँगें, मैंने बस इसके बारे में एक त्वरित नज़र डाली।


धन्यवाद। क्या यह विषय कठिन माना जाता है, क्योंकि मुझे यह काफी कठिन लग रहा है? मुझे लगता है कि मैं अब आर और जी संरचना के अर्थ से संतुष्ट हूं। मैं अभी भी की कमी के बारे में उलझन में हूँ के साथ और मैं अपनी टिप्पणी के बारे में बहुत उत्सुक हूँ वास्तव में बायेसियन नहीं है। मैं ईमानदारी से नहीं कह सकता मैं कागज के सभी कि आप से जुड़ा हुआ समझते हैं और मैं भी के कुछ हिस्सों के साथ संघर्ष कर रहा हूँ मेरी उदाहरण के नजरिए से शब्दचित्र, लेकिन सिर्फ विशुद्ध रूप से, मेरा मानना है कि फैलाव पैरामीटर φ 1 निरंतर होना चाहिए (क्योंकि उदाहरण द्विपद है)। मुझे किसकी याद आ रही है ? σeglmerMCMCglmmMCMCglmmϕ1
जो राजा

क्षमा करें, मेरे शब्द पूरी तरह से उचित नहीं थे। MCMCglmm वास्तव में बायेसियन है, लेकिन यह बिल्कुल शास्त्रीय ग्लम (मुझे नहीं लगता) को लागू नहीं करता है। इसके अलावा आपको इस बात से अवगत होना होगा कि प्रायोजकों को अक्सर पुष्टता के करीब विचरण घटकों पर एक अनुमान लगाने में मुश्किल होती है।
स्टीफन लॉरेंट

एक बार फिर धन्यवाद। मेरे अध्ययन में मैंने पाया है कि मैं MCMCglmmविभिन्न प्रकार के मापदंडों का उपयोग करने में विचरण घटकों के लिए डिफ़ॉल्ट उलटा-वारहार्ट वितरण का उपयोग कर सकता हूं , और 95% विश्वसनीय अंतराल में हमेशा यादृच्छिक प्रभाव अनुमान के लिए विचरण मान होता है glmerजिससे मुझे लगा कि यह उचित था , लेकिन मुझे इस मामले की व्याख्या कैसे करनी चाहिए, जो कि विशिष्ट नहीं हो सकती है, जहां परिणाम यह है कि MCMCglmmअंतराल पहले की पसंद के प्रति बहुत संवेदनशील नहीं हैं? शायद मुझे इस बारे में एक नया सवाल पूछना चाहिए?
जो किंग

शायद आपके पास एक बड़ा नमूना आकार है? अपने प्रारंभिक सवाल के संबंध में, मैं धारणा है कि, द्विपद मामले के लिए कम से कम, glmer मॉडल के साथ MCMCglmm मॉडल के बराबर है के तहत कर रहा हूँ । यदि आप highly ई पर अत्यधिक केंद्रित पर एक पूर्व निर्धारित करते हैं तो क्या होता है ? σe=0σe0
स्टीफन लॉरेंट

हां, मेरे पास एक बहुत बड़ा नमूना आकार है: 225 क्लस्टर में 50,000 अवलोकन (मेरा अपना डेटा, मेरे प्रश्न में उदाहरण नहीं)। जब मैं एक पूर्व बहुत शून्य पर पास केंद्रित सेट के लिए: वी सेट करके, = 0.01 और न्यू = 100 तो मैं 0.25 (0.16, 0.29 सीआई) प्राप्त σ और 0.53 (0.38, 0.73) के लिए σ यू । जब मैंने V = 10 और nu = 0.01 के साथ कम सूचनात्मक पूर्व निर्धारित किया है, तो मैं क्रमशः 0.18 (0.12, 0.23) और 0.49 (0.34, 0.63) प्राप्त करता हूं। इसकी तुलना 0.51 से की जाती है । मैंने पहले भी एक अनुचित फ्लैट की कोशिश की थी, जिसने 0.10 (0.08, 0.13) और 0.47 (0.25, 0.68) दिया था। σeσeσuglmer
जो किंग

11

Rσe21

GG

एक अंतिम नोट, क्योंकि अवशिष्ट विचरण शून्य पर तय नहीं है, अनुमान उन से मेल नहीं खाएगा glmer। आपको उन्हें पुनर्विक्रय करने की आवश्यकता है। यहाँ एक छोटा सा उदाहरण है (यादृच्छिक प्रभावों का उपयोग नहीं, लेकिन यह सामान्य करता है)। ध्यान दें कि आर संरचना का विचरण 1 पर कैसे तय किया जाता है।

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

यहाँ द्विपद परिवार के लिए स्थाई स्थिरांक है:

k <- ((16*sqrt(3))/(15*pi))^2

अब इसके द्वारा घोल को विभाजित करें, और पीछे के मोड प्राप्त करें

posterior.mode(m2$Sol/(sqrt(1 + k)))

जो हम से मिलता है उसके काफी करीब होना चाहिए glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

क्या आपको पता होगा कि MCMCglmm में लेवल एक पर हेटेरोसेडासिटी को कैसे निर्दिष्ट किया जाए? क्या वह R संरचना है? सिंटैक्स क्या है?
मैक्सिम.क

@ जोशुआ, क्या आप "द्विपद परिवार के लिए स्थिर रहने" की व्याख्या कर सकते हैं? पुनश्च: बीज के लिए 123, मुझे m2मूल्यों से (सुधार के साथ) मिलता है -8.164और 0.421; और से glmमूल्यों -8.833और 0.430
कास्वेद

डेज़ल एट में रिस्कलिंग स्थिरांक पाया जा सकता है। अल। ( Amazon.de/Analysis-Longitudinal-Oxford-Statistical-Science/dp/... ) - के अनुसार cran.r-project.org/web/packages/MCMCglmm/vignettes/... eq। २.१४ पृष्ठ ४ page पर।
१५:०६
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.