मैं एक सामान्यीकृत रैखिक मिश्रित मॉडल में यादृच्छिक प्रभाव के विचरण की व्याख्या कैसे करूं


9

एक लॉजिस्टिक सामान्यीकृत रैखिक मिश्रित मॉडल (परिवार = द्विपद) में, मैं नहीं जानता कि यादृच्छिक प्रभावों की व्याख्या कैसे करें:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

मैं इस संख्यात्मक परिणाम की व्याख्या कैसे करूं?

मेरे पास एक बहुस्तरीय अध्ययन में गुर्दे के trasplanted रोगियों का एक नमूना है। मैं परीक्षण कर रहा था कि क्या एक मरीज को एक विशिष्ट एंटीहाइपरटेंसिव उपचार के साथ इलाज की संभावना केंद्रों के बीच समान है। उपचारित रोगियों का अनुपात केंद्रों के बीच बहुत भिन्न होता है, लेकिन रोगियों की आधारभूत विशेषताओं में अंतर के कारण हो सकता है। इसलिए मैंने एक सामान्यीकृत रैखिक मिश्रित मॉडल (लॉजिस्टिक) का अनुमान लगाया, जो कि पैटीन्स की प्रमुख विशेषताओं के लिए समायोजन है। यह परिणाम हैं:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

मात्रात्मक चर केंद्रित हैं। मुझे पता है कि लॉग-ऑड स्केल में इंटरसेप्ट के बीच-अस्पताल मानक विचलन 0.6554 है। क्योंकि अवरोधन -1.804469 है, लॉग-ऑड्स स्केल में, तब एक आदमी की एंटीहाइपरटेन्सिव के साथ इलाज किए जाने की संभावना, औसत आयु के साथ, सभी चर में औसत मूल्य और इनमुनो उपचार ए में, एक "औसत" केंद्र के लिए, 14.1% है। । और अब व्याख्या शुरू होती है: इस धारणा के तहत कि यादृच्छिक प्रभाव एक सामान्य वितरण का पालन करते हैं, हम लगभग 95% केंद्रों से शून्य के मतलब के 2 मानक विचलन के भीतर एक मूल्य होने की उम्मीद करेंगे, इसलिए औसत आदमी के लिए इलाज की संभावना के बीच के अंतराल के साथ अलग-अलग अंतराल होंगे:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

क्या ये सही है?

इसके अलावा, अगर केंद्रों के बीच परिवर्तनशीलता सांख्यिकीय रूप से महत्वपूर्ण है, तो मैं ग्लैमर में कैसे परीक्षण कर सकता हूं? मैं डोनाल्ड हेडेक के एक उत्कृष्ट सॉफ्टवेयर मिक्सनो के साथ काम करता था, और वहां मेरे पास अनुमान विचरण की एक मानक त्रुटि है, जो कि मेरे पास नहीं है। प्रत्येक केंद्र में "औसत" आदमी के लिए विश्वासपात्र अंतराल के साथ इलाज किए जाने की संभावना कैसे हो सकती है?

धन्यवाद

जवाबों:


10

यदि आप हमें अपने मॉडल के बारे में अधिक जानकारी दिखाते हैं, तो यह संभवतः सबसे अधिक उपयोगी है, लेकिन जो कुछ भी आपकी प्रतिक्रिया है, जैसे लॉग-ऑड्स का आधारभूत मान (जैसे मृत्यु दर) अस्पतालों में भिन्न होता है। बेसलाइन वैल्यू (प्रति अस्पताल इंटरसेप्ट टर्म) किसी भी निरंतर भविष्यवाणियों के शून्य मान पर बेसलाइन श्रेणी (जैसे "अनुपचारित") में मृत्यु दर (या जो भी हो) की लॉग-ऑड है। लॉग-ऑड पैमाने पर यह भिन्नता सामान्य रूप से वितरित की जाती है। इंटरसेप्ट के बीच-अस्पताल मानक विचलन 0.6554 है; विचरण (सिर्फ मानक विचलन चुकता - मानक विचलन की अनिश्चितता का माप नहीं ) ।0.65542=0.4295

(यदि आप अपने प्रश्न को स्पष्ट करते हैं / अपने मॉडल के बारे में अधिक विवरण जोड़ते हैं तो मैं और अधिक कहने का प्रयास कर सकता हूं।)

अद्यतन : भिन्नता की आपकी व्याख्या सही लगती है। ज्यादा ठीक,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

आपको बेसलाइन (पुरुष / औसत आयु / आदि) की संभावनाओं के लिए 95% अंतराल (वास्तव में काफी आत्मविश्वास अंतराल नहीं है, लेकिन बहुत समान) देना चाहिए।

यादृच्छिक प्रभाव के महत्व का परीक्षण करने के लिए, आपके पास विभिन्न प्रकार के विकल्प हैं ( अधिक जानकारी के लिए http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html देखें)। (ध्यान दें कि आरई संस्करण की मानक त्रुटि आमतौर पर महत्व का परीक्षण करने का एक विश्वसनीय तरीका नहीं है, क्योंकि नमूना वितरण अक्सर तिरछा / गैर-सामान्य होता है।) सबसे सरल दृष्टिकोण एक संभावना अनुपात परीक्षण करना है, जैसे।

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

2 से अंतिम विभाजन इस तथ्य के लिए सही है कि संभावना अनुपात परीक्षण रूढ़िवादी है जब शून्य मान (यानी आरई संस्करण = 0) संभव स्थान की सीमा पर है (यानी आरई संस्करण विरूद्ध नहीं हो सकता है <0)।


मैंने प्रश्न संपादित किया
user2310909

1
धन्यवाद, यह उस व्यक्ति के लिए पढ़ने के लिए एक खुशी है जो विषय के बारे में अच्छी तरह से जानता है।
user2310909
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.