मैन्युअल रूप से एक लॉजिस्टिक प्रतिगमन 95% आत्मविश्वास अंतराल की गणना करने और आर में कॉन्फिन () फ़ंक्शन का उपयोग करने के बीच अंतर क्यों है?


34

प्रिय हर कोई - मैंने कुछ अजीब देखा है जो मैं समझा नहीं सकता, क्या आप कर सकते हैं? सारांश में: लॉजिस्टिक रिग्रेशन मॉडल में एक आत्मविश्वास अंतराल की गणना करने के लिए मैनुअल दृष्टिकोण, और आर फ़ंक्शन confint()अलग-अलग परिणाम देते हैं।

मैं होस्मेर और लेमेशो के एप्लाइड लॉजिस्टिक रिग्रेशन (2 वें संस्करण) से गुजर रहा हूं । तीसरे अध्याय में अंतर अनुपात और 95% आत्मविश्वास अंतराल की गणना करने का एक उदाहरण है। आर का उपयोग करके, मैं आसानी से मॉडल को पुन: पेश कर सकता हूं:

Call:
glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial")

Deviance Residuals: 
   Min      1Q  Median      3Q     Max  
-1.734  -0.847  -0.847   0.709   1.549  

Coefficients:
                             Estimate Std. Error z value Pr(>|z|)    
(Intercept)                   -0.8408     0.2551  -3.296  0.00098 ***
as.factor(dataset$dich.age)1   2.0935     0.5285   3.961 7.46e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 136.66  on 99  degrees of freedom
Residual deviance: 117.96  on 98  degrees of freedom
AIC: 121.96

Number of Fisher Scoring iterations: 4

हालांकि, जब मैं मापदंडों के विश्वास अंतराल की गणना करता हूं, तो मुझे पाठ में दिए गए एक अलग अंतराल मिलता है:

> exp(confint(model))
Waiting for profiling to be done...
                                 2.5 %     97.5 %
(Intercept)                  0.2566283  0.7013384
as.factor(dataset$dich.age)1 3.0293727 24.7013080

होसमेर और लेमेशो निम्नलिखित सूत्र का सुझाव देते हैं:

[β^1±z1-α/2×एसई^(β^1)]

और वे होने के लिए विश्वास अंतराल की गणना करते as.factor(dataset$dich.age)1हैं (2.9, 22.9)।

यह आर में करने के लिए सीधा लगता है:

# upper CI for beta
exp(summary(model)$coefficients[2,1]+1.96*summary(model)$coefficients[2,2])
# lower CI for beta
exp(summary(model)$coefficients[2,1]-1.96*summary(model)$coefficients[2,2])

पुस्तक के समान ही उत्तर देता है।

हालाँकि, कोई भी विचार confint()अलग परिणाम क्यों देता है? मैंने उपयोग करने वाले लोगों के बहुत सारे उदाहरण देखे हैं confint()


1
क्या आप होसमेर और लेमेशो के लिए सटीक साहित्य संदर्भ जोड़ना चाहेंगे? मैं काफी समय से उनके विद्यार्थियों और पुस्तकों में सुझाव की तलाश कर रहा था, लेकिन अभी तक नहीं मिला है।
डेविड नर्व

जवाबों:


36

साथ वाली वेबसाइट से डेटा प्राप्त करने के बाद , मैं यहां बताऊंगा कि मैं यह कैसे करूंगा:

chdage <- read.table("chdage.dat", header=F, col.names=c("id","age","chd"))
chdage$aged <- ifelse(chdage$age>=55, 1, 0)
mod.lr <- glm(chd ~ aged, data=chdage, family=binomial)
summary(mod.lr)

प्रोफ़ाइल संभावना के आधार पर 95% सीआई प्राप्त होते हैं

require(MASS)
exp(confint(mod.lr))

यदि MASSपैकेज स्वचालित रूप से लोड किया जाता है तो यह अक्सर डिफ़ॉल्ट होता है । इस मामले में, मुझे मिलता है

                2.5 %     97.5 %
(Intercept) 0.2566283  0.7013384
aged        3.0293727 24.7013080

अब, अगर मैं आपके द्वारा हाथ की गणना की तरह 95% Wald CI (asymptotic normality के आधार पर) के साथ तुलना करना चाहता था, तो मैं confint.default()इसके बजाय उपयोग करूंगा ; यह प्रदान करता है

                2.5 %     97.5 %
(Intercept) 0.2616579  0.7111663
aged        2.8795652 22.8614705

वाल्ड सीआई ज्यादातर स्थितियों में अच्छे हैं, हालांकि जटिल नमूनाकरण रणनीतियों के साथ प्रोफ़ाइल संभावना आधारित हो सकती है। यदि आप इस विचार को समझना चाहते हैं कि वे कैसे काम करते हैं, तो यहां मुख्य सिद्धांतों का संक्षिप्त विवरण दिया गया है: पशु महामारी विज्ञान में अनुप्रयोगों के साथ, प्रोफाइल संभावना विधि द्वारा आत्मविश्वास अंतराल । आप वेनेबल्स और रिप्ले की एमएएस पुस्तक, ,8.4, पीपी। 220-221 पर भी नज़र डाल सकते हैं।


25

निम्नलिखित: प्रोफ़ाइल आत्मविश्वास अंतराल अधिक विश्वसनीय होते हैं (संभावना के लिए उपयुक्त कटऑफ का चयन करना एक असममित (बड़ा नमूना) धारणा को शामिल करता है, लेकिन यह वाल्ड आत्मविश्वास अंतराल के आधार पर द्विघात-संभावना-भूतल धारणा की तुलना में बहुत कमजोर धारणा है)। जहाँ तक मुझे पता है, प्रोफ़ाइल आत्मविश्वास अंतरालों पर Wald आँकड़ों के लिए कोई तर्क नहीं है, सिवाय इसके कि Wald आँकड़ों की गणना करने के लिए बहुत तेज़ हैं और कई परिस्थितियों में "पर्याप्त रूप से अच्छे" हो सकते हैं (लेकिन कभी-कभी रास्ता बंद कर दें: Hauck- देखें डोनर इफ़ेक्ट)।


2
इसके लिए धन्यवाद, और सुझाव के लिए मैं हक-डोनर प्रभाव को देखता हूं। प्रभाव पाठ्यपुस्तकों में ज्यादा इलाज नहीं देता है, लेकिन बहुत महत्वपूर्ण लगता है!
एंड्रयू

18

मेरा मानना ​​है कि यदि आप कॉन्फिडेंट () के लिए हेल्प फाइल देखते हैं, तो आप पाएंगे कि बनाया जा रहा कॉन्फिडेंस वल्द कॉन्फिडेंस इंटरवल (एचएल से आपका फॉर्मूला) के बजाय "प्रोफाइल" इंटरवल है।


5
आह। वह सवाल का जवाब देता है। हालांकि, यह अगले एक की ओर जाता है - कौन सा पसंद किया जाता है?
एंड्रयू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.