आर में एक पॉइसन जीएलएम फिटिंग - दर बनाम मायने रखता है


11

मैं वर्तमान में एक प्रोजेक्ट पर काम कर रहा हूं जिसमें समय के साथ कुछ गणना डेटा के GLM (और अंततः GAM) शामिल हैं। आम तौर पर मैं इसे एसएएस में करूंगा, लेकिन मैं आर के लिए जाने की कोशिश कर रहा हूं, और ... मुद्दे।

जब मैं निम्नलिखित का उपयोग करके डेटा गिनने के लिए GLM फिट करता हूं:

cdi_model <- glm(counts ~ exposure + covariate + month, data=test, family = poisson)

मुझे मिला:

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.9825  -0.7903  -0.1187   0.5717   1.7649  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.97563    0.20117   9.821  < 2e-16 ***
exposure     0.94528    0.30808   3.068  0.00215 ** 
covariate   -0.01317    0.28044  -0.047  0.96254    
months      -0.03203    0.01303  -2.458  0.01398 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 40.219  on 29  degrees of freedom
Residual deviance: 29.297  on 26  degrees of freedom
AIC: 137.7

Number of Fisher Scoring iterations: 5

प्रदर्शन के एक पल के लिए नजरअंदाज करें, या उसके मॉडल की कमी है - ज्यादातर इस बिंदु पर वाक्य रचना और पसंद के साथ।

हालाँकि, जब मैं रेट डेटा (काउंट्स / व्यक्ति-दिन) फिट करने की कोशिश करता हूं और एक ऑफसेट का उपयोग करता हूं: cdi_model <- glm(count_rate ~ exposure + covariate + months + offset(log(pd)), data=test, family = poisson)

मुझे 50+ चेतावनियाँ मिलती हैं, सभी "1: dpois (y, mu, log = TRUE): गैर-पूर्णांक x = 0.002082" आदि जो प्रत्येक अवलोकन के लिए एक से अधिक है (डेटा सेट में केवल 30 है)।

इसके अतिरिक्त, मॉडल फिट बर्तन में जाने के लिए लगता है। आउटपुट निम्नानुसार है:

 Deviance Residuals: 
       Min          1Q      Median          3Q         Max  
-0.0273656  -0.0122169   0.0002396   0.0072269   0.0258643  

Coefficients:
             Estimate Std. Error z value Pr(>|z|)
(Intercept) -15.40110   15.12772  -1.018    0.309
exposure      0.84848   22.18012   0.038    0.969
covariate    -0.02751   21.31262  -0.001    0.999
months       -0.01889    0.95977  -0.020    0.984

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 0.0068690  on 29  degrees of freedom
Residual deviance: 0.0054338  on 26  degrees of freedom
AIC: Inf

Number of Fisher Scoring iterations: 9

इसके बावजूद, अगर मैं वास्तविक डेटा के खिलाफ अनुमानित दर की साजिश रचता हूं, तो फिट उतना बुरा नहीं दिखता है, और वास्तविक प्रभाव का अनुमान यह सब बदलने के लिए प्रतीत नहीं होता है।

किसी को भी एक विचार है कि क्या चल रहा है - या अगर सब कुछ सही हो रहा है और मैं अनुभवहीनता के कारण कुछ याद कर रहा हूं?

जवाबों:


17

जब आप ऑफ़सेट जोड़ते हैं तो आपको (और नहीं) की दर की गणना भी करनी चाहिए और एक्सपोज़र को शामिल करना चाहिए।

मुझे नहीं पता कि यह त्रुटियों का कारण है, लेकिन अगर प्रति मामले एक्सपोज़र व्यक्ति का दिन है pd, तो आश्रित चर होना चाहिए countsऔर ऑफसेट log(pd)इस तरह होना चाहिए :

cdi_model <- glm(counts ~ covariate + months + offset(log(pd)), 
                 data=test, family = poisson)

(+1) कभी-कभी मैंने महामारी विज्ञानियों को "एक्सपोज़र" (जैसे "सिगरेट पीने के लिए एक्सपोज़र") के किसी भी स्वतंत्र चर को बुलाया है। लेकिन अच्छी पकड़, आपको निश्चित रूप से आश्रित चर के रूप में दर का उपयोग नहीं करना चाहिए।
एंडी डब्ल्यू

मैंने अनुमान लगाया होगा कि 'महीनों का चर' जोखिम की लंबाई है, लेकिन सिद्धांत समान होगा।
ऐको

@ अंको मुझे लगता है कि हम जल्द ही पता लगा लेंगे। मैं सोच रहा था कि अगर रेट के बारे में सोचना वाजिब है (counts/thing)तो लॉग लीनियर मॉडल लगभग हमेशा होता है counts ~ ... + offset(log(thing))। और जब हम दूसरी चीजों का अनुमान लगा रहे हैं, तो मैं यह भी अनुमान लगाता हूं कि log(pd) == exposure...
संयुक्ताक्षरी

कुछ चीजों को स्पष्ट करने के लिए - एंडी डब्ल्यू सही है। "एक्सपोज़र" वास्तव में ब्याज का एक स्वतंत्र चर है (इस मामले में नीति में बदलाव)। महीनों डेटा में रुझान के लिए कुछ नियंत्रण के लिए अनुमति देने के लिए "तारीख के बाद से महीने" है।
फोमाइट

@ConjugatePrior अपने उत्तर में मॉडल का उपयोग करते समय, क्या मॉडल का आउटपुट एक दर में नहीं होना चाहिए? यह चल रहा है ऑफसेट के समावेश के बावजूद एक कच्ची गिनती के रूप में सब कुछ बाहर रखना। या क्या कोई और कदम है जो मुझे याद आ रहा है?
फोमाइट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.