मैं वर्तमान में एक प्रोजेक्ट पर काम कर रहा हूं जिसमें समय के साथ कुछ गणना डेटा के GLM (और अंततः GAM) शामिल हैं। आम तौर पर मैं इसे एसएएस में करूंगा, लेकिन मैं आर के लिए जाने की कोशिश कर रहा हूं, और ... मुद्दे।
जब मैं निम्नलिखित का उपयोग करके डेटा गिनने के लिए GLM फिट करता हूं:
cdi_model <- glm(counts ~ exposure + covariate + month, data=test, family = poisson)
मुझे मिला:
Deviance Residuals:
Min 1Q Median 3Q Max
-1.9825 -0.7903 -0.1187 0.5717 1.7649
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.97563 0.20117 9.821 < 2e-16 ***
exposure 0.94528 0.30808 3.068 0.00215 **
covariate -0.01317 0.28044 -0.047 0.96254
months -0.03203 0.01303 -2.458 0.01398 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 40.219 on 29 degrees of freedom
Residual deviance: 29.297 on 26 degrees of freedom
AIC: 137.7
Number of Fisher Scoring iterations: 5
प्रदर्शन के एक पल के लिए नजरअंदाज करें, या उसके मॉडल की कमी है - ज्यादातर इस बिंदु पर वाक्य रचना और पसंद के साथ।
हालाँकि, जब मैं रेट डेटा (काउंट्स / व्यक्ति-दिन) फिट करने की कोशिश करता हूं और एक ऑफसेट का उपयोग करता हूं:
cdi_model <- glm(count_rate ~ exposure + covariate + months + offset(log(pd)), data=test, family = poisson)
मुझे 50+ चेतावनियाँ मिलती हैं, सभी "1: dpois (y, mu, log = TRUE): गैर-पूर्णांक x = 0.002082" आदि जो प्रत्येक अवलोकन के लिए एक से अधिक है (डेटा सेट में केवल 30 है)।
इसके अतिरिक्त, मॉडल फिट बर्तन में जाने के लिए लगता है। आउटपुट निम्नानुसार है:
Deviance Residuals:
Min 1Q Median 3Q Max
-0.0273656 -0.0122169 0.0002396 0.0072269 0.0258643
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -15.40110 15.12772 -1.018 0.309
exposure 0.84848 22.18012 0.038 0.969
covariate -0.02751 21.31262 -0.001 0.999
months -0.01889 0.95977 -0.020 0.984
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 0.0068690 on 29 degrees of freedom
Residual deviance: 0.0054338 on 26 degrees of freedom
AIC: Inf
Number of Fisher Scoring iterations: 9
इसके बावजूद, अगर मैं वास्तविक डेटा के खिलाफ अनुमानित दर की साजिश रचता हूं, तो फिट उतना बुरा नहीं दिखता है, और वास्तविक प्रभाव का अनुमान यह सब बदलने के लिए प्रतीत नहीं होता है।
किसी को भी एक विचार है कि क्या चल रहा है - या अगर सब कुछ सही हो रहा है और मैं अनुभवहीनता के कारण कुछ याद कर रहा हूं?