मेरे पास ये डेटा हैं:
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
मैंने एक पोइसन रिग्रेशन चलाया
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
और एक नकारात्मक द्विपद प्रतिगमन:
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
तब मैंने पियर्सन प्रतिगमन के फैलाव आंकड़ों की गणना की:
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
और नकारात्मक द्विपद प्रतिगमन:
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
क्या कोई व्याख्या का उपयोग किए बिना व्याख्या करने में सक्षम है, क्यों नकारात्मक द्विपद प्रतिगमन के लिए फैलाव आँकड़ा काफी हद तक पोइसन प्रतिगमन के लिए फैलाव आँकड़ा से छोटा है?