शून्य के अनुपात की भविष्यवाणी करना
मैं स्टेटमॉड पैकेज का लेखक हूं और ट्वीडेई पैकेज का संयुक्त लेखक हूं। आपके उदाहरण में सब कुछ सही ढंग से काम कर रहा है। कोड किसी भी शून्य के लिए सही तरीके से लेखांकन कर रहा है जो डेटा में हो सकता है।
जैसा कि ग्लेन_ बी और टिम ने समझाया है, जब तक कि शून्य की संभावना 100% न हो जाए, तब तक अनुमानित अर्थ मूल्य बिल्कुल शून्य नहीं होगा। हालांकि ब्याज की क्या हो सकती है, जो शून्य की अनुमानित अनुपात है, और यह आसानी से मॉडल से निकाला जा सकता है जैसा कि मैं नीचे दिखा रहा हूं।
यहाँ एक और अधिक समझदार काम करने का उदाहरण है। पहले कुछ डेटा का अनुकरण करें:
> library(statmod)
> library(tweedie)
> x <- 1:100
> mutrue <- exp(-1+x/25)
> summary(mutrue)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.3829 1.0306 2.7737 5.0287 7.4644 20.0855
> y <- rtweedie(100, mu=mutrue, phi=1, power=1.3)
> summary(y)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.8482 2.9249 4.7164 6.1522 24.3897
> sum(y==0)
[1] 12
डेटा में 12 शून्य होते हैं।
अब एक Tweedie glm फिट करें:
> fit <- glm(y ~ x, family=tweedie(var.power=1.3, link.power=0))
> summary(fit)
Call:
glm(formula = y ~ x, family = tweedie(var.power = 1.3, link.power = 0))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.71253 -0.94685 -0.07556 0.69089 1.84013
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.816784 0.168764 -4.84 4.84e-06 ***
x 0.036748 0.002275 16.15 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Tweedie family taken to be 0.8578628)
Null deviance: 363.26 on 99 degrees of freedom
Residual deviance: 103.70 on 98 degrees of freedom
AIC: NA
Number of Fisher Scoring iterations: 4
एक्सφ
एक्स
> Phi <- 0.85786
> Mu <- fitted(fit)
> Power <- 1.3
> Prob.Zero <- exp(-Mu^(2-Power) / Phi / (2-Power))
> Prob.Zero[1:5]
1 2 3 4 5
0.3811336 0.3716732 0.3622103 0.3527512 0.3433024
> Prob.Zero[96:100]
96 97 98 99 100
1.498569e-05 1.121936e-05 8.336499e-06 6.146648e-06 4.496188e-06
इसलिए शून्य का अनुमानित अनुपात सबसे छोटे औसत मूल्यों पर 38.1% से सबसे कम औसत मान 4.5e-6 तक भिन्न होता है।
दून एंड स्मिथ (2001) ट्वीडेई फैमिली डेंसिटीज: इवैल्यूएशन के तरीके या डन एंड स्मिथ (2005) ट्वीडे एक्सपायरीवेशन फैलाव मॉडल डेंसिटीज के सीरीज मूल्यांकन में सटीक शून्य की संभावना का सूत्र पाया जा सकता है ।