Poisson प्रतिगमन से डेटा नमूने उत्पन्न करें


14

मैं सोच रहा था कि आप R में एक पोइसन रिग्रेशन समीकरण से डेटा कैसे उत्पन्न करेंगे? मैं उलझन में हूँ कि समस्या का सामना कैसे किया जाए।

इसलिए अगर मुझे लगता है कि हमारे पास दो भविष्यवक्ता और X_2 हैं जिन्हें N (0,1) वितरित किया गया है । और अवरोधन 0 है और दोनों गुणांक बराबर 1 हैं। तब मेरा अनुमान बस है:X1X2N(0,1)

log(Y)=0+1X1+1X2

लेकिन एक बार जब मैंने लॉग (वाई) की गणना कर ली है - तो उसके आधार पर मैं पिसन काउंट कैसे उत्पन्न करूं? पोइसन वितरण के लिए दर पैरामीटर क्या है?

अगर कोई भी एक संक्षिप्त आर स्क्रिप्ट लिख सकता है जो पॉइसन प्रतिगमन नमूने उत्पन्न करता है जो भयानक होगा!

जवाबों:


25

Poisson प्रतिगमन मॉडल लिए एक Poisson वितरण मानता है और लिंक फ़ंक्शन का उपयोग करता है । तो, एकल व्याख्यात्मक चर , यह माना जाता है कि (ताकि ) और वह । उस मॉडल के अनुसार डेटा उत्पन्न करना आसानी से अनुसरण करता है। यहाँ एक उदाहरण है जिसे आप अपने परिदृश्य के अनुसार अनुकूलित कर सकते हैं।YlogxYP(μ)E(Y)=V(Y)=μlog(μ)=β0+β1x

>   #sample size
> n <- 10
>   #regression coefficients
> beta0 <- 1
> beta1 <- 0.2
>   #generate covariate values
> x <- runif(n=n, min=0, max=1.5)
>   #compute mu's
> mu <- exp(beta0 + beta1 * x)
>   #generate Y-values
> y <- rpois(n=n, lambda=mu)
>   #data set
> data <- data.frame(y=y, x=x)
> data
   y         x
1  4 1.2575652
2  3 0.9213477
3  3 0.8093336
4  4 0.6234518
5  4 0.8801471
6  8 1.2961688
7  2 0.1676094
8  2 1.1278965
9  1 1.1642033
10 4 0.2830910

3

यदि आप एक डेटा सेट उत्पन्न करना चाहते हैं जो मॉडल को पूरी तरह से फिट करता है तो आप इस तरह से कुछ कर सकते हैं R:

# y <- exp(B0 + B1 * x1 + B2 * x2)

set.seed(1234)

B0 <-  1.2                # intercept
B1 <-  1.5                # slope for x1
B2 <- -0.5                # slope for x2

y <- rpois(100, 6.5)

x2 <- seq(-0.5, 0.5,,length(y))
x1 <- (log(y) - B0 - B2 * x2) / B1

my.model <- glm(y ~ x1 + x2, family = poisson(link = log))
summary(my.model)

कौन सा रिटर्न:

Call:
glm(formula = y ~ x1 + x2, family = poisson(link = log))

Deviance Residuals: 
       Min          1Q      Median          3Q         Max  
-2.581e-08  -1.490e-08   0.000e+00   0.000e+00   4.215e-08  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.20000    0.08386  14.309  < 2e-16 ***
x1           1.50000    0.16839   8.908  < 2e-16 ***
x2          -0.50000    0.14957  -3.343 0.000829 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 8.8619e+01  on 99  degrees of freedom
Residual deviance: 1.1102e-14  on 97  degrees of freedom
AIC: 362.47

Number of Fisher Scoring iterations: 3
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.