इस मामले में आप के लिए अपने डेटा को संक्षिप्त कर सकते
जहां एस मैं जे के लिए उदाहरणों की संख्या है एक्स = मैं और y = j साथ मैं , जे ∈ { 0 , 1 } । मान लीजिए कि कुल मिलाकर n अवलोकन हैं।
X∖Y010S00S101S01S11
Sijx=iy=ji,j∈{0,1}n
अगर हम मॉडल फिट (जहां जी हमारे लिंक समारोह है) हम चाहते हैं कि मिल जाएगा β 0 है सफलताओं के अनुपात का logit जब x मैं = 0 और बीटा 0 + β 1 सफलताओं जब के अनुपात का logit हैpi=g−1(xTiβ)=g−1(β0+β11xi=1)gβ^0xi=0β^0+β^1 । दूसरे शब्दों
में, β 0 = जी ( एस 01xi=1
और
β 0+ β 1=जी(एस11
β^0=g(S01S00+S01)
β^0+β^1=g(S11S10+S11).
आइये चेक करते है R
।
n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)
tbl <- table(x=x,y=y)
mod <- glm(y ~ x, family=binomial())
# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])
# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])
तो लॉजिस्टिक रिग्रेशन गुणांक तालिका से आने वाले अनुपात के बिल्कुल रूपांतरण हैं।
अपशॉट यह है कि हम निश्चित रूप से इस डेटासेट को लॉजिस्टिक रिग्रेशन के साथ विश्लेषण कर सकते हैं यदि हमारे पास बर्नौली यादृच्छिक चर की श्रृंखला से आने वाला डेटा है, लेकिन यह परिणामी आकस्मिक तालिका का विश्लेषण करने की तुलना में अलग नहीं है।
Yi|xi∼⊥Bern(pi)xipi=g−1(β0+β1xi)xipip0p1
∑i:xi=0Yi=S01∼Bin(n0,p0)
∑i:xi=1Yi=S11∼Bin(n1,p1).
xin0n1
S01/n0=S01S00+S01→pp0 and S11/n1=S11S10+S11→pp1.
Yi|xi=j∼Bern(pj)Sj1∼Bin(nj,pj)