यह स्पष्ट है कि ग्रेग का सुझाव पहली कोशिश करने के लिए है: पॉयन प्रतिगमन कई ठोस में प्राकृतिक मॉडल है स्थितियों।
हालाँकि आप जिस मॉडल का सुझाव दे रहे हैं वह उदाहरण के लिए हो सकता है जब आप गोल डेटा का निरीक्षण करते हैं:
iid सामान्य त्रुटियों ।
Yमैं= ⌊ एएक्समैं+ बी +εमैं⌋ ,
εमैं
मुझे लगता है कि इसके साथ क्या किया जा सकता है, इस पर एक नज़र रखना दिलचस्प है। मैं को सामान्य सामान्य चर के cdf द्वारा निरूपित करता हूं । यदि , तो
परिचित कंप्यूटर नोटेशन का उपयोग करके ।एफε ~ एन( 0 ,σ2)
P(⌊ax+b+ϵ⌋=k)=F(k−b+1−axσ)−F(k−b−axσ)=pnorm(k+1−ax−b,sd=σ)−pnorm(k−ax−b,sd=σ),
आप डेटा बिंदुओं का निरीक्षण करते हैं । लॉग संभावना को
यह कम से कम वर्गों के समान नहीं है। आप इसे एक संख्यात्मक विधि के साथ अधिकतम करने का प्रयास कर सकते हैं। यहाँ R में एक चित्रण है:(xi,yi)
ℓ(a,b,σ)=∑ilog(F(yi−b+1−axiσ)−F(yi−b−axiσ)).
log_lik <- function(a,b,s,x,y)
sum(log(pnorm(y+1-a*x-b, sd=s) - pnorm(y-a*x-b, sd=s)));
x <- 0:20
y <- floor(x+3+rnorm(length(x), sd=3))
plot(x,y, pch=19)
optim(c(1,1,1), function(p) -log_lik(p[1], p[2], p[3], x, y)) -> r
abline(r$par[2], r$par[1], lty=2, col="red")
t <- seq(0,20,by=0.01)
lines(t, floor( r$par[1]*t+r$par[2]), col="green")
lm(y~x) -> r1
abline(r1, lty=2, col="blue");
लाल और नीले रंग में, रेखाएं इस संभावना के संख्यात्मक अधिकतमकरण द्वारा पाई जाती हैं, और कम से कम वर्ग। हरे रंग की सीढ़ी अधिकतम संभावना से पाए गए लिए ... यह सुझाव देता है कि आप कम से कम वर्गों का उपयोग कर सकते हैं, अनुवाद में 0.5 तक, और मोटे तौर पर एक ही परिणाम प्राप्त कर सकते हैं; या, वह कम से कम वर्ग अच्छी तरह से मॉडल
जहां निकटतम पूर्णांक है। गोल डेटा इतनी बार मिले हैं कि मुझे यकीन है कि यह ज्ञात है और बड़े पैमाने पर अध्ययन किया गया है ...ax+b⌊ax+b⌋a,bb
Yi=[axi+b+ϵi],
[x]=⌊x+0.5⌋