मेरे पास एक डेटा सेट है जिसे मैं एक पॉइसन वितरण का पालन करने की उम्मीद करूंगा, लेकिन यह लगभग 3 गुना अधिक है। वर्तमान में, मैं आर में निम्नलिखित कोड की तरह कुछ का उपयोग करके इस अतिप्रवाह को मॉडलिंग कर रहा हूं।
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
नेत्रहीन, यह मेरे अनुभवजन्य डेटा को बहुत अच्छी तरह से फिट करता है। यदि मैं फिट से खुश हूं, तो क्या कोई कारण है कि मुझे कुछ और जटिल करना चाहिए, जैसे कि एक नकारात्मक द्विपद वितरण का उपयोग करना , जैसा कि यहां वर्णित है ? (यदि हां, तो ऐसा करने पर किसी भी संकेत या लिंक की बहुत सराहना की जाएगी)।
ओह, और मुझे पता है कि यह थोड़ा दांतेदार वितरण (तीन से गुणा के कारण) बनाता है, लेकिन यह मेरे आवेदन के लिए मायने नहीं रखना चाहिए।
अद्यतन: किसी और के लिए, जो इस प्रश्न को खोजता है और पाता है, यहां एक नकारात्मक द्विपद वितरण का उपयोग करके एक अति विशिष्ट कविता को मॉडल करने के लिए एक सरल आर फ़ंक्शन है। वांछित माध्य / विचरण अनुपात के लिए d सेट करें:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(आर मेलिंग सूची के माध्यम से: https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )