जवाबों:
जिस वितरण के बारे में आप पूछ रहे हैं उसे पॉइसन बिनोमियल डिस्ट्रीब्यूशन कहा जाता है , बल्कि जटिल pmf के साथ (व्यापक विवरण के लिए विकिपीडिया देखें)
आम तौर पर, समस्या यह है कि आप इस समीकरण को कुछ बड़ी संख्या में परीक्षणों के लिए उपयोग नहीं कर सकते हैं (आमतौर पर जब परीक्षणों की संख्या से अधिक हो जाती है )। Pmf की गणना करने के अन्य तरीके भी हैं, उदाहरण के लिए पुनरावर्ती सूत्र, लेकिन वे संख्यात्मक रूप से अस्थिर हैं। उन समस्याओं के आसपास सबसे आसान तरीका सन्निकटन विधियाँ हैं (उदाहरण के लिए हाँग, 2013 द्वारा वर्णित )। अगर हम परिभाषित करते हैं
फिर हम छोटी संख्या या ले कैंसेज़ प्रमेय के माध्यम से पॉसों के वितरण के साथ पीएमएफ का अनुमान लगा सकते हैं
लेकिन यह देखता है कि आमतौर पर द्विपद सन्निकटन बेहतर व्यवहार करता है ( चोई और ज़िया, 2002 )
आप सामान्य सन्निकटन का उपयोग कर सकते हैं
या cdf को तथाकथित परिष्कृत सामान्य सन्निकटन (वोल्कोवा, 1996) का उपयोग करके अनुमानित किया जा सकता है
जहाँ ।
एक अन्य विकल्प बेशक एक मोंटे कार्लो सिमुलेशन है।
सरल dpbinom
आर समारोह होगा
dpbinom <- function(x, prob, log = FALSE,
method = c("MC", "PA", "NA", "BA"),
nsim = 1e4) {
stopifnot(all(prob >= 0 & prob <= 1))
method <- match.arg(method)
if (method == "PA") {
# poisson
dpois(x, sum(prob), log)
} else if (method == "NA") {
# normal
dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
} else if (method == "BA") {
# binomial
dbinom(x, length(prob), mean(prob), log)
} else {
# monte carlo
tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
tmp <- tmp/sum(tmp)
p <- as.numeric(tmp[as.character(x)])
p[is.na(p)] <- 0
if (log) log(p)
else p
}
}
अधिकांश विधियां (और अधिक) आर पॉइबिन पैकेज में भी लागू की जाती हैं ।
चेन, एलएचवाई (1974)। पोइसन बीनोमियल के कन्वर्जेंस पर पोइसन डिस्ट्रीब्यूशन। एनल्स ऑफ प्रोबेबिलिटी, 2 (1), 178-180।
चेन, एसएक्स और लियू, जेएस (1997)। Poisson-Binomial और सशर्त बर्नौली वितरण के सांख्यिकीय अनुप्रयोग। स्टेटिस्टिका सिनिका 7, 875-892।
चेन, एसएक्स (1993)। पॉसों-द्विपद वितरण, सशर्त बर्नौली वितरण और अधिकतम एन्ट्रापी। तकनीकी प्रतिवेदन। सांख्यिकी विभाग, हार्वर्ड विश्वविद्यालय।
चेन, एक्सएच, डेम्पस्टर, एपी और लियू, जेएस (1994)। भारित परिमित जनसंख्या नमूना एन्ट्रापी को अधिकतम करने के लिए। बायोमेट्रिक 81, 457-469।
वांग, YH (1993)। स्वतंत्र परीक्षणों में सफलताओं की संख्या पर। स्टेटिस्टिका सिनिका 3 (2): 295-312।
हांग, वाई। (2013)। Poisson द्विपद वितरण के लिए वितरण समारोह की गणना करने पर। कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण, 59, 41-51।
वोल्कोवा, एए (1996)। स्वतंत्र यादृच्छिक संकेतकों की रकम के लिए केंद्रीय सीमा प्रमेय का शोधन। संभाव्यता का सिद्धांत और इसके अनुप्रयोग 40, 791-794।
चोई, केपी और ज़िया, ए (2002)। स्वतंत्र परीक्षणों में लगभग सफलताओं की संख्या: द्विपद बनाम पॉसन। वार्षिक की संभावना, 14 (4), 1139-1148।
ले कैम, एल (1960)। पोइसन द्विपद वितरण के लिए एक अनुमान प्रमेय। पैसिफिक जर्नल ऑफ़ मैथमेटिक्स 10 (4), 1181–1197।