विभिन्न संभावनाओं के साथ बर्नौली परीक्षणों की सफलता


11

यदि 20 स्वतंत्र बर्नौली परीक्षणों को सफलता की एक अलग संभावना और इसलिए विफलता के साथ किया जाता है। क्या संभावना है कि बिल्कुल 20 परीक्षणों में से n सफल रहा?

क्या सफलता और विफलता की संभावनाओं के संयोजनों को एक साथ समेटने के बजाय इन संभावनाओं की गणना का एक बेहतर तरीका है?

जवाबों:


12

जिस वितरण के बारे में आप पूछ रहे हैं उसे पॉइसन बिनोमियल डिस्ट्रीब्यूशन कहा जाता है , बल्कि जटिल pmf के साथ (व्यापक विवरण के लिए विकिपीडिया देखें)

Pr(X=x)=AFxiApijAc(1pj)

आम तौर पर, समस्या यह है कि आप इस समीकरण को कुछ बड़ी संख्या में परीक्षणों के लिए उपयोग नहीं कर सकते हैं (आमतौर पर जब परीक्षणों की संख्या से अधिक हो जाती है )। Pmf की गणना करने के अन्य तरीके भी हैं, उदाहरण के लिए पुनरावर्ती सूत्र, लेकिन वे संख्यात्मक रूप से अस्थिर हैं। उन समस्याओं के आसपास सबसे आसान तरीका सन्निकटन विधियाँ हैं (उदाहरण के लिए हाँग, 2013 द्वारा वर्णित )। अगर हम परिभाषित करते हैंn=30

μ=i=1npi

σ=i=1npi(1pi)

γ=σ3i=1npi(1pi)(12pi)

फिर हम छोटी संख्या या ले कैंसेज़ प्रमेय के माध्यम से पॉसों के वितरण के साथ पीएमएफ का अनुमान लगा सकते हैं

Pr(X=x)μxexp(μ)x!

लेकिन यह देखता है कि आमतौर पर द्विपद सन्निकटन बेहतर व्यवहार करता है ( चोई और ज़िया, 2002 )

Pr(X=x)Binom(n,μn)

आप सामान्य सन्निकटन का उपयोग कर सकते हैं

f(x)ϕ(x+0.5μσ)

या cdf को तथाकथित परिष्कृत सामान्य सन्निकटन (वोल्कोवा, 1996) का उपयोग करके अनुमानित किया जा सकता है

F(x)max(0, g(x+0.5μσ))

जहाँ ।g(x)=Φ(x)+γ(1x2)ϕ(x)6

एक अन्य विकल्प बेशक एक मोंटे कार्लो सिमुलेशन है।

सरल dpbinomआर समारोह होगा

dpbinom <- function(x, prob, log = FALSE,
                    method = c("MC", "PA", "NA", "BA"),
                    nsim = 1e4) {

  stopifnot(all(prob >= 0 & prob <= 1))
  method <- match.arg(method)

  if (method == "PA") {
    # poisson
    dpois(x, sum(prob), log)
  } else if (method == "NA") {
    # normal
    dnorm(x, sum(prob), sqrt(sum(prob*(1-prob))), log)
  } else if (method == "BA") {
    # binomial
    dbinom(x, length(prob), mean(prob), log)
  } else {
    # monte carlo
    tmp <- table(colSums(replicate(nsim, rbinom(length(prob), 1, prob))))
    tmp <- tmp/sum(tmp)
    p <- as.numeric(tmp[as.character(x)])
    p[is.na(p)] <- 0

    if (log) log(p)
    else p 
  }
}

अधिकांश विधियां (और अधिक) आर पॉइबिन पैकेज में भी लागू की जाती हैं ।


चेन, एलएचवाई (1974)। पोइसन बीनोमियल के कन्वर्जेंस पर पोइसन डिस्ट्रीब्यूशन। एनल्स ऑफ प्रोबेबिलिटी, 2 (1), 178-180।

चेन, एसएक्स और लियू, जेएस (1997)। Poisson-Binomial और सशर्त बर्नौली वितरण के सांख्यिकीय अनुप्रयोग। स्टेटिस्टिका सिनिका 7, 875-892।

चेन, एसएक्स (1993)। पॉसों-द्विपद वितरण, सशर्त बर्नौली वितरण और अधिकतम एन्ट्रापी। तकनीकी प्रतिवेदन। सांख्यिकी विभाग, हार्वर्ड विश्वविद्यालय।

चेन, एक्सएच, डेम्पस्टर, एपी और लियू, जेएस (1994)। भारित परिमित जनसंख्या नमूना एन्ट्रापी को अधिकतम करने के लिए। बायोमेट्रिक 81, 457-469।

वांग, YH (1993)। स्वतंत्र परीक्षणों में सफलताओं की संख्या पर। स्टेटिस्टिका सिनिका 3 (2): 295-312।

हांग, वाई। (2013)। Poisson द्विपद वितरण के लिए वितरण समारोह की गणना करने पर। कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण, 59, 41-51।

वोल्कोवा, एए (1996)। स्वतंत्र यादृच्छिक संकेतकों की रकम के लिए केंद्रीय सीमा प्रमेय का शोधन। संभाव्यता का सिद्धांत और इसके अनुप्रयोग 40, 791-794।

चोई, केपी और ज़िया, ए (2002)। स्वतंत्र परीक्षणों में लगभग सफलताओं की संख्या: द्विपद बनाम पॉसन। वार्षिक की संभावना, 14 (4), 1139-1148।

ले कैम, एल (1960)। पोइसन द्विपद वितरण के लिए एक अनुमान प्रमेय। पैसिफिक जर्नल ऑफ़ मैथमेटिक्स 10 (4), 1181–1197।


0

एक दृष्टिकोण निर्माण कार्यों का उपयोग करना है। आपकी समस्या का समाधान बहुपद में गुणांक हैxn

i=120(pix+1pi).

यह टिम के जवाब (जो घातीय समय होगा) से पोइसन द्विपद वितरण में योग करने के लिए गतिशील प्रोग्रामिंग समकक्ष (बर्नौली चर की संख्या में द्विघात समय) है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.