गैर-आइड बर्नौली चर के इस यादृच्छिक योग का प्रायिकता वितरण क्या है?


9

मैं उन यादृच्छिक संख्याओं के योग की संभाव्यता वितरण को खोजने का प्रयास कर रहा हूं, जो पहचान योग्य रूप से वितरित नहीं हैं। यहाँ एक उदाहरण है:

जॉन एक ग्राहक सेवा कॉल सेंटर में काम करता है। वह समस्याओं के साथ कॉल प्राप्त करता है और उन्हें हल करने की कोशिश करता है। जिन्हें वह हल नहीं कर सकता, वह उन्हें अपने श्रेष्ठ की ओर अग्रसर करता है। मान लेते हैं कि एक दिन में उसे जितने भी कॉल आते हैं, मीन के साथ एक पॉइसन वितरण होता हैμ। प्रत्येक समस्या की कठिनाई बहुत ही विशिष्ट सामानों से भिन्न होती है (जिसे वह निश्चित रूप से निपटा सकता है) बहुत ही विशिष्ट प्रश्नों के लिए जिसे वह नहीं जानता कि कैसे हल किया जाए। मान लें कि संभावनाpiवह मापदंडों के साथ बीटा वितरण के बाद i -th समस्या को हल करने में सक्षम हो जाएगाα तथा βऔर पिछली समस्याओं से स्वतंत्र है। एक दिन में वह कितने कॉल का वितरण करता है?

औपचारिक रूप से, मेरे पास:

Y=I(N>0)i=0NXi के लिये i=0,1,2,...,N

कहाँ पे NPoisson(μ) , (Xi|pi)Bernoulli(pi) तथा piBeta(α,β)

ध्यान दें, अभी के लिए, मुझे यह मानकर खुशी है कि Xiस्वतंत्र हैं। मैं यह भी स्वीकार करता हूं कि पैरामीटरμ,α तथा β एक दूसरे को प्रभावित नहीं करते हैं, हालांकि इस का एक वास्तविक जीवन उदाहरण में μ बड़ा है, पैरामीटर α तथा β ऐसे हैं ताकि बीटा वितरण में कम सफलता दर पर अधिक द्रव्यमान है p। लेकिन अब के लिए इसे अनदेखा करें।

मैं हिसाब लगा सकता हूं P(Y=0)इसके बारे में बस इतना ही। मैं मूल्यों का अनुकरण भी कर सकता हूं ताकि यह अंदाजा लगाया जा सके कि इसका वितरण क्या हैY जैसा दिखता है (यह पॉइसन जैसा दिखता है, लेकिन मुझे नहीं पता कि यह नीचे की संख्या में है या नहीं μ,α तथा βमैंने कोशिश की या यह सामान्य हो जाता है, और विभिन्न पैरामीटर मानों के लिए यह कैसे बदल सकता है)। इस वितरण के बारे में कोई भी विचार या मैं इसे कैसे प्राप्त कर सकता हूं?

कृपया ध्यान दें कि मैंने इस प्रश्न को TalkStats फोरम पर भी पोस्ट किया है, लेकिन मैंने सोचा कि यह यहाँ अधिक ध्यान दे सकता है। क्रॉस-पोस्टिंग के लिए माफी और आपके समय के लिए अग्रिम में बहुत धन्यवाद।

संपादित करें : जैसा कि यह निकला है (नीचे बहुत उपयोगी उत्तर देखें - और उन लोगों के लिए धन्यवाद!), यह वास्तव में एक हैPoisson(μαα+β)वितरण, कुछ जो मैं अपने अंतर्ज्ञान और कुछ सिमुलेशन के आधार पर अनुमान लगा रहा था, लेकिन साबित करने में सक्षम नहीं था। हालांकि अब मुझे जो कुछ भी आश्चर्यचकित करता है, वह यह है कि पोइसन वितरण केवल माध्य पर निर्भर करता हैBeta वितरण लेकिन इसके विचरण से प्रभावित नहीं है।

एक उदाहरण के रूप में, निम्नलिखित दो बीटा वितरण का एक ही मतलब है लेकिन अलग-अलग विचरण है। स्पष्टता के लिए, नीला पीडीएफ एक का प्रतिनिधित्व करता हैBeta(2,2) और लाल एक Beta(0.75,0.75)

बीटा डिस्ट्रीब्यूशन

हालांकि, वे दोनों एक ही परिणाम होगा Poisson(0.5μ)वितरण, जो मुझे, थोड़ा जवाबी-सहज लगता है। (यह नहीं कहना कि परिणाम गलत है, बस आश्चर्य की बात है!)


तय के लिए Nवहाँ पॉइसन-द्विपद वितरण है लेकिन आपकी समस्या अधिक जटिल है।
टिम

धन्यवाद, मैं पॉसों-द्विपद वितरण का जानता हूं लेकिन Nयहाँ यादृच्छिक है।
कॉन्स्टैंटिनो

जवाबों:


6

कॉल (जो है, Xi) एक पॉइसन प्रक्रिया के अनुसार आते हैं। कॉल की कुल संख्याNएक पॉइसन वितरण के बाद। कॉल को दो प्रकारों में विभाजित करें, जैसे कि क्याXi=1 या Xi=0। लक्ष्य उस प्रक्रिया को निर्धारित करना है जो उत्पन्न करता है1रों। यह तुच्छ है अगरXi=1 एक निश्चित संभावना के साथ p: पोइसन प्रक्रियाओं के सुपरपोजिशन सिद्धांत द्वारा, पूरी प्रक्रिया को सिर्फ पतला कर दिया गया 1s दर के साथ एक पॉइसन प्रक्रिया भी होगी pμ। वास्तव में यह मामला है, हमें वहां पहुंचने के लिए एक अतिरिक्त कदम की आवश्यकता है।

हाशिए पर pi, ताकि

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

कहाँ पे B(a,b)=Γ(a)Γ(b)Γ(a+b)बीटा फ़ंक्शन है। इस तथ्य का उपयोग करनाΓ(x+1)=xΓ(x)इसके बाद के संस्करण सरल करने के लिए;

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
दूसरे शब्दों में, XiBernoulli(αα+β)। महाशक्तियों द्वारा संपत्ति,Y दर के साथ वितरित पॉसों है αμα+β

एक संख्यात्मक उदाहरण (R के साथ) ... चित्र में, अनुलंब रेखाएँ अनुकार से हैं और लाल बिंदु pmf से ऊपर हैं:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

यहाँ छवि विवरण दर्ज करें


3
  1. जबसे pi के साथ एक यादृच्छिक चर है Beta(α,β) आपके पास E[pi]=αα+β और यह वास्तव में संभावना है कि जॉन वास्तव में हल करता है iवें समस्या, स्वतंत्र रूप से अन्य सभी की।

  2. चूंकि एक दिन में समस्याओं की कुल संख्या में पैरामीटर के साथ एक पॉइसन वितरण है μ और प्रत्येक को प्रायिकता के साथ हल किया जाएगा αα+βसंख्या जॉन प्रतिदिन हल करती है पैरामीटर के साथ एक पॉइसन वितरण है μαα+β

  3. संभावना की आपकी गणना वह किसी भी समस्या को हल नहीं करता है होना चाहिए P(Y=0)=eμα/(α+β)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.