पॉसों यादृच्छिक चर के औसत के नीचे गोल वितरण क्या है?


20

अगर मेरे पास यादृच्छिक चर हैं कि Poisson को पैरामीटर के साथ वितरित किए जाते हैं, तो का वितरण क्या है (यानी औसत का पूर्णांक तल)?एक्स1,एक्स2,...,एक्सnλ1,λ2,...,λnY=Σमैं=1nएक्समैंn

पॉसों का एक योग भी पॉइसन है, लेकिन मुझे यह निर्धारित करने के लिए आंकड़ों में पर्याप्त विश्वास नहीं है कि यह ऊपर के मामले के लिए समान है।


@amoeba मैंने शीर्षक के अपने संपादन को वापस ले लिया क्योंकि यह वास्तव में "गोलाई" नहीं है। कार्डिनल का पिछला संपादन, हालांकि बहुत सटीक नहीं है, बेहतर लगता है क्योंकि यह सटीक है।
whuber

@whuber ठीक है। इसे संपादित करते समय मैं हिचकिचा रहा था, लेकिन शब्द "गोलाई" को शामिल करने का फैसला किया क्योंकि वर्तमान में शीर्षक यहां मुख्य कठिनाई के लिए संकेत नहीं देता है (और इसलिए यह एक तरह से भ्रामक है)। उचित शब्द "राउंडिंग डाउन" होना चाहिए, इसलिए हो सकता है कि " राउंड डाउन के लिए पॉइसन यादृच्छिक चर के औसत का वितरण क्या हो ?" - भले ही मैं मानता हूँ कि यह थोड़ा बोझिल लगता है।
अमीबा का कहना है कि

@amoeba आगे के संपादन बेशक स्वागत योग्य हैं!
व्हिबर

जवाबों:


27

प्रश्न का एक सामान्यीकरण के वितरण के लिए जब का वितरण ज्ञात और प्राकृतिक संख्याओं पर समर्थित है। (प्रश्न में, में पैरामीटर और ) का ।Y=X/mXXλ=λ1+λ2++λnm=n

का वितरण आसानी से के वितरण से निर्धारित होता है , जिसकी प्रायिकता जनरेटिंग फंक्शन (pgf) के pgf के संदर्भ में निर्धारित की जा सकती है । यहाँ व्युत्पत्ति की एक रूपरेखा है।YmYX


लिखें की PGF के लिए , जहां (परिभाषा के द्वारा) । का निर्माण से इस तरह से किया जाता है कि इसका pgf, , हैएक्स पी एन = पीआर ( एक्स = n ) मीटर वाई एक्स क्षp(x)=p0+p1x++pnxn+Xpn=Pr(X=n)mYXq

क्ष(एक्स)=(पी0+पी1++पी-1)+(पी+पी+1++पी2-1)एक्स++(पीn+पीn+1++पी(n+1)-1)एक्सn+

क्योंकि यह पूरी तरह से , हम फॉर्म के टुकड़ों के योग को पुनर्व्यवस्थित कर सकते हैं|एक्स|1

डी,टीपी(एक्स)=पीटी+पीटी+एक्स++पीटी+nएक्सn+

के लिए । कार्यों की शक्ति श्रृंखला हर से मिलकर की श्रृंखला के कार्यकाल के साथ शुरू : यह कभी कभी एक कहा जाता है नाश की । Google खोज वर्तमान में दशमलवों पर अधिक उपयोगी जानकारी को चालू नहीं करती है, इसलिए पूर्णता के लिए, यहां एक सूत्र की व्युत्पत्ति है।x t D m , t p m th p t t th pटी=0,1,...,-1एक्सटीडी,टीपीवेंपीटीवेंपी

आज्ञा देना किसी भी आदिम एकता की जड़; उदाहरण के लिए, । फिर यह और इस प्रकार हैमीटर वें ω = exp ( 2 मैं π / मीटर ) ω मीटर = 1 Σ मीटर - 1 j = 0 ω j = 0ωवेंω=exp(2मैंπ/)ω=1Σजे=0-1ωजे=0

एक्सटीडी,टीपी(एक्स)=1Σजे=0-1ωटीजेपी(एक्स/ωजे)

यह देखने के लिए, ध्यान दें कि ऑपरेटर रैखिक है, इसलिए यह आधार पर सूत्र की जांच करने के लिए पर्याप्त है । दाहिने हाथ को लागू करता है { 1 , x , x 2 , , x n , } x nएक्सटीडी,टी{1,एक्स,एक्स2,...,एक्सn,...}एक्सn

xtDm,t[xn]=1mj=0m1ωtjxnωnj=xnmj=0m1ω(tn)j.

जब और , कई से भिन्न होते हैं , तो योग में प्रत्येक पद बराबर होता है और हम प्राप्त करते हैं । अन्यथा, शब्द की शक्तियों के माध्यम से चक्र और ये राशि शून्य हो जाती है। जिस कारण से इस ऑपरेटर की सभी शक्तियों को बरकरार रखता है अनुकूल करने के लिए सापेक्ष और अन्य सभी को मारता है: यह ठीक वांछित प्रक्षेपण है।एन एम 1 एक्स एन ω टी - एन एक्स टी मीटरtnm1xnωtnxtm

लिए एक सूत्र, सारांश के क्रम को बदलकर और एक रकम को ज्यामितीय के रूप में पहचानकर आसानी से अनुसरण करता है, जिससे इसे बंद स्थिति में लिखा जा सकता है:q

q(x)=t=0m1(Dm,t[p])(x)=t=0m1xt1mj=0m1ωtjp(ωjx)=1mj=0m1p(ωjx)t=0m1(ωj/x)t=x(1xm)mj=0m1p(ωjx)xωj.

उदाहरण के लिए, पैरामीटर के प्वासों बंटन की PGF है। साथ , और की PGF हो जाएगापी ( एक्स ) = exp ( λ ( एक्स - 1 ) ) मीटर = 2 ω = - 1 2 Yλp(x)=exp(λ(x1))m=2ω=12Y

q(x)=x(1x2)2j=021p((1)jx)x(1)j=x1/x2(exp(λ(x1))x1+exp(λ(x1))x+1)=exp(λ)(sinh(λx)x+cosh(λx)).

इस दृष्टिकोण का एक उपयोग और क्षणों की गणना करना है । का मान PGF पर मूल्यांकन किया जाता के व्युत्पन्न है भाज्य पल। पल पहले की एक रेखीय संयोजन है भाज्य क्षणों। , इन टिप्पणियों हम पाते हैं का उपयोग उदाहरण के लिए, एक प्वासों के लिए वितरित कि , अपने मतलब (जो पहले भाज्य क्षण है) के बराबर होती है , का मतलब के बराबर होती है , और बराबरमीटर वाई कश्मीर वें एक्स = 1 कश्मीर वें कश्मीर वें कश्मीर एक्स λ 2 ( एक्स / 2 ) λ - 1XmYkthx=1kthkthkXλ2(X/2)3(एक्स/3)λ-1+-3λ/2(पाप ( λ12+12e2λ3(X/3)λ1+e3λ/2(sin(3λ2)3+cos(3λ2)) :

माध्यम

साधन क्रमशः, नीले, लाल और पीले रंग में दिखाए जाते हैं, क्रमशः कार्यों के रूप में : asymptotically, मूल Poisson माध्य की तुलना में से मीन गिरता है।λ ( m - 1 ) / 2m=1,2,3λ(m1)/2

भिन्नताओं के लिए समान सूत्र प्राप्त किए जा सकते हैं। (वे उगते समय गड़बड़ करते हैं और इसलिए छोड़ दिए जाते हैं। एक बात जो वे निश्चित रूप से स्थापित करते हैं, वह यह है कि जब का कोई गुणांक नहीं है, तो इसका मतलब और भिन्नता की विशेषता समानता नहीं है) यहाँ variances का एक कथानक है। लिए एक समारोह के रूप में :m > 1 Y λ m = 1 , 2 , 3m>1Yλ=1,2,3

प्रसरण

यह दिलचस्प है कि के बड़े मूल्यों के लिए संस्करण बढ़ जाते हैं । सहज रूप से, यह दो प्रतिस्पर्धात्मक घटनाओं के कारण होता है: फर्श फ़ंक्शन प्रभावी रूप से उन मूल्यों के समूहों को दूर कर रहा है जो मूल रूप से अलग थे; इसके कारण विचरण कम होना चाहिए उसी समय, जैसा कि हमने देखा है, साधन बदल रहे हैं, भी (क्योंकि प्रत्येक बिन को इसके सबसे छोटे मूल्य द्वारा दर्शाया गया है); इसका अर्थ यह होना चाहिए कि वापस जोड़े जाने वाले साधनों के अंतर के वर्ग के बराबर शब्द। बड़े लिए विचरण में वृद्धि बड़े मूल्यों के साथ बड़ी हो जाती है ।λ एमλλ

साथ के विचरण का व्यवहार आश्चर्यजनक रूप से जटिल है। आइए एक त्वरित सिमुलेशन (इन ) दिखाते हुए समाप्त करें कि यह क्या कर सकता है। भूखंडों के विचरण के बीच अंतर दिखाने और प्रसरण प्वासों वितरित के लिए के विभिन्न मूल्यों के साथ से लेकर के माध्यम से । सभी मामलों में प्लॉट दाईं ओर उनके स्पर्शोन्मुख मूल्यों तक पहुँच गए हैं।मीटर मीटर एक्स / मीटर एक्स एक्स λ 1 5000YRएक्स/एक्सएक्सλ15000

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

भूखंड


1
यह एक महान जवाब है! शायद मुझे पचाने में कुछ समय लगेगा :)
लुबो एंटोनोव

1
और इसीलिए मैंने कहा "मंजिल फ़ंक्शन का उपयोग करना ... अधिक जटिल तरीके से यद्यपि थोड़ा बहुत भी विचरण को प्रभावित करता है।"
हेनरी

1
+1 विस्तृत जवाब के लिए धन्यवाद। निश्चित रूप से जटिल तरीके हैं जिसमें फर्श फ़ंक्शन विचरण को प्रभावित करता है।
दिलीप सरवटे

1
कोड के साथ आर में सिमुलेशन के लिए +1 --- यह sapply()सिमुलेशन के लिए उपयोग करने का एक बहुत अच्छा उदाहरण है । धन्यवाद।
असद अब्राहिम

1
@ रॉबर्टो धन्यवाद। हालांकि, " " और " " के बीच का अंतर , विशुद्ध रूप से अंकन का मामला है, पूरी तरह से तुच्छ है और कोई गणितीय या सांख्यिकीय आयात नहीं है। sएक्सs
whuber

12

जैसा कि माइकल चेरिक कहते हैं, यदि व्यक्तिगत यादृच्छिक चर स्वतंत्र हैं, तो योग पॉसॉन है जिसका पैरामीटर (माध्य और विचरण) जिसे आप कह सकते हैं । λi=1nλiλ

द्वारा विभाजित करना माध्य को और variance कम कर देता है, इसलिए विचरण बराबर पोइसन वितरण से कम होगा। जैसा कि माइकल कहते हैं, सभी मान पूर्णांक नहीं होंगे।λ / n λ / n 2nλ/nλ/n2

फ्लोर फंक्शन का उपयोग करने से मतलब थोड़ा कम हो जाता है, लगभग , और अधिक जटिल तरीके से भी विचरण को थोड़ा प्रभावित करता है। यद्यपि आपके पास पूर्णांक मान हैं, फिर भी विचरण माध्य से काफी कम होगा और इसलिए आपके पास पॉइज़न की तुलना में एक संकीर्ण वितरण होगा।1212n


धन्यवाद, एक परिणाम नहीं जिसका मैं उपयोग कर सकता हूं, लेकिन कम से कम मुझे अभी पता है :)
लुबो एंटोनोव

यदि लैम्ब्डा सभी समान नहीं हैं, तो क्या परिणाम एक पॉइज़न की तुलना में नकारात्मक द्विपद की तरह अधिक नहीं होना चाहिए (पल के लिए गैर-पूर्णांक भाग की अनदेखी)? मुझे यहां क्या समझ नहीं आ रहा है?
गूँज - मोनिका

2
@ गुंग: आप इस बात को याद कर रहे हैं कि व्यक्तिगत केवल उनके योग के माध्यम से वितरण को प्रभावित करते हैं और कितने हैं। इससे कोई फर्क नहीं पड़ता कि वे क्या विशेष मान लेते हैं: वही परिणाम देगा जो । λ = , λ = , λ = λ = , λ = , λ = λiλ1=1,λ2=2,λ3=9λ1=4,λ2=4,λ3=4
हेनरी

10

स्वतंत्र पोइसन यादृच्छिक चर के औसत के प्रायिकता द्रव्यमान समारोह को स्पष्ट रूप से लिखा जा सकता है, हालाँकि इसका उत्तर आपको बहुत मदद नहीं कर सकता है। जैसा कि माइकल चेरिक ने अपने स्वयं के उत्तर पर टिप्पणियों में उल्लेख किया है, संबंधित मापदंडों साथ स्वतंत्र यादृच्छिक चर का योग एक पैरामीटर के साथ पॉसों यादृच्छिक चर । इसलिए, इस प्रकार, एक यादृच्छिक चर है जो प्रायिकता के साथ मान पर ले रहा है।Σ मैं एक्स मैं एक्स मैं λ मैं λ = Σ मैं λ मैं पी { n Σ मैं = 1 एक्स मैं = कश्मीर } = exp ( - λ ) λ kn Σमैंएक्समैंएक्समैंλमैंλ=Σमैंλमैं

पी{Σमैं=1nएक्समैं=}=exp(-λ)λ!,  =0,1,2,...,
Y^=n-1Σमैं=1nएक्समैं/nexp(-λ)λ! । ध्यान दें कि है नहीं एक पूर्णांक मूल्य यादृच्छिक चर (हालांकि यह समान रूप से स्थान दिया गया तर्कसंगत मूल्यों पर ले करता है)। यह आसानी से इस प्रकार है कि एक पूर्णांक-मूल्यवान यादृच्छिक चर है जो प्रायिकता साथ मान पर ले रहा है। यह नहीं हैY^Y=Y^
पी{Y=}=पी{1nΣमैं=1nएक्समैं=}=exp(-λ)Σमैं=0n-1λn+मैं(n+मैं)!,  =0,1,2,...,
एक पॉसों यादृच्छिक चर की संभावना जन कार्य। माध्य और विचरण के लिए सूत्र इस संभाव्य द्रव्यमान फ़ंक्शन का उपयोग करके लिखे जा सकते हैं, लेकिन वे स्पष्ट रूप से और संदर्भ में अच्छे सरल उत्तर नहीं देते हैं । हेनरी द्वारा बताए गए अनुसार अनुमानित मूल्य प्राप्त किए जा सकते हैं।λn

+1 हालांकि के क्षणों के लिए बंद सूत्र हैं , हालांकि। Y
whuber

कठोर सूत्रीकरण के लिए धन्यवाद! कोई भी मौका आप माध्य और विचरण के लिए सूत्रों पर एक दरार लेना चाहेंगे?
लुबो एंटोनोव

2
शायद @whuber एक लिंक (या एक किताब या पत्रिका लेख का उद्धरण) पोस्ट करेगा, जहां क्षणों के लिए बंद-फ़ॉर्म सूत्र पाए जा सकते हैं, या एक विस्तृत व्युत्पत्ति के साथ या बिना सूत्रों के खुद को दिए गए उत्तर लिखेंगे।
दिलीप सरवटे

@ दिलीप बंद फ़ार्मुलों के बारे में मेरा दावा प्रकाशित किसी भी चीज़ पर आधारित नहीं था, इसलिए मैंने एक अलग उत्तर पोस्ट किया है जो बताता है कि मेरे मन में क्या था और इस स्थिति को समझने के लिए इसका उपयोग कैसे किया जा सकता है।
whuber

3

Y, Poisson नहीं होगा। ध्यान दें कि Poisson यादृच्छिक चर गैर नकारात्मक पूर्णांक मानों को लेते हैं। एक बार जब आप एक निरंतर विभाजित करते हैं तो आप एक यादृच्छिक चर बनाते हैं जिसमें गैर-पूर्णांक मान हो सकते हैं। इसमें अभी भी पॉइसन की आकृति होगी। यह सिर्फ इतना है कि गैर-पूर्णांक बिंदुओं पर असतत संभावनाएं हो सकती हैं।


Y

@ lucas1024 मुझे ऐसा नहीं लगता, लेकिन मुझे यकीन नहीं है।
माइकल आर। चेरिक

Σएक्समैंn-1

@JDav राशि अलग-अलग दर मापदंडों के योग के बराबर दर पैरामीटर के साथ पॉइसन है। लेकिन ओपी 1 / n से तराजू और फिर पूर्णांक को वाई के नीचे से छोटा करना चाहता है। मुझे नहीं पता कि वितरण के लिए वास्तव में क्या है।
माइकल आर। चेरिक

मेरी पिछली टिप्पणी ने स्वतंत्रता को ग्रहण किया।
बजे माइकल आर। चेरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.