लंबी पूंछ में पॉइज़न संचयी वितरण का सरल सन्निकटन?


10

मैं एक तालिका की क्षमता तय करना चाहता हूं ताकि इसमें से कम अवशिष्ट ऑड्स दिए गए लिए ओवरफ्लो करने के लिए , प्रविष्टियों की संख्या मानकर एक दिए गए के साथ एक पॉइसन कानून का पालन किया जाता है प्रत्याशा ।2 - पी पी [ 40 ... 120 ] [ 10 3 ... 10 12 ]C2pp[40120]E[1031012]

आदर्श रूप से, मुझे सबसे कम पूर्णांक चाहिए Cजैसे कि 1-CDF[PoissonDistribution[E],C] < 2^-pदिए गए pऔर E; लेकिन मैं उससे कुछ Cज्यादा ही संतुष्ट हूं । मैथमैटिका मैन्युअल गणना के लिए ठीक है, लेकिन मैं संकलन समय Cसे pऔर Eसंकलन करना चाहूंगा , जो मुझे 64-बिट पूर्णांक अंकगणित तक सीमित करता है।

अपडेट: मैथेमेटिका (संस्करण 7) में e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]है 1231और सही के बारे में लगता है (धन्यवाद @Procrastinator); हालाँकि दोनों के लिए परिणाम p = 50और p = 60है 1250, जो असुरक्षित पक्ष पर गलत है (और मायने रखता है: मेरा प्रयोग बार या अधिक की तरह दोहराता है , और मैं demonstrably से कम समग्र बाधाओं की संभावना चाहता हूं )। मैं 64-बिट पूर्णांक अंकगणितीय का उपयोग करके कुछ कच्चे लेकिन सुरक्षित सन्निकटन चाहता हूं , जैसा कि संकलन समय पर C (++) में उपलब्ध है। 2 - 30225230


1
कैसे के बारे में C = Quantile[PoissonDistribution[E],1-2^p]?

1
पोइसन की संभाव्यता द्रव्यमान समारोह की अग्रणी अवधि पूंछ में हावी है।
कार्डिनल

1
@Procrastinator: हाँ जो मैथमेटिका में काम करता है (हस्ताक्षर pऔर सटीक मुद्दों को छोड़कर , और नाम Eऔर Cजो आरक्षित हैं)। लेकिन मुझे केवल 64-बिट पूर्णांक आर्टिथमिक का उपयोग करके उस के एक सरल सन्निकटन की आवश्यकता है, (संभवतः सुरक्षित पक्ष पर)!
fgrieu

3
पुनः अद्यतन करें: Mathematica 8 लिए 1262 और लिए 1290 देता है । पुन: सामान्य सन्निकटन (@ प्रोक): इससे पूंछ में अच्छी तरह से काम करने की उम्मीद नहीं की जा सकती है, जो गणना के लिए महत्वपूर्ण है। पी = 60p=50p=60
whuber

1
शायद आपको स्टैकओवरफ्लो पर पूछना चाहिए। आपके पास जो अड़चनें हैं, उनसे मैं परिचित नहीं हूं। मुझे नहीं पता कि डायनेमिक मेमोरी एलोकेशन का उपयोग करने से आप क्या रोकते हैं, या आप ऐरे के आकार को तय करने के लिए ब्रांचिंग का उपयोग कर सकते हैं, या किसी एरे को परिभाषित करने के लिए क्या लागतें हैं जो आपके द्वारा आवश्यक आकार से दोगुना है (और फिर सभी का उपयोग नहीं कर रहा है इसका)। यदि कुछ कार्य जैसे (बस एक उदाहरण के रूप में) दिया गया आप सटीक उत्तर दे सकते हैं, क्या आप अपने अवरोधों के तहत एक सन्निकटन को लागू कर पाएंगे या नहीं? यह अब एक प्रोग्रामिंग समस्या की तरह लगता है। μ+loglogμlogμμ+pμlogμ
डगलस जेरे

जवाबों:


10

बड़े माध्य के साथ एक पॉइसन वितरण लगभग सामान्य है, लेकिन आपको सावधान रहना होगा कि आप एक पूंछ को बांधना चाहते हैं और सामान्य सन्निकटन पूंछ के पास आनुपातिक रूप से कम सटीक है।

इस MO प्रश्न में और द्विपद वितरण के साथ उपयोग किया जाने वाला एक दृष्टिकोण यह पहचानना है कि पूंछ एक ज्यामितीय श्रृंखला की तुलना में अधिक तेजी से घटती है, इसलिए आप ज्यामितीय श्रृंखला के रूप में एक स्पष्ट ऊपरी सीमा लिख ​​सकते हैं।

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

पंक्ति 2 पंक्ति 3 स्टर्लिंग के सूत्र से संबंधित थी। व्यवहार में मुझे लगता है कि आप तब खोज का उपयोग करके संख्यात्मक रूप से को हल करना चाहते हैं। न्यूटन की विधि प्रारंभिक अनुमान से शुरू होती हैकाम भी करना चाहिए।plog2=log(bound)D=μ+cμ.

उदाहरण के लिए, और , मुझे मिलने वाला संख्यात्मक समाधान 1384.89 है। मतलब के साथ एक प्वासों बंटन से मान लेता है के माध्यम से संभावना के साथ माध्यम से मान से संभावना के साथ होते हैंμ = 1000 1000 0 1384 1 - 1 / 2 100.060 1383 1 - 1 / 2 99.59p=100μ=100010000138411/2100.06.0138311/299.59.


1
+1। एक अन्य दृष्टिकोण गामा वितरण (बाईं ओर) की पूंछ की संभावनाओं के लिए पॉइसन पूंछ की संभावनाओं (दाएं पर) से संबंधित है, जो एक काठी अनुमान के साथ अनुमानित (ओवर) हो सकता है।
whuber

वहाँ से कुछ करने के लिए 64-बिट पूर्णांक अंकगणित (एक्सप, लॉग, sqrt .. के बिना) के लिए एक लंबा रास्ता है, लेकिन मैं इस पर काम करेंगे; सबको शुक्रीया!
fgrieu

(+1) स्टर्लिंग के सन्निकटन (जो कि अप्रासंगिक है) के आह्वान तक, यह ठीक वही है जो मैं ओपी के लिए अपनी टिप्पणी में संदर्भित करता था। (उदाहरण के लिए, यहाँ देखें ।)
कार्डिनल

2

आप पी। हरमरो को देख सकते हैं: पोइसन रैंडम वेरिएबल्स के लिए टेल प्रॉब्यूबिलिटीज पर तीव्र सीमाएँ https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse-proc_17.pdf मुख्य असमानताएँ निम्नानुसार हैं। चलो पैरामीटर के साथ एक प्वासों यादृच्छिक चर हो । रखो Let मानक सामान्य कानून के लिए संचयी वितरण फ़ंक्शन को दर्शाता है। फिर, सभी पूर्णांक , जो बराबर है सभी पूर्णांकYλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0। इसके अलावा, जिसका अर्थ है कि सभी पूर्णांक ।Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0


यदि आप मुख्य समीकरण (यह मानते हुए कि केवल एक या दो हैं) लिख सकते हैं जो किसी समय लिंक के मृत हो जाने की स्थिति में मदद करेगा।
3
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.