पॉसन वितरण के लिए सामान्य सन्निकटन


12

यहाँ विकिपीडिया में यह कहा गया है:

के पर्याप्त मानों के लिए , ( कहते हैं ), औसत और विचरण (मानक विचलन ) के साथ सामान्य वितरण , पोइसन वितरण के लिए एक उत्कृष्ट सन्निकटन है। यदि λ लगभग 10 से अधिक है, तो एक सामान्य निरंतरता सुधार प्रदर्शन किया जाता है, तो सामान्य वितरण एक अच्छा सन्निकटन है, अर्थात, P (X P x), जहां (निचला मामला) x एक गैर-नकारात्मक पूर्णांक है, द्वारा प्रतिस्थापित किया जाता है P (X (x + 0.5)।λλ>1000λλλλP(Xx),xP(Xx+0.5).

FPoisson(x;λ)Fnormal(x;μ=λ,σ2=λ)

दुर्भाग्य से यह उद्धृत नहीं है। मैं इसे कुछ कठोरता के साथ दिखाने / साबित करने में सक्षम होना चाहता हूं। आप वास्तव में कैसे कह सकते हैं कि सामान्य वितरण एक अच्छा सन्निकटन है जब λ>1000 , आप इस 'उत्कृष्ट' सन्निकटन को कैसे निर्धारित करते हैं, किन उपायों का उपयोग किया गया था?

इसके साथ मुझे जो फुरसत मिली है वह यहाँ है जहाँ जॉन बेरी-एसेन प्रमेय का उपयोग करने के बारे में बात करता है और दो सीडीएफ में त्रुटि का अनुमान लगाता है। मैं जो देख सकता हूं, वह λ1000 किसी भी मूल्य की कोशिश नहीं करता है ।


6
आप इसे 'अच्छे' को परिभाषित किए बिना साबित नहीं कर सकते । (आप एक अस्वाभाविक परिणाम साबित कर सकते हैं, लेकिन आप इसे अपने मानदंडों को निर्धारित किए बिना एक विशिष्ट नमूना आकार में 'अच्छा' घोषित नहीं कर सकते।) आप प्रत्यक्ष उदाहरण द्वारा इसका व्यवहार प्रदर्शित कर सकते हैं (जिससे लोग देख सकते हैं कि 'अच्छा' कितना अच्छा है) अपनी खुद की रोशनी से है)। विशिष्ट मानदंडों के लिए लोग उपयोग करते हैं, एक निरंतरता सुधार लिए अच्छी तरह से काम करता है जब तक आप पूंछ में गहराई तक नहीं जाते हैं। λ>10
Glen_b -Reinstate मोनिका

1
(अधिक विशिष्ट होने के लिए, यदि आपकी कसौटी पूर्ण त्रुटि है, तो आप संभावित रूप से 10 जैसे छोटे नमूने के आकार में हर जगह 'अच्छा' प्राप्त कर सकते हैं, लेकिन ज्यादातर लोग रिश्तेदार त्रुटि के बारे में कुछ के बारे में परवाह करते हैं)
Glen_b -Reinstate Monica

जवाबों:


7

मान लीजिए कि , पैरामीटर साथ Poisson है , और माध्य और विचरण साथ सामान्य है । मुझे लगता है कि उपयुक्त तुलना और । यहाँ सादगी के लिए मैं लिखता हूं , अर्थात, हम तब रुचि रखते हैं जब माध्य से मानक विचलन से मेल खाती है।XλYλPr(X=n)Pr(Y[n12,n+12])n=λ+αλnα

इसलिए मैंने धोखा दिया। मैंने गणितज्ञ का उपयोग किया। इसलिए और दोनों asymptotic हैं to रूप में । लेकिन उनकी अंतर करने के लिए उपगामी है हैं आप इसे फ़ंक्शन के रूप में प्लॉट करते हैं , आपको वही कर्व मिलेगा जो http://www.johndcook.com/blog/normal_approx_to_poisson/ में दूसरी से अंतिम आकृति में दिखाया गया है ।Pr(X=n)Pr(Y[n12,n+12])

12πλeα2/2
λ
α(α23)eα2/262πλ
α

यहाँ मैं इस्तेमाल किया आदेश हैं:

  n = lambda + alpha Sqrt[lambda];
  p1 = Exp[-lambda] lambda^n/n!;
  p2 = Integrate[1/Sqrt[2 Pi]/Sqrt[lambda] Exp[-(x-lambda)^2/2/lambda], {x, n-1/2, n+1/2}];
  Series[p1, {lambda, Infinity, 1}]
  Series[p2, {lambda, Infinity, 1}]

इसके अलावा, प्रयोग के एक बिट के साथ, यह मुझे लगता है कि लिए एक बेहतर स्पर्शोन्मुख सन्निकटन है । फिर त्रुटि है जो कि लगभग गुना छोटा है।Pr(X=n)Pr(Y[nα2/6,n+1α2/6])

(5α49α26)eα2/2722πλ3/2
λ

2

Glen_b सही है कि "अच्छा फिट" एक बहुत ही व्यक्तिपरक धारणा है। हालाँकि, यदि आप यह सत्यापित करना चाहते हैं कि आपका पॉज़िशन वितरण सामान्य रूप से सामान्य है, तो आप एक काल्पनिक कोलमॉर्गोव-स्मिर्नोव परीक्षण का उपयोग कर सकते हैं, जिसमें शून्य परिकल्पना CDF एक वितरण से आया, यह मानते हुए आपका नमूना एक पॉइज़न ( ) से आएगा । चूंकि आप वास्तव में एक नमूने का परीक्षण नहीं कर रहे हैं, लेकिन दूसरे के खिलाफ एक वितरण, आपको इस काल्पनिक परीक्षण के लिए आपके द्वारा लिए गए नमूना आकार और महत्व के स्तर के बारे में सावधानी से सोचने की आवश्यकता है (क्योंकि हम इसके विशिष्ट फैशन में केएस परीक्षण का उपयोग नहीं कर रहे हैं)। अर्थात्:H0:N(λ,λ)λ

  • एक प्रतिनिधि, काल्पनिक नमूना आकार, एन चुनें, और परीक्षण के महत्व स्तर को एक विशिष्ट मूल्य पर समायोजित करें, जैसे, 5%।

अब, इस परीक्षण के लिए टाइप II त्रुटि दर की गणना करें कि आपका डेटा वास्तव में एक पॉइज़न ( ) से आता है। सामान्य वितरण के साथ आपकी फिट की डिग्री इस प्रकार की होगी II त्रुटि दर, इस अर्थ में कि आपके विशेष पॉइसन वितरण से आकार n के नमूने, औसतन, आपके चयनित पर केएस सामान्यता परीक्षण द्वारा समय का % स्वीकार किए जाएंगे। महत्वपूर्ण स्तर।λβ

वैसे भी, "फिट की अच्छाई" की भावना पाने के बारे में सिर्फ एक तरीका है। हालांकि, सभी "अच्छाई" की कुछ व्यक्तिपरक धारणाओं पर भरोसा करते हैं जिन्हें आपको अपने लिए परिभाषित करना होगा।


2

द्विपद वितरण से व्युत्पत्ति आपको कुछ जानकारी दे सकती है।

हमारे पास एक द्विपद यादृच्छिक चर है;

p(x)=(nx)px(1p)nx

यह वैकल्पिक रूप से पुनरावर्ती रूप से गणना की जा सकती है;

p(x)=(nx+1)px(1p)p(x1)

यदि आप प्रारंभिक स्थिति रखते हैं;

p(0)=(1p)n

अब हम मान लेते हैं कि बड़ा है और छोटा है लेकिन की औसत सफलता निरंतर है । फिर हम निम्नलिखित कर सकते हैं;npp(x)(np=λ)

P(X=i)=(ni)px(1p)nx

हम उस ।p=λ/n

P(X=i)=n!(ni)!i!(λn)i(1λn)ni

हम कुछ चर को चारों ओर स्विच करते हैं और मूल्यांकन करते हैं;

P(X=i)=n(n1)(n2)(ni+1)niλii!(1λn)n(1λn)i

पथरी से हमें पता चलता है कि । हम यह भी जानते हैं कि क्योंकि दोनों ऊपर और नीचे के बहुआयामी पद हैं ।limn(1+x/n)n=ex[n(n1)(n2)(ni+1)]/ni1i

इससे यह निष्कर्ष निकलता है कि :n

P(X=i)eλλii!

फिर आप उस और को परिभाषा के माध्यम से सत्यापित कर सकते हैं । हम जानते हैं कि द्विपदीय वितरण डी Moivre-Laplace प्रमेय की शर्तों के तहत सामान्य को अनुमानित करता है जब तक आप निरंतरता के लिए सही होते हैं, यही वजह है कि को से बदल दिया जाता है ।E(X)=λVar(X)=λP(Xx)P(Xx+0.5)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.