पोइसन वितरण के लिए आत्मविश्वास स्तर की गणना कैसे करें?


32

जानना चाहूंगा कि मैं अपने में कितना आश्वस्त हो सकता हूं । किसी को एक पॉइसन वितरण के लिए ऊपरी और निचले आत्मविश्वास का स्तर निर्धारित करने का तरीका पता है?λ

  • अवलोकन ( ) = 88n
  • नमूना का मतलब ( ) = 47.18182λ

95% आत्मविश्वास इसके लिए कैसा दिखेगा?


आप अपने अनुमानों को बूटस्ट्रैप करने पर भी विचार कर सकते हैं। यहाँ बूटस्ट्रैपिंग पर एक संक्षिप्त ट्यूटोरियल है।
मार्क टी पैटरसन

जवाबों:


27

पॉइसन के लिए, माध्य और विचरण दोनों । यदि आप लैम्ब्डा के आसपास विश्वास अंतराल चाहते हैं, तो आप मानक त्रुटि की गणना ।λλ/n

95-प्रतिशत विश्वास अंतराल ।λ^±1.96λ^/n


26
यह ठीक है जब बड़ा है, तब के लिए Poisson एक सामान्य वितरण द्वारा पर्याप्त रूप से अनुमानित है। छोटे मूल्यों या उच्च आत्मविश्वास के लिए, बेहतर अंतराल उपलब्ध हैं। उनके वास्तविक कवरेज के विश्लेषण के साथ उनमें से दो के लिए math.mcmaster.ca/peter/s743/poissonalpha.html देखें । (यहां, "सटीक" अंतराल है (45.7575, 48.6392), "पियर्सन" अंतराल (45.7683, 48.639) है, और सामान्य सन्निकटन देता है (45.7467, 48.617): यह बहुत कम है, लेकिन करीब पर्याप्त है, क्योंकि )।n λ = 4152nλnλ=4152
whuber

4
अन्य लोगों के लिए जैसे मैं उलझन में था: यहाँ वर्णन है कि 1.96 कहाँ से आता है।
mjibson

2
आपने इस समस्या के सटीक अंतराल की गणना कैसे की, यह जानकारी व्ह्यूबर द्वारा दी गई वेबसाइट पर दी गई है। मैं अनुसरण नहीं कर सकता क्योंकि वह साइट केवल यह बताती है कि जब आपके पास एक नमूना है तो कैसे आगे बढ़ें। शायद मैं कुछ सरल नहीं समझ रहा हूं, लेकिन मेरे वितरण में लैम्ब्डा (एन) का बहुत कम मूल्य है, इसलिए मैं सामान्य सन्निकटन का उपयोग नहीं कर सकता हूं और मुझे नहीं पता कि सटीक मूल्य की गणना कैसे करें। किसी भी तरह की सहायता का स्वागत किया जाएगा। धन्यवाद!

यहाँ वे माध्य के मानक विचलन का उपयोग कर रहे हैं? वह है SE = sig/sqrt(N) = sqrt(lam/N),? यह समझ में आता है क्योंकि एकल मूल्यों का मानक विचलन sigहमें पॉइसन वितरण से यादृच्छिक नमूनों को खींचने की संभावना के बारे में बताता है, जबकि SEजैसा कि ऊपर बताया गया है कि यह हमारे आत्मविश्वास के बारे में बताता है lam, हमने उन नमूनों की संख्या बताई है जिनका हमने अनुमान लगाया है।
एलेक्स मार्क

17

यह पेपर पोइसन वितरण के माध्य के लिए एक विश्वास अंतराल की गणना करने के लिए 19 विभिन्न तरीकों पर चर्चा करता है।

http://www.ine.pt/revstat/pdf/rs120203.pdf


2
यहां मॉड की अधिसूचना के बावजूद, मुझे यह उत्तर पसंद है, क्योंकि यह इंगित करता है कि सामान्य सहमति से कम है कि कैसे मापा पॉसन सिस्टम का मूल्यांकन किया जाए।
कार्ल विट्ठॉफ्ट

7

दूसरों ने जो उत्तर दिए हैं, उनके अलावा, इस समस्या का एक और तरीका एक मॉडल आधारित दृष्टिकोण के माध्यम से प्राप्त किया जाता है। केंद्रीय सीमा प्रमेय दृष्टिकोण निश्चित रूप से मान्य है, और बूटस्ट्रैप किए गए अनुमान छोटे नमूने और मोड प्रक्षेपीकरण मुद्दों से बहुत अधिक सुरक्षा प्रदान करते हैं।

सरासर दक्षता के लिए, आप प्रतिगमन मॉडल आधारित दृष्टिकोण का उपयोग करके लिए एक बेहतर आत्मविश्वास अंतराल प्राप्त कर सकते हैं । व्युत्पन्नताओं से गुजरने की आवश्यकता नहीं है, लेकिन आर में एक साधारण गणना इस तरह से होती है:λ

x <- rpois(100, 14)
exp(confint(glm(x ~ 1, family=poisson)))

यह एक गैर-सममितीय अंतराल का अनुमान है, आप पर ध्यान दें, क्योंकि पोसीन ग्लम का प्राकृतिक पैरामीटर लॉग रिलेटिव रेट है! यह एक फायदा है क्योंकि गणना डेटा के दाईं ओर तिरछी होने की प्रवृत्ति है।

उपरोक्त दृष्टिकोण का एक सूत्र है और यह है:

exp(logλ^±1nλ^)

यह आत्मविश्वास अंतराल इस अर्थ में "कुशल" है कि यह पोइसन डेटा के लिए प्राकृतिक पैरामीटर (लॉग) पैमाने पर अधिकतम संभावना अनुमान से आता है, और नाममात्र 95% कवरेज को बनाए रखते हुए गिनती पैमाने पर आधारित एक से अधिक आत्मविश्वास आत्मविश्वास प्रदान करता है। ।


+1 मुझे लगता है कि मैं दक्षता की तुलना में एक अलग विशेषण का उपयोग करूँगा (या अधिक स्पष्ट हो सकता है कि आप कम्प्यूटेशनल या कोड गोल्फ दक्षता का मतलब है)। व्हीबर की टिप्पणी एक ऐसे संसाधन की ओर इशारा करती है जो सटीक अंतराल देता है, और glm दृष्टिकोण asymptotic परिणामों पर भी आधारित है। (हालांकि यह अधिक सामान्य है, इसलिए मुझे उस दृष्टिकोण की भी सिफारिश करना पसंद है।)
एंडी डब्ल्यू

वास्तव में इस बारे में कुछ और सोचना, सटीक कवरेज व्ह्यूबर लिंक (मुझे लगता है) केवल तभी लागू होता है जब आप डेटा को देखे बिना निर्दिष्ट करते हैं । एक त्वरित सिमुलेशन देखें, मनाया मूल्य (नए टिप्पणियों के लिए) के आधार पर गणना की गई कवरेज बहुत कम है। यहां त्वरित अनुकार । μ
एंडी डब्ल्यू

1
उस सूत्र के लिए आपका अधिकार क्या है। क्या हमारे पास एक प्रशस्ति पत्र हो सकता है?
pauljohn32

@AndyW: आपका लिंक त्वरित सिमुलेशन के लिए मान्य नहीं है
pauljohn32

1
@ pauljohn32 विशेष रूप से घातीय परिवार पर कैसला बर्जर के पाठ की जाँच करें, लॉग दर प्राकृतिक पैरामीटर है।
अदमो

5

पोइसन वितरण से अवलोकन को देखते हुए ,

  • गिने जाने वाले घटनाओं की संख्या n है।
  • मतलब ( ) और विचरण ( σ 2 ) बराबर हैं।λσ2

क्रमशः,

  • λ^=nλ
  • n>20σ

stderr=σ=λn

अब, 95% विश्वास अंतराल है,

I=λ^±1.96 stderr=n±1.96 n

[संपादित] प्रश्न डेटा के आधार पर कुछ गणना,

  • λ

    मैं यह धारणा बना रहा हूं क्योंकि मूल प्रश्न प्रयोग के बारे में या डेटा प्राप्त करने के बारे में कोई संदर्भ प्रदान नहीं करता है (जो सांख्यिकीय डेटा में हेरफेर करते समय इसका अत्यधिक महत्व है)।

  • 95% विश्वास अंतराल, विशेष मामले के लिए,

I=λ±1.96 stderr=λ±1.96 λ=47.18182±1.96 47.18182[33.72,60.64]

इसलिए, माप के रूप में (n = 88 घटनाओं) 95% विश्वास अंतराल के बाहर है, हम यह निष्कर्ष निकालते हैं,

  1. प्रक्रिया एक पॉइसन प्रक्रिया का पालन नहीं करती है, या,

  2. λ


λ/n


1
λnλ

2
λλ

2
मेरा मानना ​​है कि ऊपर jose.angel.jiminez द्वारा प्रतिक्रिया गलत है, और मूल प्रश्न को गलत तरीके से फैलाने से उत्पन्न होती है। मूल पोस्टर में कहा गया है "अवलोकन (एन) = 88" - यह समय अंतराल की संख्या थी, न कि कुल मिलाकर देखी गई घटनाओं की संख्या, या प्रति अंतराल। 88 प्रतिक्षण अंतराल के नमूने पर प्रति अंतराल की घटनाओं की औसत संख्या, मूल पोस्टर द्वारा दिया गया लंबोदर है। (मैंने इसे जोस के पोस्ट के लिए एक टिप्पणी के रूप में शामिल किया है, लेकिन टिप्पणी करने की अनुमति के लिए साइट पर बहुत नया हूं।)
user44436

@ user44436 ने एक उत्तर जोड़ा जो टिप्पणी करने वाला था। मैं इसे एक टिप्पणी के रूप में फिर से प्रकाशित करता हूं ताकि आप इसे देख सकें और क्योंकि गैर-उत्तर के रूप में इसे हटाया जा सकता है: ------- मेरा मानना ​​है कि ऊपर दिए गए जवाब से प्रतिक्रिया गलत है और मूल प्रश्न को गलत तरीके से फैलाने से उत्पन्न होती है। मूल पोस्टर में कहा गया है कि अवलोकन (n) = 88 - यह समय अंतराल की संख्या थी, न कि कुल मिलाकर देखी गई घटनाओं की संख्या, या प्रति अंतराल। 88 अवलोकन योग्य अंतराल के नमूने पर प्रति अंतराल की घटनाओं की औसत संख्या मूल पोस्टर द्वारा दिए गए लंबोदर है।
Morre
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.