बर्नौली नमूने के लिए आत्मविश्वास अंतराल


42

मेरे पास बर्नौली यादृच्छिक चर का एक यादृच्छिक नमूना है , जहां iidrv और , और एक अज्ञात पैरामीटर है।X1...XNXiP(Xi=1)=pp

जाहिर है, कोई : लिए एक अनुमान लगा सकता है ।pp^:=(X1++XN)/N

मेरा सवाल यह है कि मैं लिए एक विश्वास अंतराल कैसे बना सकता हूं ?p


2
विकिपीडिया में बर्नौली नमूने के लिए आत्मविश्वास अंतराल की गणना करने के तरीके के बारे में विवरण है ।

जवाबों:


52
  • यदि औसत, , या पास नहीं है , और नमूना आकार पर्याप्त रूप से बड़ा है (यानी और , आत्मविश्वास अंतराल का अनुमान एक सामान्य वितरण और इस प्रकार निर्मित आत्मविश्वास अंतराल से लगाया जा सकता है: 10एनएन पी >5एन(1 - पी )>5p^10nnp^>5n(1p^)>5

    p^±z1α/2p^(1p^)n
  • यदि और , आत्मविश्वास अंतराल लगभग (जावनोविक और लेवी, 1997) ; इसके विपरीत लिए रखती है । संदर्भ में और (बाद में पूर्व सूचना शामिल करने के लिए) का उपयोग करके चर्चा की गई है ।p^=0n>3095%[0,3n] p^=1n+1n+b

  • सामान्य विकिपीडिया , विल्सन स्कोर, क्लोपर-पियर्सन, या एगेस्टी-कूप के अंतराल के अलावा अनुमानों के उपयोग के बारे में जानकारी के लिए एल्स विकिपीडिया एक अच्छा अवलोकन और एग्रेस्टी और कौली (1998) और रॉस (2003) को अंक प्रदान करता है। ये अधिक सटीक हो सकते हैं जब और बारे में उपरोक्त धारणाएं पूरी नहीं होती हैं।np^

आर कार्य प्रदान करता है binconf {Hmisc}और binom.confint {binom}जिसका उपयोग निम्नलिखित तरीके से किया जा सकता है:

set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')

एगेस्टी, एलन; कूप, ब्रेंट ए (1998)। "द्विपद अनुपात के अंतराल अनुमान के लिए अनुमानित 'सटीक' से बेहतर है"। अमेरिकी सांख्यिकीविद् 52: 119–126।

जोवानोविक, बीडी और पीएस लेवी, 1997. ए लुक एट द रूल ऑफ थ्री। अमेरिकन स्टेटिस्टिशियन वॉल्यूम। 51, नंबर 2, पीपी 137-139

रॉस, टीडी (2003)। "द्विपद अनुपात और पॉइसन दर अनुमान के लिए सटीक आत्मविश्वास अंतराल"। जीव विज्ञान और चिकित्सा में कंप्यूटर 33: 509-531।


3
(+1) अच्छा जवाब। मुझे लगता है कि भविष्य में इसी तरह के सवालों का एक संदर्भ बन जाएगा। हालांकि, क्रॉस-पोस्टिंग असामान्य है; वास्तव में, मेरा मानना ​​है कि यह पर आधारित है, क्योंकि यह फीडबैक / रेफरेंसिंग / थ्रेडिंग / कमेंटिंग सिस्टम के कई पहलुओं को बताता है। कृपया कॉपियों में से एक को हटाने और एक टिप्पणी में एक लिंक द्वारा प्रतिस्थापित करने पर विचार करें।
whuber

@ प्रतिक्रिया के लिए धन्यवाद। मैंने दूसरी प्रति निकाल ली है।
डेविड लेबॉयर

पहले सूत्र में, z1 और अल्फा क्या हैं?
गिरजाघर

मुझे अपने स्वयं के प्रश्न का उत्तर मिला: मानक सामान्य वितरण का प्रतिशत है और त्रुटि प्रतिशत है। en.wikipedia.org/wiki/Binomial_proportion_confidence_intervalz1α/21α/2α
Cirdec

क्या दूसरी गोली बिंदु के लिए आत्मविश्वास अंतराल पर होनी चाहिए ? 3/n
जुआन ए। नवारो

7

अधिकतम संभावना आत्मविश्वास अंतराल

बर्नौली नमूने के लिए सामान्य सन्निकटन अपेक्षाकृत बड़े नमूने के आकार पर निर्भर करता है और पूंछों से दूर का नमूना अनुपात है। अधिकतम संभावना अनुमान लॉग-ट्रांसफ़्ड ऑड्स पर केंद्रित है और यह लिए गैर-सममित, कुशल अंतराल प्रदान करता है जो इसके बजाय उपयोग किया जाना चाहिए।p

लॉग-ऑड्स को रूप में परिभाषित करेंβ^0=log(p^/(1p^))

1- लिए द्वारा दिया गया है:αβ0

CI(β0)α=β^0±Zα/21/(np^(1p^)

और यह वापस साथ एक (गैर-सममित) अंतराल में बदल जाता है :p

CI(p)α=1/(1+exp(CI(β0)α)

इस CI में अतिरिक्त लाभ है जो अनुपात 0 या 1 के बीच के अंतराल में निहित है, और CI हमेशा सही स्तर के होते हुए सामान्य अंतराल से संकीर्ण होता है। आप R में इसे आसानी से निर्दिष्ट करके प्राप्त कर सकते हैं:

set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))

    2.5 %    97.5 % 
0.2795322 0.4670450 

सटीक द्विपद विश्वास अंतराल

छोटे नमूनों में, MLE को सामान्य सन्निकटन - जबकि नमूना अनुपात के लिए सामान्य सन्निकटन से बेहतर - विश्वसनीय नहीं हो सकता है। यह ठीक है। एक द्विपद घनत्व का पालन करने के लिए लिया जा सकता है । के लिए सीमा 2.5th और 97.5-वें इस वितरण से प्रतिशतक लेने पाया जा सकता है।Y=np^(n,p)p^

CIα=(Fp^1(0.025),Fp^1(0.975))

दुर्लभ रूप से संभव हाथ से, कम्प्यूटेशनल विधियों का उपयोग करके लिए एक सटीक द्विपद विश्वास अंतराल प्राप्त किया जा सकता है ।p

qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47

मेडियन निष्पक्ष आत्मविश्वास अंतराल

और यदि 0 या 1 है, तो एक औसत दर्जे का निष्पक्ष अनुमानक का उपयोग औसत दर्जे के निष्पक्ष संभाव्यता फ़ंक्शन के आधार पर गैर-विलक्षण अंतराल अनुमान प्राप्त करने के लिए किया जा सकता है। आप मामूली रूप से सभी 0-केस के निचले बाउंड को 0 डब्लूएलओजी के रूप में ले सकते हैं। ऊपरी बाउंड किसी भी अनुपात जो संतुष्ट करता है:pp1α/2

p1α/2:P(Y=0)/2+P(Y>y)>0.975

यह एक कम्प्यूटेशनल रूटीन भी है।

set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
  0.5*dbinom(0, 100, p) + 
    pbinom(1, 100, p, lower.tail = F) - 
    0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)

[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability

अंतिम दो तरीकों को epitoolsआर में पैकेज में लागू किया गया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.