मेरे पास बर्नौली यादृच्छिक चर का एक यादृच्छिक नमूना है , जहां iidrv और , और एक अज्ञात पैरामीटर है।
जाहिर है, कोई : लिए एक अनुमान लगा सकता है ।
मेरा सवाल यह है कि मैं लिए एक विश्वास अंतराल कैसे बना सकता हूं ?
मेरे पास बर्नौली यादृच्छिक चर का एक यादृच्छिक नमूना है , जहां iidrv और , और एक अज्ञात पैरामीटर है।
जाहिर है, कोई : लिए एक अनुमान लगा सकता है ।
मेरा सवाल यह है कि मैं लिए एक विश्वास अंतराल कैसे बना सकता हूं ?
जवाबों:
यदि औसत, , या पास नहीं है , और नमूना आकार पर्याप्त रूप से बड़ा है (यानी और , आत्मविश्वास अंतराल का अनुमान एक सामान्य वितरण और इस प्रकार निर्मित आत्मविश्वास अंतराल से लगाया जा सकता है: 10एनएन पी >5एन(1 - पी )>5
यदि और , आत्मविश्वास अंतराल लगभग (जावनोविक और लेवी, 1997) ; इसके विपरीत लिए रखती है । संदर्भ में और (बाद में पूर्व सूचना शामिल करने के लिए) का उपयोग करके चर्चा की गई है ।
सामान्य विकिपीडिया , विल्सन स्कोर, क्लोपर-पियर्सन, या एगेस्टी-कूप के अंतराल के अलावा अनुमानों के उपयोग के बारे में जानकारी के लिए एल्स विकिपीडिया एक अच्छा अवलोकन और एग्रेस्टी और कौली (1998) और रॉस (2003) को अंक प्रदान करता है। ये अधिक सटीक हो सकते हैं जब और बारे में उपरोक्त धारणाएं पूरी नहीं होती हैं।
आर कार्य प्रदान करता है binconf {Hmisc}और binom.confint {binom}जिसका उपयोग निम्नलिखित तरीके से किया जा सकता है:
set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')
बर्नौली नमूने के लिए सामान्य सन्निकटन अपेक्षाकृत बड़े नमूने के आकार पर निर्भर करता है और पूंछों से दूर का नमूना अनुपात है। अधिकतम संभावना अनुमान लॉग-ट्रांसफ़्ड ऑड्स पर केंद्रित है और यह लिए गैर-सममित, कुशल अंतराल प्रदान करता है जो इसके बजाय उपयोग किया जाना चाहिए।
लॉग-ऑड्स को रूप में परिभाषित करें
1- लिए द्वारा दिया गया है:
और यह वापस साथ एक (गैर-सममित) अंतराल में बदल जाता है :
इस CI में अतिरिक्त लाभ है जो अनुपात 0 या 1 के बीच के अंतराल में निहित है, और CI हमेशा सही स्तर के होते हुए सामान्य अंतराल से संकीर्ण होता है। आप R में इसे आसानी से निर्दिष्ट करके प्राप्त कर सकते हैं:
set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))
2.5 % 97.5 %
0.2795322 0.4670450
छोटे नमूनों में, MLE को सामान्य सन्निकटन - जबकि नमूना अनुपात के लिए सामान्य सन्निकटन से बेहतर - विश्वसनीय नहीं हो सकता है। यह ठीक है। एक द्विपद घनत्व का पालन करने के लिए लिया जा सकता है । के लिए सीमा 2.5th और 97.5-वें इस वितरण से प्रतिशतक लेने पाया जा सकता है।
दुर्लभ रूप से संभव हाथ से, कम्प्यूटेशनल विधियों का उपयोग करके लिए एक सटीक द्विपद विश्वास अंतराल प्राप्त किया जा सकता है ।
qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47
और यदि 0 या 1 है, तो एक औसत दर्जे का निष्पक्ष अनुमानक का उपयोग औसत दर्जे के निष्पक्ष संभाव्यता फ़ंक्शन के आधार पर गैर-विलक्षण अंतराल अनुमान प्राप्त करने के लिए किया जा सकता है। आप मामूली रूप से सभी 0-केस के निचले बाउंड को 0 डब्लूएलओजी के रूप में ले सकते हैं। ऊपरी बाउंड किसी भी अनुपात जो संतुष्ट करता है:
यह एक कम्प्यूटेशनल रूटीन भी है।
set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
0.5*dbinom(0, 100, p) +
pbinom(1, 100, p, lower.tail = F) -
0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)
[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability
अंतिम दो तरीकों को epitoolsआर में पैकेज में लागू किया गया है।