मेरे पास बर्नौली यादृच्छिक चर का एक यादृच्छिक नमूना है , जहां iidrv और , और एक अज्ञात पैरामीटर है।
जाहिर है, कोई : लिए एक अनुमान लगा सकता है ।
मेरा सवाल यह है कि मैं लिए एक विश्वास अंतराल कैसे बना सकता हूं ?
मेरे पास बर्नौली यादृच्छिक चर का एक यादृच्छिक नमूना है , जहां iidrv और , और एक अज्ञात पैरामीटर है।
जाहिर है, कोई : लिए एक अनुमान लगा सकता है ।
मेरा सवाल यह है कि मैं लिए एक विश्वास अंतराल कैसे बना सकता हूं ?
जवाबों:
यदि औसत, , या पास नहीं है , और नमूना आकार पर्याप्त रूप से बड़ा है (यानी और , आत्मविश्वास अंतराल का अनुमान एक सामान्य वितरण और इस प्रकार निर्मित आत्मविश्वास अंतराल से लगाया जा सकता है: 10एनएन पी >5एन(1 - पी )>5
यदि और , आत्मविश्वास अंतराल लगभग (जावनोविक और लेवी, 1997) ; इसके विपरीत लिए रखती है । संदर्भ में और (बाद में पूर्व सूचना शामिल करने के लिए) का उपयोग करके चर्चा की गई है ।
सामान्य विकिपीडिया , विल्सन स्कोर, क्लोपर-पियर्सन, या एगेस्टी-कूप के अंतराल के अलावा अनुमानों के उपयोग के बारे में जानकारी के लिए एल्स विकिपीडिया एक अच्छा अवलोकन और एग्रेस्टी और कौली (1998) और रॉस (2003) को अंक प्रदान करता है। ये अधिक सटीक हो सकते हैं जब और बारे में उपरोक्त धारणाएं पूरी नहीं होती हैं।
आर कार्य प्रदान करता है binconf {Hmisc}
और binom.confint {binom}
जिसका उपयोग निम्नलिखित तरीके से किया जा सकता है:
set.seed(0)
p <- runif(1,0,1)
X <- sample(c(0,1), size = 100, replace = TRUE, prob = c(1-p, p))
library(Hmisc)
binconf(sum(X), length(X), alpha = 0.05, method = 'all')
library(binom)
binom.confint(sum(X), length(X), conf.level = 0.95, method = 'all')
बर्नौली नमूने के लिए सामान्य सन्निकटन अपेक्षाकृत बड़े नमूने के आकार पर निर्भर करता है और पूंछों से दूर का नमूना अनुपात है। अधिकतम संभावना अनुमान लॉग-ट्रांसफ़्ड ऑड्स पर केंद्रित है और यह लिए गैर-सममित, कुशल अंतराल प्रदान करता है जो इसके बजाय उपयोग किया जाना चाहिए।
लॉग-ऑड्स को रूप में परिभाषित करें
1- लिए द्वारा दिया गया है:
और यह वापस साथ एक (गैर-सममित) अंतराल में बदल जाता है :
इस CI में अतिरिक्त लाभ है जो अनुपात 0 या 1 के बीच के अंतराल में निहित है, और CI हमेशा सही स्तर के होते हुए सामान्य अंतराल से संकीर्ण होता है। आप R में इसे आसानी से निर्दिष्ट करके प्राप्त कर सकते हैं:
set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))
2.5 % 97.5 %
0.2795322 0.4670450
छोटे नमूनों में, MLE को सामान्य सन्निकटन - जबकि नमूना अनुपात के लिए सामान्य सन्निकटन से बेहतर - विश्वसनीय नहीं हो सकता है। यह ठीक है। एक द्विपद घनत्व का पालन करने के लिए लिया जा सकता है । के लिए सीमा 2.5th और 97.5-वें इस वितरण से प्रतिशतक लेने पाया जा सकता है।
दुर्लभ रूप से संभव हाथ से, कम्प्यूटेशनल विधियों का उपयोग करके लिए एक सटीक द्विपद विश्वास अंतराल प्राप्त किया जा सकता है ।
qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47
और यदि 0 या 1 है, तो एक औसत दर्जे का निष्पक्ष अनुमानक का उपयोग औसत दर्जे के निष्पक्ष संभाव्यता फ़ंक्शन के आधार पर गैर-विलक्षण अंतराल अनुमान प्राप्त करने के लिए किया जा सकता है। आप मामूली रूप से सभी 0-केस के निचले बाउंड को 0 डब्लूएलओजी के रूप में ले सकते हैं। ऊपरी बाउंड किसी भी अनुपात जो संतुष्ट करता है:
यह एक कम्प्यूटेशनल रूटीन भी है।
set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
0.5*dbinom(0, 100, p) +
pbinom(1, 100, p, lower.tail = F) -
0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)
[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability
अंतिम दो तरीकों को epitools
आर में पैकेज में लागू किया गया है।