वे माना जाता है कि सममित माना जाता है क्योंकि अक्सर एक सामान्य सन्निकटन का उपयोग किया जाता है। यह एक अच्छी तरह से काम करता है मामले में पी 0.5 के आसपास है। binom.test
दूसरी ओर "सटीक" क्लॉपर-पियर्सन अंतराल की रिपोर्ट करता है, जो एफ वितरण पर आधारित हैं ( दोनों दृष्टिकोणों के सटीक सूत्रों के लिए यहां देखें )। यदि हम आर में क्लोपर-पीयरसन अंतराल को लागू करेंगे तो यह कुछ इस तरह होगा ( नोट देखें ):
Clopper.Pearson <- function(x, n, conf.level){
alpha <- (1 - conf.level) / 2
QF.l <- qf(1 - alpha, 2*n - 2*x + 2, 2*x)
QF.u <- qf(1 - alpha, 2*x + 2, 2*n - 2*x)
ll <- if (x == 0){
0
} else { x / ( x + (n-x+1)*QF.l ) }
uu <- if (x == 0){
0
} else { (x+1)*QF.u / ( n - x + (x+1)*QF.u ) }
return(c(ll, uu))
}
आप लिंक में और कार्यान्वयन में दोनों देखते हैं कि ऊपरी और निचली सीमा के लिए सूत्र पूरी तरह से अलग हैं। एक सममित विश्वास अंतराल का एकमात्र मामला है जब पी = 0.5। सूत्र से लिंक का उपयोग करना और ध्यान में रखना कि इस मामले में n=2×x अपने आप को प्राप्त करना आसान है कि यह कैसे आता है।
मैंने व्यक्तिगत रूप से एक लॉजिस्टिक दृष्टिकोण के आधार पर आत्मविश्वास अंतराल को देखना बेहतर समझा। द्विपद डेटा आमतौर पर एक लॉग लिंक लिंक फ़ंक्शन का उपयोग करके बनाया गया है, जिसे निम्न रूप में परिभाषित किया गया है:
logit(x)=log(x1−x)
यह लिंक एक सामान्य वितरण के लिए लॉजिस्टिक प्रतिगमन में त्रुटि शब्द "मैप" करता है। परिणामस्वरूप, लॉजिस्टिक फ्रेमवर्क में विश्वास अंतराल लॉजिटिक मूल्यों के आसपास सममित होते हैं, क्लासिक लीनियर रिग्रेशन फ्रेमवर्क की तरह। रेखीय प्रतिगमन के आसपास संपूर्ण सामान्यता-आधारित सिद्धांत का उपयोग करने की अनुमति देने के लिए लॉगजीस परिवर्तन का सटीक उपयोग किया जाता है।
उलटा परिवर्तन करने के बाद:
logit−1(x)=ex1+ex
आपको फिर से एक असममित अंतराल मिलता है। अब ये विश्वास अंतराल वास्तव में पक्षपाती हैं। उनकी कवरेज वह नहीं है जिसकी आप उम्मीद करेंगे, खासकर द्विपद वितरण की सीमाओं पर। फिर भी, एक उदाहरण के रूप में वे आपको दिखाते हैं कि यह तर्क क्यों है कि एक द्विपद वितरण में असममित आत्मविश्वास अंतराल है।
R में एक उदाहरण:
logit <- function(x){ log(x/(1-x)) }
inv.logit <- function(x){ exp(x)/(1+exp(x)) }
x <- c(0.2, 0.5, 0.8)
lx <- logit(x)
upper <- lx + 2
lower <- lx - 2
logxtab <- cbind(lx, upper, lower)
logxtab # the confidence intervals are symmetric by construction
xtab <- inv.logit(logxtab)
xtab # back transformation gives asymmetric confidence intervals
नोट : वास्तव में, आर बीटा वितरण का उपयोग करता है, लेकिन यह पूरी तरह से समकक्ष है और कम्प्यूटेशनल रूप से थोड़ा अधिक कुशल है। आर में कार्यान्वयन इस प्रकार है जो मैं यहाँ दिखाता हूं, लेकिन यह बिल्कुल वैसा ही परिणाम देता है।