सामान्य सन्निकटन का उपयोग न करें
इस समस्या के बारे में बहुत कुछ लिखा गया है। एक सामान्य सलाह यह है कि सामान्य सन्निकटन (यानी, एसिम्प्टोटिक / वल्ड विश्वास अंतराल) का कभी भी उपयोग न करें, क्योंकि इसमें उच्च कवरेज गुण होते हैं। इसे दर्शाने के लिए R कोड:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
छोटी सफलता की संभावनाओं के लिए, आप 95% विश्वास अंतराल के लिए पूछ सकते हैं, लेकिन वास्तव में, 10% विश्वास अंतराल प्राप्त करें!
अनुशंसाएँ
तो हमें क्या उपयोग करना चाहिए ? मेरा मानना है कि वर्तमान अनुशंसाएँ सांख्यिकी विज्ञान 2001 में ब्राउन, कै और दासगुप्ता द्वारा द्विपद अनुपात के लिए पेपर इंटरवल आकलन में सूचीबद्ध हैं । 16, सं। २, पृष्ठ १०१-१३३। लेखकों ने विश्वास अंतराल की गणना के लिए कई तरीकों की जांच की, और निम्नलिखित निष्कर्ष पर पहुंचे।
[डब्ल्यू] ई विल्सन अंतराल या समान-पूंछ वाले जेफरी को छोटे एन के लिए पूर्व अंतराल और एगेस्टी और कूप में बड़े एन के लिए सुझाए गए अंतराल की सलाह देते हैं ।
विल्सन अंतराल को कभी-कभी स्कोर अंतराल भी कहा जाता है , क्योंकि यह एक स्कोर परीक्षण के आधार पर होता है।
अंतराल की गणना
इन आत्मविश्वास अंतरालों की गणना करने के लिए, आप इस ऑनलाइन कैलकुलेटर या binom.confint()
फ़ंक्शन का उपयोग binom
आर में पैकेज में कर सकते हैं। उदाहरण के लिए, 25 परीक्षणों में 0 सफलताओं के लिए, आर कोड होगा:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
यहाँ bayes
जेफ्रीज़ अंतराल है। ( समान-पूंछ वाले अंतराल type="central"
को प्राप्त करने के लिए तर्क की आवश्यकता है ।)
ध्यान दें कि आपको यह तय करना चाहिए कि अंतराल की गणना करने से पहले आप उन तीन तरीकों में से किसका उपयोग करना चाहते हैं। तीनों को देखते हुए और सबसे छोटा चयन स्वाभाविक रूप से आपको बहुत कम कवरेज संभावना देगा।
एक त्वरित, अनुमानित उत्तर
अंतिम नोट के रूप में, यदि आप अपने n परीक्षणों में बिल्कुल शून्य सफलताओं का निरीक्षण करते हैं और बस एक बहुत जल्दी अनुमानित आत्मविश्वास अंतराल चाहते हैं, तो आप तीन के नियम का उपयोग कर सकते हैं । बस संख्या 3 को n से विभाजित करें । उपरोक्त उदाहरण में n 25 है, इसलिए ऊपरी सीमा 3/25 = 0.12 है (निचली सीमा निश्चित रूप से 0 है)।