एक द्विपद प्रयोग के विश्वास अंतराल की गणना करने के लिए सबसे अच्छी तकनीक क्या है, यदि आपका अनुमान है कि (या इसी तरह ) और नमूना आकार अपेक्षाकृत छोटा है, उदाहरण के लिए ?
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
एक द्विपद प्रयोग के विश्वास अंतराल की गणना करने के लिए सबसे अच्छी तकनीक क्या है, यदि आपका अनुमान है कि (या इसी तरह ) और नमूना आकार अपेक्षाकृत छोटा है, उदाहरण के लिए ?
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
जवाबों:
इस समस्या के बारे में बहुत कुछ लिखा गया है। एक सामान्य सलाह यह है कि सामान्य सन्निकटन (यानी, एसिम्प्टोटिक / वल्ड विश्वास अंतराल) का कभी भी उपयोग न करें, क्योंकि इसमें उच्च कवरेज गुण होते हैं। इसे दर्शाने के लिए R कोड:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

छोटी सफलता की संभावनाओं के लिए, आप 95% विश्वास अंतराल के लिए पूछ सकते हैं, लेकिन वास्तव में, 10% विश्वास अंतराल प्राप्त करें!
तो हमें क्या उपयोग करना चाहिए ? मेरा मानना है कि वर्तमान अनुशंसाएँ सांख्यिकी विज्ञान 2001 में ब्राउन, कै और दासगुप्ता द्वारा द्विपद अनुपात के लिए पेपर इंटरवल आकलन में सूचीबद्ध हैं । 16, सं। २, पृष्ठ १०१-१३३। लेखकों ने विश्वास अंतराल की गणना के लिए कई तरीकों की जांच की, और निम्नलिखित निष्कर्ष पर पहुंचे।
[डब्ल्यू] ई विल्सन अंतराल या समान-पूंछ वाले जेफरी को छोटे एन के लिए पूर्व अंतराल और एगेस्टी और कूप में बड़े एन के लिए सुझाए गए अंतराल की सलाह देते हैं ।
विल्सन अंतराल को कभी-कभी स्कोर अंतराल भी कहा जाता है , क्योंकि यह एक स्कोर परीक्षण के आधार पर होता है।
इन आत्मविश्वास अंतरालों की गणना करने के लिए, आप इस ऑनलाइन कैलकुलेटर या binom.confint()फ़ंक्शन का उपयोग binomआर में पैकेज में कर सकते हैं। उदाहरण के लिए, 25 परीक्षणों में 0 सफलताओं के लिए, आर कोड होगा:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
यहाँ bayesजेफ्रीज़ अंतराल है। ( समान-पूंछ वाले अंतराल type="central"को प्राप्त करने के लिए तर्क की आवश्यकता है ।)
ध्यान दें कि आपको यह तय करना चाहिए कि अंतराल की गणना करने से पहले आप उन तीन तरीकों में से किसका उपयोग करना चाहते हैं। तीनों को देखते हुए और सबसे छोटा चयन स्वाभाविक रूप से आपको बहुत कम कवरेज संभावना देगा।
अंतिम नोट के रूप में, यदि आप अपने n परीक्षणों में बिल्कुल शून्य सफलताओं का निरीक्षण करते हैं और बस एक बहुत जल्दी अनुमानित आत्मविश्वास अंतराल चाहते हैं, तो आप तीन के नियम का उपयोग कर सकते हैं । बस संख्या 3 को n से विभाजित करें । उपरोक्त उदाहरण में n 25 है, इसलिए ऊपरी सीमा 3/25 = 0.12 है (निचली सीमा निश्चित रूप से 0 है)।
bayesयूनिफ़ॉर्म के पहले (जेफ़री के बजाय) का उपयोग करता है जब दोनों आकार पैरामीटर 1 होते हैं। मैंने जेफरी की बनाम वर्दी के फायदे (पूर्व) के बारे में जिज्ञासा से बाहर बिनोम पैकेज के अनुरक्षक के साथ ईमेल किया और उसने मुझे बताया कि एक नया संस्करण का उपयोग करेगा डिफ़ॉल्ट के रूप में पहले वर्दी। इसलिए आश्चर्य नहीं कि भविष्य में परिणाम थोड़ा भिन्न हो।
binconfमें विधि Hmiscभी इन अंतराल गणना करता है। यह विल्सन विधि के लिए चूक।
Agretsi (2007, pp.9-10) से पता चलता है कि जब अनुपात 0 या 1 के पास आता है, तो आत्मविश्वास अंतराल खराब प्रदर्शन करता है। इसके बजाय, एक "द्वैत बुद्धि महत्व परीक्षण ... का उपयोग करें [कि] null परिकल्पना पैरामीटर के लिए के सभी मान शामिल हैं जो एक न्यायपूर्ण प्रशंसनीय है," जहां अज्ञात पैरामीटर है। समीकरण में
लिए हल करके ऐसा करें । दोनों पक्षों को ऐसा करें, उपज
द्विघात सूत्र का उपयोग करके हल करें, जो उपज देगा उपयुक्त महत्वपूर्ण z- मूल्य।