बीटा वितरण के माध्यम के लिए विश्वास अंतराल की गणना करें


12

[0,1] में रेटिंग के एक सेट के लिए एक बीटा वितरण पर विचार करें। माध्य की गणना करने के बाद:

μ=αα+β

क्या इस माध्यम के आसपास एक विश्वास अंतराल प्रदान करने का एक तरीका है?


1
प्रमुख - आपने जनसंख्या का मतलब परिभाषित किया है । एक विश्वास अंतराल उस माध्य के कुछ अनुमान पर आधारित होगा। आप किस नमूने का उपयोग कर रहे हैं?
Glen_b -Reinstate मोनिका

Glen_b - नमस्ते, मैं अंतराल (0,1) में सामान्यीकृत रेटिंग (उत्पाद का) का एक सेट का उपयोग कर रहा हूं। मैं जिस चीज की तलाश कर रहा हूं वह मीन के आसपास एक अंतराल का अनुमान है (किसी दिए गए आत्मविश्वास के स्तर के लिए), उदाहरण के लिए: मतलब + - 0.02
डोमिनिक

2
अधिवास: मुझे फिर से कोशिश करते हैं। आप जनसंख्या का मतलब नहीं जानते हैं । यदि आप अपने अंतराल के बीच में बैठना चाहते हैं ( अनुमान आधी-चौड़ाई , जैसा कि आपकी टिप्पणी में है), तो आपको उस बीच के अंतराल को रखने के लिए मध्य क्रम में उस मात्रा के लिए कुछ अनुमानक की आवश्यकता होगी। आप इसके लिए क्या उपयोग कर रहे हैं? अधिकतम संभाव्यता? क्षणों की विधि? कुछ और? ±
Glen_b -Reinstate मोनिका

Glen_b - आपके धैर्य के लिए धन्यवाद। मैं MLE
अधिवासित

2
डोमिनिक; उस मामले में, बड़े के लिए अधिकतम संभावना अनुमानक के एसिम्प्टोटिक गुणों का उपयोग किया जाएगा; की एमएल अनुमान asymptotically सामान्य रूप से मतलब के साथ वितरित किया जाएगा और मानक त्रुटि फिशर सूचना से गणना की जा सकती है कि । छोटे नमूनों में कभी-कभी MLE के वितरण की गणना की जा सकती है (हालांकि बीटा के मामले में मुझे याद है कि यह कठिन है); एक विकल्प यह है कि आप इसके व्यवहार को समझने के लिए अपने नमूना आकार में वितरण का अनुकरण करें। nμμ
Glen_b -Reinstate Monica

जवाबों:


22

जबकि बीटा वितरण में मापदंडों के लिए आत्मविश्वास अंतराल की गणना के लिए विशिष्ट तरीके हैं, मैं कुछ सामान्य तरीकों का वर्णन करूंगा, जिनका उपयोग बीटा वितरण सहित सभी प्रकार के वितरणों के लिए किया जा सकता है , और आसानी से आर में लागू किया जाता है। ।

प्रोफाइल संभावना आत्मविश्वास अंतराल

आइए संगत प्रोफाइल संभावना अंतराल के साथ अधिकतम संभावना अनुमान के साथ शुरू करें। पहले हमें कुछ नमूना डेटा चाहिए:

# Sample size
n = 10

# Parameters of the beta distribution
alpha = 10
beta = 1.4

# Simulate some data
set.seed(1)
x = rbeta(n, alpha, beta)

# Note that the distribution is not symmetrical
curve(dbeta(x,alpha,beta))

बीटा वितरण के लिए संभाव्यता घनत्व फ़ंक्शन।

वास्तविक / सैद्धांतिक मतलब है

> alpha/(alpha+beta)
0.877193

अब हमें मापदंडों में से एक के रूप में बीटा वितरण से एक नमूना के लिए नकारात्मक लॉग संभावना फ़ंक्शन की गणना करने के लिए एक फ़ंक्शन बनाना होगा। हम उपयोग कर सकते हैं dbeta()समारोह है, लेकिन इस के बाद से मतलब से जुड़े एक parametrisation का उपयोग नहीं करता है, हम है है अपने मानकों (व्यक्त करने के लिए α और β मतलब के एक समारोह और कुछ अन्य पैरामीटर (मानक विचलन) की तरह के रूप में):

# Negative log likelihood for the beta distribution
nloglikbeta = function(mu, sig) {
  alpha = mu^2*(1-mu)/sig^2-mu
  beta = alpha*(1/mu-1)
  -sum(dbeta(x, alpha, beta, log=TRUE))
}

अधिकतम संभावना अनुमान लगाने के लिए, हम लाइब्रेरी mle()में फ़ंक्शन का उपयोग कर सकते हैं stats4:

library(stats4)
est = mle(nloglikbeta, start=list(mu=mean(x), sig=sd(x)))

अभी के लिए चेतावनी को अनदेखा करें। वे ऑप्टिमाइज़ेशन एल्गोरिदम के कारण होते हैं जो मापदंडों के लिए अमान्य मानों की कोशिश करते हैं, α और / या β के लिए नकारात्मक मान देते हैं । (चेतावनी से बचने के लिए, आप एक lowerतर्क जोड़ सकते हैं और methodउपयोग किए गए अनुकूलन को बदल सकते हैं ।)

अब हमारे पास हमारे दो मापदंडों के लिए अनुमान और आत्मविश्वास अंतराल हैं:

> est
Call:
mle(minuslogl = nloglikbeta, start = list(mu = mean(x), sig = sd(x)))

Coefficients:
        mu        sig 
0.87304148 0.07129112

> confint(est)
Profiling...
         2.5 %    97.5 %
mu  0.81336555 0.9120350
sig 0.04679421 0.1276783

ध्यान दें कि, उम्मीद के मुताबिक, आत्मविश्वास अंतराल सममित नहीं हैं:

par(mfrow=c(1,2))
plot(profile(est)) # Profile likelihood plot

बीटा वितरण के लिए प्रोफाइल संभावना प्लॉट।

(दूसरी-बाहरी मैजेंटा लाइनें 95% विश्वास अंतराल दिखाती हैं।)

यह भी ध्यान दें कि केवल 10 टिप्पणियों के साथ, हमें बहुत अच्छे अनुमान (एक संकीर्ण आत्मविश्वास अंतराल) मिलते हैं।

के विकल्प के रूप में mle(), आप पैकेज fitdistr()से फ़ंक्शन का उपयोग कर सकते हैं MASS। यह भी अधिकतम संभावना अनुमानक की गणना करता है, और इसका लाभ यह है कि आपको केवल घनत्व की आपूर्ति करने की आवश्यकता है, न कि नकारात्मक लॉग संभावना, लेकिन आपको प्रोफाइल संभावना आत्मविश्वास अंतराल नहीं देता है, केवल असममित (सममित) आत्मविश्वास अंतराल।

पैकेज mle2()से एक बेहतर विकल्प (और संबंधित कार्य) है bbmle, जो कुछ हद तक अधिक लचीला और शक्तिशाली है mle(), और थोड़ा अच्छा प्लॉट देता है।

बूटस्ट्रैप आत्मविश्वास अंतराल

एक अन्य विकल्प बूटस्ट्रैप का उपयोग करना है। आर में उपयोग करना बेहद आसान है, और आपको घनत्व फ़ंक्शन की आपूर्ति भी नहीं करनी है:

> library(simpleboot)
> x.boot = one.boot(x, mean, R=10^4)
> hist(x.boot)                # Looks good
> boot.ci(x.boot, type="bca") # Confidence interval
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 10000 bootstrap replicates

CALL : 
boot.ci(boot.out = x.boot, type = "bca")

Intervals : 
Level       BCa          
95%   ( 0.8246,  0.9132 )  
Calculations and Intervals on Original Scale

बूटस्ट्रैप में अतिरिक्त लाभ है कि यह तब भी काम करता है जब आपका डेटा बीटा वितरण से नहीं आता है।

असममित आत्मविश्वास अंतराल

मतलब पर विश्वास अंतराल के लिए, आइए केंद्रीय सीमा प्रमेय (और t -distribution) के आधार पर अच्छे पुराने स्पर्शोन्मुख आत्मविश्वास अंतराल को न भूलें । जब तक हमारे पास एक बड़ा नमूना आकार होता है (इसलिए सीएलटी लागू होता है और नमूना माध्य का वितरण लगभग सामान्य है) या α और β दोनों के बड़े मूल्य (ताकि बीटा वितरण स्वयं लगभग सामान्य हो), यह अच्छी तरह से काम करता है। यहां हमारे पास न तो है, लेकिन विश्वास अंतराल अभी भी बहुत बुरा नहीं है:

> t.test(x)$conf.int
[1] 0.8190565 0.9268349

N के थोड़े से लार्ज वैल्यू (और दो मापदंडों का बहुत अधिक मान नहीं) के लिए, एसिम्प्टोटिक विश्वास अंतराल बहुत अच्छी तरह से काम करता है।


धन्यवाद कार्ल। त्वरित प्रश्न: आपने अपने अल्फ़ा और बीटा का निर्धारण कैसे किया? मैंने अल्फ़ा और बीटा प्राप्त करने के लिए विचरण और नमूना माध्य का उपयोग किया है, लेकिन मुझे लगता है कि मैंने जनसंख्या माध्य के साथ नमूना माध्य को भ्रमित किया हो सकता है इसलिए मुझे यकीन नहीं है कि मैं इसके बारे में सही तरीके से चला गया हूं ... ऊपर ग्लेन_ब की टिप्पणी देखें ।
अधिवास

माध्य और मानक विचलन के कार्यों के रूप में α और β निर्धारित करने के लिए , मैंने सिर्फ माध्य और मानक विचलन के लिए कार्यों को उल्टा किया α और dev के कार्यों के रूप में (लेकिन मुझे यकीन है कि आप इसे नेट पर भी देख सकते हैं)।
कार्ल ओवे हफथमर

α,β

0

बीटा प्रतिगमन की जाँच करें। R का उपयोग करके इसे करने का एक अच्छा परिचय यहां पाया जा सकता है:

http://cran.r-project.org/web/packages/betareg/vignettes/betareg.pdf

आत्मविश्वास अंतराल के निर्माण का एक और (वास्तव में आसान) तरीका गैर-पैरामीट्रिक बूस्टर दृष्टिकोण का उपयोग करना होगा। विकिपीडिया की अच्छी जानकारी है:

http://en.wikipedia.org/wiki/Bootstrapping_%28statistics%29

यहाँ भी अच्छा वीडियो:

http://www.youtube.com/watch?v=ZCXg64l9R_4

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.