हम बायेसियन सांख्यिकीय परीक्षण की जांच कर रहे हैं, और एक विषम (मेरे लिए कम से कम) घटना पर आते हैं।
निम्नलिखित मामले पर विचार करें: हम यह मापने में रुचि रखते हैं कि कौन सी जनसंख्या, ए या बी, की उच्च रूपांतरण दर है। एक जांच के लिए, हम सेट , , रूपांतरण की संभावना दोनों समूहों में समान है। हम एक द्विपद मॉडल का उपयोग करके कृत्रिम डेटा उत्पन्न करते हैं, उदाहरण के लिए
फिर हम एक बायेसियन बीटा- मॉडल का उपयोग करके का अनुमान लगाने का प्रयास करते हैं ताकि हम प्रत्येक रूपांतरण दर के लिए प्राप्त करें, जैसे
मोंटे कार्लो के माध्यम से की गणना करके हमारे परीक्षण सांख्यिकीय की गणना की जाती है ।
मुझे आश्चर्य हुआ कि यदि , तो । मेरे विचार थे कि यह लगभग 0.5 के आसपास केंद्रित होगा, और यहां तक कि 0.5 के लिए नमूना आकार, , बढ़ता है।
मेरा प्रश्न है, जब है तो ?पी ए = पी बी
यहाँ कुछ पायथन कोड प्रदर्शित करने के लिए है:
%pylab
from scipy.stats import beta
import numpy as np
import pylab as P
a = b = 0.5
N = 10000
samples = [] #collects the values of S
for i in range(5000):
assert a==b
A = np.random.binomial(N, a); B = np.random.binomial(N, b)
S = (beta.rvs(A+1, N-A+1, size=15000) > beta.rvs(B+1, N-B+1, size=15000)).mean()
samples.append(S)
P.hist(samples)
P.show()
R