जैसा कि मैं पर्याप्तता के बारे में अध्ययन कर रहा था, मैं आपके सवाल पर आया था क्योंकि मैं भी इस बारे में अंतर्ज्ञान को समझना चाहता था कि मैंने जो यह इकट्ठा किया है, वह वही है जिसके साथ मैं आया हूं (मुझे पता है कि आप क्या सोचते हैं, अगर मैंने कोई गलती की है, आदि)।
चलो मतलब के साथ एक प्वासों बंटन से नमूने के तौर पर हो θ > 0 ।X1,…,Xnθ>0
हम जानते हैं कि , θ के लिए एक पर्याप्त आँकड़ा है , क्योंकि X 1 का सशर्त वितरण , … , X n दिया गया T ( X ) अन्य शब्दों में, θ से मुक्त है , नहीं θ पर निर्भर हैं ।T(X)=∑ni=1XiθX1,…,XnT(X)θθ
अब, सांख्यिकीविद् जानता है कि एक्स 1 , … , एक्स एन आई । मैं । d ) P o i s s o n ( 4 ) और इस वितरण से n = 400 यादृच्छिक मान बनाता है :A X1,…,Xn∼i.i.dPoisson(4)n=400
n<-400
theta<-4
set.seed(1234)
x<-rpois(n,theta)
y=sum(x)
freq.x<-table(x) # We will use this latter on
rel.freq.x<-freq.x/sum(freq.x)
सांख्यिकीविद् ने जो मूल्य बनाए हैं, उसके लिए वह इसका योग लेता है और सांख्यिकीविद् बी से निम्नलिखित पूछता है :AB
"इन नमूना मान रहा है एक प्वासों बंटन से लिया। जानने कि Σ n मैं = 1 एक्स मैं = y = 4068- , क्या आप मुझे इस वितरण के बारे में बता सकते हैं?"x1,…,xn∑ni=1xi=y=4068
तो, जानते हुए भी केवल कि (और तथ्य यह है कि नमूना एक प्वासों बंटन से पैदा हुई) सांख्यिकीविद् के लिए पर्याप्त है बी के बारे में कुछ भी कहने के लिए θ ? चूँकि हम जानते हैं कि यह एक पर्याप्त आँकड़ा है जिसे हम जानते हैं कि इसका उत्तर "हाँ" है।∑ni=1xi=y=4068Bθ
इसके अर्थ के बारे में कुछ जानकारी हासिल करने के लिए, आइए निम्न कार्य करें (हॉग और मैकेन और क्रेग के "गणितीय सांख्यिकी का परिचय", 7 वें संस्करण, व्यायाम 7.1.9):
" कुछ नकली टिप्पणियों को बनाने का फैसला करता है, जिसे वह z 1 , z 2 , ... , z n (जैसा कि वह जानता है कि वे शायद मूल x- समानों के बराबर नहीं होंगे ) निम्नानुसार हैं। वह कहते हैं कि स्वतंत्र पॉइसन की सशर्त संभावना है। यादृच्छिक परिवर्तनीय जेड 1 , जेड 2 ... , जेड एन के बराबर किया जा रहा z 1 , जेड 2 , ... , जेड एन , यह देखते हुए Σ z मैं = y , हैBz1,z2,…,znxZ1,Z2…,Znz1,z2,…,zn∑zi=y
θz1e−θz1!θz2e−θz2!⋯θzne−θzn!nθye−nθy!=y!z1!z2!⋯zn!(1n)z1(1n)z2⋯(1n)zn
के बाद से मतलब के साथ एक प्वासों बंटन है n θ । बाद के वितरण के साथ बहुपद है y स्वतंत्र प्रयासों, में से एक में प्रत्येक समाप्त n परस्पर अनन्य और व्यापक तरीके, जिनमें से प्रत्येक एक ही संभावना है 1 / n । तदनुसार, बी इस तरह के एक बहुराष्ट्रीय प्रयोग y स्वतंत्र परीक्षण चलाता है और z 1 , … , z n प्राप्त करता है । "Y=∑Zinθyn1/nByz1,…,zn
यह वही है जो अभ्यास बताता है। तो, चलो ठीक है कि:
# Fake observations from multinomial experiment
prob<-rep(1/n,n)
set.seed(1234)
z<-as.numeric(t(rmultinom(y,n=c(1:n),prob)))
y.fake<-sum(z) # y and y.fake must be equal
freq.z<-table(z)
rel.freq.z<-freq.z/sum(freq.z)
और देखते हैं कि कैसा दिखता है (मैं भी k = 0 , 1 , … , 13 के लिए Poisson (4) के वास्तविक घनत्व की साजिश रच रहा हूँ - 13 से ऊपर की कुछ भी, शून्य से तुलनात्मक रूप से - तुलना के लिए है):Zk=0,1,…,13
# Verifying distributions
k<-13
plot(x=c(0:k),y=dpois(c(0:k), lambda=theta, log = FALSE),t="o",ylab="Probability",xlab="k",
xlim=c(0,k),ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(8,0.2, legend=c("Real Poisson","Random Z given y"),
col = c("black","green"),pch=c(1,4))
तो, बारे में कुछ नहीं जानते हुए भी और जानते हुए भी केवल पर्याप्त आंकड़ा Y = Σ एक्स मैं हम एक "वितरण" है कि एक प्वासों की तरह एक बहुत लग रहा है recriate करने में सक्षम थे (4) वितरण (के रूप में एन बढ़ जाती है, दो घटता अधिक समान हो जाते हैं)।θY=∑Xin
अब, और Z की तुलना करना | y :XZ|y
plot(rel.freq.x,t="o",pch=16,col="red",ylab="Relative Frequency",xlab="k",
ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(7,0.2, legend=c("Random X","Random Z given y"), col = c("red","green"),pch=c(16,4))
हम देखते हैं कि वे बहुत समान हैं, साथ ही (उम्मीद के मुताबिक)
XiY=X1+X2+⋯+Xn