बायसियन प्रिडिक्टिव डिस्ट्रीब्यूशन को समझना


9

मैं एक इंट्रो टू बेयस कोर्स ले रहा हूं और मुझे भविष्यवाणियों के वितरण को समझने में कुछ कठिनाई हो रही है। मैं समझता हूं कि वे क्यों उपयोगी हैं और मैं परिभाषा से परिचित हूं, लेकिन कुछ चीजें हैं जो मुझे समझ में नहीं आती हैं।

1) नई टिप्पणियों के वेक्टर के लिए सही भविष्य कहनेवाला वितरण कैसे प्राप्त करें

मान लीजिए कि हमने डेटा और एक पूर्व लिए एक नमूना मॉडल बनाया है । मान लें कि अवलोकन सशर्त रूप से स्वतंत्र दिए गए ।p(yi|θ)p(θ)yiθ

हमने कुछ डेटा , और हम अपने पूर्व को पश्च से अपडेट करते हैं। ।D={y1,y2,...,yk}p(θ)p(θ|D)

अगर हम नए अवलोकनों , I की भविष्यवाणी करना चाहते थे। सोचें कि हमें इस सूत्र p (\ mathcal {N} | \ mathcal {D}) = \ int p (\ theta | \ mathcal {D}) p (\ mathcal {N}} \ _ta) का उपयोग करके उत्तरवर्ती पूर्वानुमान प्राप्त करने का प्रयास करना चाहिए। ) \ _, \ mathrm {d} \ theta = \ int p (\ theta | \ mathcal {D}) \ prod_ {i = 1} ^ np (\ tilde {y} _i | \ theta) \, \ mathrm {d } \ थीटा, जो \ _ \ _ = i = 1} के बराबर नहीं है , n \ int p (\ ata। \ mathcal {D}) p (\ tilde {y} _i | \ theta) \, \ mathr {d} \ थीटा, इसलिए अनुमानित प्रेक्षण स्वतंत्र नहीं हैं, है ना?N={y~1,y~2,...,y~n}

p(N|D)=p(θ|D)p(N|θ)dθ=p(θ|D)i=1np(y~i|θ)dθ,
i=1np(θ|D)p(y~i|θ)dθ,

ऐसा कहो किएक निश्चित लिए Beta ( ) और Binomial ( ) । इस मामले में, यदि मैं 6 नए का अनुकरण करना चाहता था , अगर मैं इसे सही ढंग से समझता हूं, तो बीटा-द्विपद वितरण से स्वतंत्र रूप से 6 ड्रॉ का अनुकरण करना गलत होगा जो एक एकल अवलोकन के लिए पूर्ववर्ती पूर्वानुमान से मेल खाती है। क्या ये सही है? मुझे नहीं पता कि कैसे व्याख्या की जाए कि प्रेक्षण स्वतंत्र रूप से स्वतंत्र नहीं हैं, और मुझे यकीन नहीं है कि मैं इसे सही ढंग से समझता हूं।θ|Da,bp(yi|θ)n,θny~

पश्चवर्ती भविष्यवाणियों से अनुकरण

कई बार जब हम पूर्ववर्ती पूर्वानुमान से डेटा का अनुकरण करते हैं तो हम इस योजना का पालन करते हैं:

के लिए b 1 से B :

1) से नमूना ।θ(b)p(θ|D)

2) फिर से नया डेटा अनुकरण करें ।N(b)p(N|θ(b))

मुझे यह पता नहीं है कि यह योजना कैसे काम करती है, यह साबित करना है, हालांकि यह सहज है। इसके अलावा, क्या इसका कोई नाम है? मैंने एक औचित्य देखने की कोशिश की और मैंने अलग-अलग नामों की कोशिश की, लेकिन मेरी कोई किस्मत नहीं थी।

धन्यवाद!


मैंने आँकड़ों पर एक समान प्रश्न पूछा ।stackexchange.com/ questions/ 72570 / लेकिन ऐसा लग रहा है कि आपका अब तक अधिक वोट प्राप्त हुआ है।
जॉन

जवाबों:


4

मान लीजिए कि सशर्त रूप से स्वतंत्र हैं जो कि । फिर, जिसमें पहली समानता कुल संभावना के नियम से, दूसरी उत्पाद नियम से, और तीसरी सशर्त स्वतंत्रता से मानकर चलती है: का मान दियाX1,,Xn,Xn+1Θ=θ

fXn+1X1,,Xn(xn+1x1,,xn)=fXn+1,ΘX1,,Xn(xn+1,θx1,,xn)dθ
=fXn+1Θ,X1,,Xn(xn+1θ,x1,,xn)fΘX1,,Xn(θx1,,xn)dθ
=fXn+1Θ(xn+1θ)fΘX1,,Xn(θx1,,xn)dθ,
Θ, हमें के वितरण का निर्धारण करने के लिए के मूल्यों की आवश्यकता नहीं है ।X1,,XnXn+1

के लिए: सिमुलेशन योजना सही है , आकर्षित के वितरण से , तो आकर्षित के वितरण से । यह आपको के वितरण से एक नमूना देता है ।i=1,,Nθ(i)ΘX1=x1,,Xn=xnxn+1(i)Xn+1Θ=θ(i){xn+1(i)}i=1NXn+1X1=x1,,Xn=xn


यदि आप कई अवधियों में पश्चवर्ती भविष्यवाणियां कर रहे हैं तो क्या होगा? मैं प्रत्येक लिए उपयोग कर रहा हूं, लेकिन मैं यह देख सकता हूं कि नए थीटा को फिर से बनाने के लिए यह समझ में क्यों आता है। θ(i)xn+j
जॉन

2

मैं पश्चवर्ती भविष्यवाणिय वितरण चरण-दर-चरण उत्पन्न करने के पीछे अंतर्ज्ञान पर जाने की कोशिश करूँगा।

चलो y अवलोकन डेटा का एक वेक्टर हो जो एक संभाव्यता वितरण से आता है p(y|θ) और जाने y~भविष्य का एक वेक्टर (या आउट-ऑफ-सैंपल) मानों की हम भविष्यवाणी करना चाहते हैं। हम मानते हैं किy~ उसी वितरण से आता है y। यह हमारे सर्वोत्तम अनुमान का उपयोग करने के लिए आकर्षक हो सकता हैθ--- जैसे MLE या MAP अनुमान --- इस वितरण के बारे में जानकारी प्राप्त करने के लिए। हालाँकि, ऐसा करना अनिवार्य रूप से हमारी अनिश्चितता को अनदेखा करेगाθ। इस प्रकार, प्रोसेस करने का उपयुक्त तरीका है कि वितरण के बाद के वितरण पर औसतनθ, अर्थात् p(θ|y)। उस पर भी ध्यान देंy~ से स्वतंत्र है y दिया हुआ θ, क्योंकि इसे उसी तरह के वितरण से खींचा गया एक स्वतंत्र नमूना माना जाता है y। इस प्रकार,

p(y~|θ,y)=p(y~,y|θ)p(θ)p(θ,y)=p(y~|θ)p(y|θ)p(θ)p(y|θ)p(θ)=p(y~|θ).

के बाद के पूर्वानुमानात्मक वितरण y~ ऐसा इसलिए,

p(y~|y)=Θp(y~|θ,y)p(θ|y)dθ=Θp(y~|θ)p(θ|y)dθ

कहाँ पे Θ का समर्थन है θ

अब, हम किस प्रकार से नमूने प्राप्त करते हैं p(y~|y)? आपके द्वारा वर्णित विधि को कभी-कभी रचना की विधि कहा जाता है , जो निम्नानुसार काम करती है:


s = 1,2 के लिए, ..., S do

खींचना θ(s) से p(θ|y)

खींचना y~(s) से p(y~|θ(s))


जहां, ज्यादातर स्थितियों में, हमारे पास पहले से ही ड्रॉ है p(θ|y), ताकि केवल दूसरे चरण की आवश्यकता हो।

इस काम के कारण काफी सरल है: पहला ध्यान दें कि p(y~,θ|y)=p(y~|θ,y)p(θ|y)। इस प्रकार, एक पैरामीटर वेक्टर का नमूनाθ(s) से p(θ|y) और फिर, इस सदिश का नमूना लेने के लिए y~(s) से p(y~|θ(s))=p(y~|θ(s),y) संयुक्त वितरण से नमूने प्राप्त करता है p(y~,θ|y)। यह इस प्रकार है, नमूना मूल्योंy~(s),s=1,2,...,S सीमांत वितरण से नमूने हैं, p(y~|y)


1

अपने पहले प्रश्न को संबोधित करने के लिए: हाँ, यदि आप मूल्य नहीं जानते हैं तो अवलोकन स्वतंत्र नहीं हैं θ। कहो, आपने देखा हैy~1बल्कि अत्यधिक मूल्य है। यह एक संकेत हो सकता है कि अज्ञात मूल्यθ अपने आप में चरम है, और, इस प्रकार, आपको अन्य टिप्पणियों को भी चरम होने की उम्मीद करनी चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.