मैं इस प्रश्न का उत्तर देने के लिए (विशेष अध्याय 6 में) एक महान स्रोत के रूप में पुस्तक बेयसियन डेटा एनालिसिस का सुझाव दूंगा और जो कुछ मैं कहने वाला हूं। लेकिन एक सामान्य तरीका है कि बेयसियंस इस समस्या पर हमला करते हैं, पोस्टीरियर प्रिडिक्टिव पी-वैल्यूज़ (पीपीपी) का उपयोग करते हैं। इससे पहले कि मैं इस समस्या को हल करूं, में कूद जाऊं और मुझे पहले नोटेशन को परिभाषित करने दें:
चलो मनाया डेटा हो सकता है और मापदंडों के वेक्टर हो। हम परिभाषित के रूप में दोहराया डेटा है कि हो सकता है मनाया गया, या, predictively में सोचने के लिए, डेटा के रूप में हम हैं कल मिलते हैं, तो प्रयोग है कि उत्पादन आज एक ही मॉडल और एक ही साथ दोहराया गया का मान जो देखे गए डेटा का उत्पादन करता है।θ y प्रतिनिधिyθyप्रतिनिधिθyθ
ध्यान दें, हम के वितरण को परिभाषित करेंगे जो ज्ञान की वर्तमान स्थिति को भविष्य कहनेवाला वितरण
पी ( y प्रतिनिधि | y ) = ∫ Θ पी ( y प्रतिनिधि | θ ) पी (yप्रतिनिधि
p ( yप्रतिनिधि| y) = ∫Θp ( yप्रतिनिधि| θ)पी(θ | y |) dθ
अब, हम मॉडल और डेटा के बीच विसंगति को परीक्षण मात्राओं को परिभाषित करके माप सकते हैं , जिस डेटा की हम जाँच करना चाहते हैं। एक परीक्षण मात्रा, या विसंगति माप , , मापदंडों और डेटा का एक स्केलर सारांश है जो डेटा की भविष्यवाणी करते समय एक मानक के रूप में उपयोग किया जाता है। टेस्ट की मात्रा बायेसियन मॉडल की जांच में भूमिका निभाती है कि परीक्षण के आंकड़े शास्त्रीय परीक्षण में खेलते हैं। हम एक परीक्षण सांख्यिकीय के लिए संकेतन को परिभाषित करते हैं , जो एक परीक्षण मात्रा है जो केवल डेटा पर निर्भर करता है; बायेसियन संदर्भ में, हम परीक्षण के आंकड़ों को सामान्य कर सकते हैं ताकि उनके पीछे के वितरण के तहत मॉडल मापदंडों पर निर्भरता की अनुमति मिल सके।टी ( y )टी( y, Θ )टी( y)
शास्त्रीय आधार पर, परीक्षण आंकड़ा के लिए पी-मूल्य है
पी सी = पीआर ( टी ( y प्रतिनिधि ) ≥ टी ( y ) | θ )
जहां संभावना के वितरण पर लिया जाता है y प्रतिनिधि के साथ θ तय की।टी( y)
पीसी= प्र ( टी( yप्रतिनिधि) ≥ टी( y) | θ )
yप्रतिनिधिθ
एक बायेसियन परिप्रेक्ष्य से, पश्चवर्ती भविष्य कहे जाने वाले वितरण के संबंध में डेटा के फिट की कमी को परीक्षण क्षेत्र की पूंछ-क्षेत्र संभावना, या पी-मान, और पश्चवर्ती सिमुलेशन का उपयोग करके मापा जा सकता है। । बायेसियन दृष्टिकोण में, परीक्षण मात्रा अज्ञात मापदंडों के कार्यों के साथ-साथ डेटा भी हो सकती है क्योंकि परीक्षण की मात्रा का मूल्यांकन अज्ञात मापदंडों के पीछे वितरण से आरेखित किया जाता है।( Θ , yप्रतिनिधि)
पीबी= प्र ( टी( yप्रतिनिधि, Θ ) ≥ टी( y, Θ ) | y)
θyप्रतिनिधिपी ( θ , yप्रतिनिधि| y)पीबी= ∬Θमैंटी( yप्रतिनिधि, Θ ) ≥ टी( y| θ)p ( yप्रतिनिधि| θ)पी(θ | y |) dyप्रतिनिधिघθ ,
जहां संकेतक कार्य करता । व्यवहार में हालांकि हम आमतौर पर सिमुलेशन का उपयोग करते हुए पीछे की भविष्य कहनेवाला वितरण की गणना करते हैं।
मैं
यदि हम पहले से ही कहते हैं, , के पीछे वितरण से सिमुलेशन , तो हम केवल प्रत्येक सिम्युलेटेड लिए भविष्य कहनेवाला वितरण से एक आकर्षित कर सकते हैं ; हम अब संयुक्त पिछला वितरण, से ड्रॉ । पश्चगामी भविष्यवाणिय जाँच वास्तविक परीक्षण मात्रा और भविष्य कहनेवाला परीक्षण मात्रा । अनुमानित पी-मूल्य इन सिमुलेशन का सिर्फ अनुपात है जिसके लिए परीक्षण मात्रा बराबर है या इसके वास्तविक मूल्य से अधिक है; वह है, जिसके लिएθ y प्रतिनिधि θ एल पी ( y प्रतिनिधि , θ | y ) टी ( y , θ एल ) टी ( y प्रतिनिधि एल , θ एल ) एल टी ( y प्रतिनिधि एल , θ एल ) ≥ टी ( y , θ एल ) एल = 1 , । । । , लएलθyप्रतिनिधिθएलपी( yप्रतिनिधि, θ | y)टी( y, θएल)टी(yप्रतिनिधिएल, θएल)एल
टी( yप्रतिनिधि एल, θएल) ≥ टी( y, θएल)
के लिए ।
एल = 1 , । । । , ल
शास्त्रीय दृष्टिकोण के विपरीत, बायेसियन मॉडल की जाँच के लिए "उपद्रव मापदंडों" को संभालने के लिए विशेष तरीकों की आवश्यकता नहीं होती है। पीछे के सिमुलेशन का उपयोग करके, हम मॉडल में सभी मापदंडों पर औसतन अनुमान लगाते हैं।
एक अतिरिक्त स्रोत, एंड्रयू जेलमैन का पीपीपी के यहाँ बहुत अच्छा पेपर है:
http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf