जवाबों:
एक पैरामीटर के लिए पूर्व में लगभग हमेशा कुछ विशिष्ट कार्यात्मक रूप होंगे (घनत्व के संदर्भ में लिखे गए, आमतौर पर)। मान लें कि हम वितरण के एक विशेष परिवार के लिए खुद को सीमित करते हैं, उस स्थिति में उस परिवार के मापदंडों को चुनने के लिए हमारे पूर्व को कम करता है।
उदाहरण के लिए, एक सामान्य मॉडल पर विचार । सरलता के लिए, आइए ज्ञात के रूप में icity 2 भी लें । मॉडल का यह हिस्सा - डेटा के लिए मॉडल - संभावना फ़ंक्शन को निर्धारित करता है।
हमारे बायेसियन मॉडल को पूरा करने के लिए, यहां हमें लिए पूर्व की आवश्यकता है ।
जैसा कि ऊपर उल्लेख किया गया है, आमतौर पर हम लिए हमारे पूर्व के लिए कुछ वितरण परिवार निर्दिष्ट कर सकते हैं और फिर हमें केवल उस वितरण के मापदंडों को चुनना होगा (उदाहरण के लिए, अक्सर पूर्व जानकारी काफी अस्पष्ट हो सकती है - जैसे कि जहां हम ध्यान केंद्रित करने की संभावना चाहते हैं - बहुत विशिष्ट कार्यात्मक रूप के बजाय, और हमारे पास पर्याप्त स्वतंत्रता हो सकती है कि हम क्या चाहते हैं कि हम मापदंडों का चयन करके - एक पूर्व माध्य और भिन्नता से मेल खाने के लिए कहें)।
यदि यह पता चला है कि लिए पीछे वाला एक ही परिवार से है, तो उस पूर्व को "संयुग्म" कहा जाता है।
(क्या यह संयुग्म होने की संभावना को जोड़ती है जिस तरह से यह संभावना के साथ जोड़ती है)
तो इस मामले में, के लिए एक गाऊसी पहले लेते हैं (कहना μ ~ एन ( θ , τ 2 ) )। यदि हम ऐसा करते हैं, तो हम देखते हैं कि μ के लिए पश्चगामी भी गॉसियन है। नतीजतन, गॉसियन पूर्व हमारे मॉडल के लिए एक संयुग्म पूर्व था।
यह सब वहाँ वास्तव में है - अगर पीछे एक ही परिवार से पूर्व के रूप में है, यह एक संयुग्म पूर्व है।
सरल मामलों में आप संभावना के निरीक्षण से पहले एक संयुग्म की पहचान कर सकते हैं। उदाहरण के लिए, एक द्विपद संभावना पर विचार करें; स्थिरांक को छोड़ने पर, यह में एक बीटा घनत्व जैसा दिखता है ; और पी और ( 1 - पी ) की शक्तियों के संयोजन के कारण, यह एक बीटा से पहले गुणा करेगा पी और ( 1 - पी ) की शक्तियों का एक उत्पाद देने के लिए ... इसलिए हम तुरंत संभावना से देख सकते हैं कि बीटा द्विपद संभावना में पी के लिए पहले एक संयुग्म होगा ।
गाऊसी मामले में यह देखना आसान है कि यह लॉग-डेन्सिटी और लॉग-लाइबिलिटी पर विचार करके होगा; लॉग-लाइकैलिटी में द्विघात होगा और दो क्वाड्रैटिक्स का योग द्विघात है, इसलिए एक द्विघात लॉग-पूर्व + द्विघात लॉग-समानता एक द्विघात पोस्टीरियर देता है (उच्चतम क्रम अवधि के प्रत्येक गुणांक निश्चित रूप से नकारात्मक होगा)।
यदि आपका मॉडल, के अंतर्गत आता है, तो घातीय परिवार , कि है, अगर वितरण का घनत्व फार्म की है
पुरोहितों के परिवार के लिए वर्चस्वकारी उपाय का चुनाव निर्धारक है। उदाहरण के लिए यदि कोई व्यक्ति ग्लेन_ब के उत्तर में पर सामान्य मतलब की संभावना का सामना करता है, तो लेब्सगर्ल उपाय करता है क्योंकि हावी होने के कारण सामान्य पुजारी संयुग्मित हो जाते हैं। बजाय एक चुनता है हावी उपाय के रूप में, संयुग्म महंतों घनत्व के साथ वितरण के परिवार के भीतर हैं
इस घातीय पारिवारिक सेटिंग के बाहर, एक निश्चित समर्थन के साथ वितरण का कोई गैर-तुच्छ परिवार नहीं है जो संयुग्मक पुजारियों के लिए अनुमति देता है। यह डार्मोइस-पिटमैन-कोपमैन लेम्मा का एक परिणाम है ।
I like using the notion of a "kernel" of a distribution. This is where you only leave in the parts that depend on the parameter. A few simple examples.
Beta kernel
When we look at the likelihood function, we can do the same thing, and express it in "kernel form". For example with iid data
For some constant and some function . If we can recognise this function as a kernel, then we can create a conjugate prior for that likelihood.
If we take the normal likelihood with unit variance, the above looks like
where and and
This likelihood function has the same kernel as the normal distribution for , so a conjugate prior for this likelihood is also the normal distribution.
In some sense a conjugate prior acts similarly to adding "pseudo data" to the data observed, and then estimating the parameters.
For a given distribution family of the likelihood (e.g. Bernoulli),
if the prior is of the same distribution family as the posterior (e.g. Beta),
then and are conjugate distribution families and the prior is called a conjugate prior for the likelihood function.
Note: