ड्यूरिचलेट वितरण बहुराष्ट्रीय वितरण के लिए पूर्व क्यों है?


36

एलडीए विषय मॉडल एल्गोरिथ्म में, मैंने इस धारणा को देखा। लेकिन मुझे नहीं पता कि डिर्चिलेट वितरण को क्यों चुना? मुझे नहीं पता कि क्या हम एक जोड़ी के रूप में बहुसंख्या पर समान वितरण का उपयोग कर सकते हैं?


5
समान वितरण डिरिचलेट वितरण का एक विशेष मामला है।
स्टम्पी जो पीट

जवाबों:


60

Dirichlet वितरण एक है संयुग्म पहले बहुपद वितरण के लिए। इसका मतलब यह है कि यदि बहुराष्ट्रीय मापदंडों का पूर्व वितरण डिरिचलेट है, तो पश्च वितरण भी एक डिरिचलेट वितरण है (पूर्व के उन मापदंडों से अलग मापदंडों के साथ)। इसका लाभ यह है कि (ए) पश्च वितरण को गणना करना आसान है और (बी) यह कुछ अर्थों में संभव है कि डेटा एकत्र करने के बाद हमारी मान्यताएं कितनी बदल गई हैं।

यह निश्चित रूप से चर्चा की जा सकती है कि क्या ये किसी विशेष पूर्व को चुनने के अच्छे कारण हैं, क्योंकि ये मानदंड वास्तविक पूर्व मान्यताओं से असंबंधित हैं ... फिर भी, संयुग्म पुजारी लोकप्रिय हैं, क्योंकि वे अक्सर ऊपर बताए गए कारणों के लिए उपयोग करने के लिए काफी लचीले और सुविधाजनक होते हैं। ।

बहुराष्ट्रीय वितरण के विशेष मामले के लिए, चलो बहुराष्ट्रीय मापदंडों (यानी विभिन्न श्रेणियों के लिए संभावनाएं ) के वेक्टर हो सकते हैं। अगर ( पी 1 , ... , पी कश्मीर ) ~ Dirichlet ( α 1 , ... , α कश्मीर ) डेटा, तो, यह देखते हुए टिप्पणियों का संग्रह करने से पहले ( एक्स 1 , ... , एक्स कश्मीर ) विभिन्न श्रेणियों में, ((पी1,...,पीकश्मीर)

(पी1,...,पीकश्मीर)~Dirichlet(α1,...,αकश्मीर)
(एक्स1,...,एक्सकश्मीर)
(पी1,...,पीकश्मीर)|(एक्स1,...,एक्सकश्मीर)~Dirichlet(α1+एक्स1,...,αकश्मीर+एक्सकश्मीर)

α1=α2==αकश्मीर=1α1==αकश्मीर=1/2


तो हम उन लाभों के लिए डिरिचलेट वितरण चुनते हैं।
कॉलिनबिनवांग

1
+1: आप स्पष्ट रूप से कहना चाह सकते हैं कि संभावना आवश्यक रूप से डिरिचलेट है, यही कारण है कि पीछे वितरण की गणना करना आसान है।
नील जी

18

मोन्स टी के उत्तर के विरोधाभास के अलावा , मैं केवल यह इंगित करता हूं कि बायेसियन मॉडलिंग में "पूर्व" जैसी कोई चीज नहीं है! (क) गैर-पैरामीट्रिक आँकड़ों के साथ (क) कंप्यूटिंग, और (ग) कनेक्शन के कारण ड्यूरिचलेट वितरण एक सुविधाजनक विकल्प है (क्योंकि यह डिरिचलेट प्रक्रिया का विवेकाधीन संस्करण है)।

हालाँकि, (i) जो कुछ भी आप बहुराष्ट्रीय के वजन पर डालते हैं, वह व्यक्तिपरक बेयस स्तर पर एक वैध उत्तर है और (ii) पूर्व सूचना उपलब्ध होने के कारण कोई कारण नहीं है कि यह एक ड्यूरिचलेट वितरण में सरल हो जाता है। यह भी ध्यान दें कि डिरिचलेट वितरण के मिश्रण और दृढ़ संकल्प का उपयोग पुजारी के रूप में किया जा सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.