एलडीए विषय मॉडल एल्गोरिथ्म में, मैंने इस धारणा को देखा। लेकिन मुझे नहीं पता कि डिर्चिलेट वितरण को क्यों चुना? मुझे नहीं पता कि क्या हम एक जोड़ी के रूप में बहुसंख्या पर समान वितरण का उपयोग कर सकते हैं?
एलडीए विषय मॉडल एल्गोरिथ्म में, मैंने इस धारणा को देखा। लेकिन मुझे नहीं पता कि डिर्चिलेट वितरण को क्यों चुना? मुझे नहीं पता कि क्या हम एक जोड़ी के रूप में बहुसंख्या पर समान वितरण का उपयोग कर सकते हैं?
जवाबों:
Dirichlet वितरण एक है संयुग्म पहले बहुपद वितरण के लिए। इसका मतलब यह है कि यदि बहुराष्ट्रीय मापदंडों का पूर्व वितरण डिरिचलेट है, तो पश्च वितरण भी एक डिरिचलेट वितरण है (पूर्व के उन मापदंडों से अलग मापदंडों के साथ)। इसका लाभ यह है कि (ए) पश्च वितरण को गणना करना आसान है और (बी) यह कुछ अर्थों में संभव है कि डेटा एकत्र करने के बाद हमारी मान्यताएं कितनी बदल गई हैं।
यह निश्चित रूप से चर्चा की जा सकती है कि क्या ये किसी विशेष पूर्व को चुनने के अच्छे कारण हैं, क्योंकि ये मानदंड वास्तविक पूर्व मान्यताओं से असंबंधित हैं ... फिर भी, संयुग्म पुजारी लोकप्रिय हैं, क्योंकि वे अक्सर ऊपर बताए गए कारणों के लिए उपयोग करने के लिए काफी लचीले और सुविधाजनक होते हैं। ।
बहुराष्ट्रीय वितरण के विशेष मामले के लिए, चलो बहुराष्ट्रीय मापदंडों (यानी विभिन्न श्रेणियों के लिए संभावनाएं ) के वेक्टर हो सकते हैं। अगर ( पी 1 , ... , पी कश्मीर ) ~ Dirichlet ( α 1 , ... , α कश्मीर ) डेटा, तो, यह देखते हुए टिप्पणियों का संग्रह करने से पहले ( एक्स 1 , ... , एक्स कश्मीर ) विभिन्न श्रेणियों में, (
मोन्स टी के उत्तर के विरोधाभास के अलावा , मैं केवल यह इंगित करता हूं कि बायेसियन मॉडलिंग में "पूर्व" जैसी कोई चीज नहीं है! (क) गैर-पैरामीट्रिक आँकड़ों के साथ (क) कंप्यूटिंग, और (ग) कनेक्शन के कारण ड्यूरिचलेट वितरण एक सुविधाजनक विकल्प है (क्योंकि यह डिरिचलेट प्रक्रिया का विवेकाधीन संस्करण है)।
हालाँकि, (i) जो कुछ भी आप बहुराष्ट्रीय के वजन पर डालते हैं, वह व्यक्तिपरक बेयस स्तर पर एक वैध उत्तर है और (ii) पूर्व सूचना उपलब्ध होने के कारण कोई कारण नहीं है कि यह एक ड्यूरिचलेट वितरण में सरल हो जाता है। यह भी ध्यान दें कि डिरिचलेट वितरण के मिश्रण और दृढ़ संकल्प का उपयोग पुजारी के रूप में किया जा सकता है।