Dirichlet वितरण बहुविविध प्रायिकता वितरण का वर्णन करता है चर एक्स 1 , ... , एक्स कश्मीर , इस तरह के प्रत्येक कि एक्स मैं ∈ ( 0 , 1 ) और Σ एन मैं = 1 एक्स मैं = 1 , कि एक सदिश द्वारा parametrized है पॉजिटिव-वैल्यूड पैरामीटर । पैरामीटर नहीं हैk≥2X1,…,Xkxi∈(0,1)∑Ni=1xi=1α=(α1,…,αk)पूर्णांक होना चाहिए, उन्हें केवल सकारात्मक वास्तविक संख्या होने की आवश्यकता है। वे किसी भी तरह से "सामान्यीकृत" नहीं हैं, वे इस वितरण के पैरामीटर हैं।
डिरिचलेट वितरण बीटा आयामों के कई आयामों में एक सामान्यीकरण है , इसलिए आप बीटा वितरण के बारे में सीखकर शुरू कर सकते हैं। बीटा एक यादृच्छिक चर पैरामीटर्स और द्वारा परिचालित वितरण है । इसके बारे में अच्छा अंतर्ज्ञान आता है जैसा कि आपको याद है कि यह एक है संयुग्म पूर्व के लिए द्विपद बंटन और अगर हम एक बीटा मान पहले से parameterized और द्विपद बंटन की संभावना पैरामीटर के लिए , फिर का पिछला वितरण भी एक है द्वारा वितरित बीटा वितरणअल्फा बीटा अल्फा बीटा पी पी अल्फा ' = अल्फा + सफलताओं की संख्या बीटा ' = बीटा + विफलताओं की संख्या अल्फा बीटाX∈(0,1)αβαβppα′=α+number of successes और । तो आप सफलताओं और विफलताओं के pseudocounts (उन्हें पूर्णांक होने की आवश्यकता नहीं है) के रूप में और बारे में सोच सकते हैं (यह भी धागा जांचें )।β′=β+number of failuresαβ
Dirichlet वितरण के मामले में, यह एक संयुग्मी पहले है के लिए बहुपद वितरण । यदि द्विपद वितरण के मामले में हम इसे कलश से बदलने के साथ सफेद और काले रंग की गेंदों को खींचने के संदर्भ में सोच सकते हैं, तो बहुराष्ट्रीय वितरण के मामले में हम प्रतिस्थापन के साथ ड्राइंग कर रहे हैं बॉल्स रंगों में दिखाई दे रहे हैं, जहां प्रत्येक रंग गेंदों को प्रायिकता साथ खींचा जा सकता है । Dirichlet वितरण प्रायिकताओं और लिए एक संयुग्मित है हर रंग की गेंदों के छद्म रूप में सोचा जा सकता है , जिन्हें एक प्राथमिकता माना जाता है।k p 1 , … , p k p 1 , … , p k α 1 , … , α k α 1 , … , α k α 1 + n 1 , … , α k + n kNkp1,…,pkp1,…,pkα1,…,αk(लेकिन आपको इस तरह के तर्क के नुकसान के बारे में भी पढ़ना चाहिए )। Dirichlet-multinomial model में प्रत्येक श्रेणी में प्रेक्षित संख्याओं के साथ उन्हें योग करके प्राप्त होते हैं: बीटा-द्विपद मॉडल के मामले में इसी तरह के में ।α1,…,αkα1+n1,…,αk+nk
के उच्च मूल्य , का अधिक से अधिक "वजन" (याद है कि कुल में यह होना चाहिए और कुल "बड़े पैमाने पर" की अधिक से अधिक राशि में डाला गया है )। यदि सभी समान हैं, तो वितरण सममित है। यदि , तो इसे एंटी-वेट के रूप में माना जा सकता है जो को चरम सीमा की ओर धकेलता है , जबकि जब यह उच्च होता है, तो यह को कुछ केंद्रीय मूल्य (इस अर्थ में केंद्रीय) की ओर आकर्षित करता है कि सभी बिंदु इसके चारों ओर केंद्रित होते हैं, न कि चरम पर भावना है कि यह सममित रूप से केंद्रीय है)। यदि , तो अंक समान रूप से वितरित किए जाते हैं।एक्स मैं एक्स 1 + ⋯ + एक्स कश्मीर = 1 α मैं α मैं < 1 एक्स मैं एक्स मैं α 1 = ⋯ = α कश्मीर = 1αiXix1+⋯+xk=1αiαi<1xixiα1=⋯=αk=1
यह नीचे दिए गए भूखंडों पर देखा जा सकता है, जहाँ आप ट्राइएरिएट डिरिचलेट डिस्ट्रीब्यूशन देख सकते हैं (दुर्भाग्यवश हम केवल तीन आयामों तक उचित प्लॉट्स का उत्पादन कर सकते हैं) (a) (b) , (सी) , (डी) ।α १ = α २ = α ३ = १० α १ = १ , α २ = १० , α ३ = ५ α १ = α २ = α ३ = ०.२α1=α2=α3=1α1=α2=α3=10α1=1,α2=10,α3=5α1=α2=α3=0.2
डिरिचलेट वितरण को कभी-कभी "वितरण पर वितरण" कहा जाता है , क्योंकि इसे स्वयं संभावनाओं के वितरण के रूप में सोचा जा सकता है। ध्यान दें कि चूंकि प्रत्येक और , तो संभावना के पहले और दूसरे स्वयंसिद्ध के अनुरूप हैं । तो आप डिरिचलेट वितरण को श्रेणीबद्ध या बहुपद जैसे वितरण द्वारा वर्णित असतत घटनाओं के लिए संभावनाओं के वितरण के रूप में उपयोग कर सकते हैं । यह नहीं हैΣ k मैं = 1 एक्स मैं = 1 एक्स मैं कश्मीरxi∈(0,1)∑ki=1xi=1xiयह सच है कि यह किसी भी वितरण पर एक वितरण है, उदाहरण के लिए यह निरंतर यादृच्छिक चर की संभावनाओं से संबंधित नहीं है, या यहां तक कि कुछ असतत भी हैं (उदाहरण के लिए एक पॉइसन वितरित यादृच्छिक चर मानों को मानने की संभावनाओं का वर्णन करता है जो किसी भी प्राकृतिक संख्या हैं, इसलिए उपयोग करने के लिए उनकी संभावनाओं पर डिरिचलेट वितरण, आपको अनंत संख्या में यादृच्छिक चर ) की आवश्यकता होगी।k