दो बहुभिन्नरूपी गाऊसी के बीच केएल विचलन


46

मुझे केएल विचलन सूत्र को प्राप्त करने में दो बहुभिन्नरूपी सामान्य वितरण मानने में परेशानी हो रही है। मैं univariate मामला काफी आसानी से किया है। हालाँकि, मुझे गणित के आँकड़े लेते हुए काफी समय हो गया है, इसलिए मुझे इसे मल्टीवेरेट करने के मामले में कुछ परेशानी हो रही है। मुझे यकीन है कि मैं बस कुछ आसान याद कर रहा हूँ।

यहाँ मैं क्या है ...

मान लीजिए कि और दोनों और और variances और साथ सामान्य वितरण के pdfs हैं। कुल्ब-लीब्लर से दूरी है:pqμ1μ2Σ1Σ2qp

[log(p(x))log(q(x))] p(x) dx , जो दो बहुभिन्नरूपी मानदंडों के लिए है:

12[log|Σ2||Σ1|d+Tr(Σ21Σ1)+(μ2μ1)TΣ21(μ2μ1)]

इस प्रमाण के समान तर्क के बाद , मैं फंसने से पहले यहाँ के बारे में बताता हूँ:

=[d2log|Σ2||Σ1|+12((xμ2)TΣ21(xμ2)(xμ1)TΣ21(xμ1))]×p(x)dx

=E[d2log|Σ2||Σ1|+12((xμ2)TΣ21(xμ2)(xμ1)TΣ21(xμ1))]

मुझे लगता है कि मुझे ट्रेस ट्रिक को लागू करना है , लेकिन मुझे यकीन नहीं है कि उसके बाद क्या करना है। किसी भी उपयोगी संकेत मुझे सही रास्ते पर वापस लाने के लिए सराहना की जाएगी!


1
stanford.edu/~jduchi/projects/general_notes.pdf । अंतिम खंड भी व्युत्पत्ति देता है।
user3540823

जवाबों:


47

जहां से आप कुछ मामूली सुधारों के साथ शुरू करते हैं, हम लिख सकते हैं

KL=[12log|Σ2||Σ1|12(xμ1)TΣ11(xμ1)+12(xμ2)TΣ21(xμ2)]×p(x)dx=12log|Σ2||Σ1|12tr {E[(xμ1)(xμ1)T] Σ11}+12E[(xμ2)TΣ21(xμ2)]=12log|Σ2||Σ1|12tr {Id}+12(μ1μ2)TΣ21(μ1μ2)+12tr{Σ21Σ1}=12[log|Σ2||Σ1|d+tr{Σ21Σ1}+(μ2μ1)TΣ21(μ2μ1)].

ध्यान दें कि मैंने मैट्रिक्स कुकबुक की धारा 8.2 से कुछ गुणों का उपयोग किया है ।


मैं देख रहा हूं कि आपने मूल रूप से डी को निकाल लिया था। पहले कुछ चरणों में गौसियन का लॉग लेने के बाद क्या आपके पास एक डी शब्द नहीं होगा?
dmartin

स्केलिंग फैक्टर , का बहुभिन्नरूपी सामान्य घनत्व पर विचार करें। लॉग-डिफरेंस की गणना करते समय, शब्द चला जाता है। निर्धारकों के लिए कोई शब्द नहीं है - बस, एक , जो बाहर फैक्टरेड है। (2π)d/2|Σk|1/2k=1,2(2π)d/2d1/2
ramhiser

बिल्कुल भी परेशानी नहीं है। मैं खुशी से मदद कर सकता है।
रामसिंह

नमस्ते, आप अंतिम चरण के साथ कैसे आए? आपने में कैसे ? μ1μ2μ2μ1
एसिडघोस्ट

1
@acidghost या तो एक काम करता है क्योंकि हम दोनों पक्षों से एक नकारात्मक कारक निकाल सकते हैं। दो नकारात्मक लोगों को गुणा करने से एक सकारात्मक पैदावार होती है।
ramhiser
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.