दो अविभाज्य गाऊसी के बीच केएल विचलन


79

मुझे दो गाऊसी लोगों के बीच केएल-विचलन का निर्धारण करने की आवश्यकता है। मैं अपने परिणामों की तुलना इनसे कर रहा हूं, लेकिन मैं उनके परिणाम को पुन: पेश नहीं कर सकता। मेरा परिणाम स्पष्ट रूप से गलत है, क्योंकि KL, KL (p, p) के लिए 0 नहीं है।

मुझे आश्चर्य है कि मैं कहां गलती कर रहा हूं और पूछ रहा हूं कि क्या कोई इसे हाजिर कर सकता है।

चलो और । बिशप के PRML से मुझे पता हैp(x)=N(μ1,σ1)q(x)=N(μ2,σ2)

KL(p,q)=p(x)logq(x)dx+p(x)logp(x)dx

जहां एकीकरण सभी वास्तविक रेखाओं पर किया जाता है, और यह कि

p(x)logp(x)dx=12(1+log2πσ12),

इसलिए मैं अपने आप को तक सीमित हूं, जिसे मैं बाहर लिख सकता हूंp(x)logq(x)dx

p(x)log1(2πσ22)(1/2)e(xμ2)22σ22dx,

जिसे अलग किया जा सकता है

12log(2πσ22)p(x)loge(xμ2)22σ22dx.

मुझे जो भी मिला ले रहा हूं

12log(2πσ22)p(x)((xμ2)22σ22)dx,

जहाँ मैं रकम अलग करता हूँ और प्राप्त करता हूँ।σ22

12log(2πσ22)+p(x)x2dxp(x)2xμ2dx+p(x)μ22dx2σ22

Let को तहत उम्मीद संचालक को सूचित करते हैं , मैं इसे फिर से लिख सकता हूंp

12log(2πσ22)+x22xμ2+μ222σ22.

हम जानते हैं कि । इस प्रकारvar(x)=x2x2

x2=σ12+μ12

और इसीलिए

12log(2πσ2)+σ12+μ122μ1μ2+μ222σ22,

जो मैं के रूप में डाल सकते हैं

12log(2πσ22)+σ12+(μ1μ2)22σ22.

सब कुछ एक साथ रखकर, मुझे मिलता है

KL(p,q)=p(x)logq(x)dx+p(x)logp(x)dx=12log(2πσ22)+σ12+(μ1μ2)22σ2212(1+log2πσ12)=logσ2σ1+σ12+(μ1μ2)22σ22.
जो गलत है क्योंकि यह दो समान गौसियों के लिए के बराबर है ।1

किसी को भी मेरी त्रुटि हाजिर कर सकते हैं?

अपडेट करें

चीजों को साफ़ करने के लिए mpiktas का धन्यवाद। सही जवाब है:

KL(p,q)=logσ2σ1+σ12+(μ1μ2)22σ2212


पहली बार में गलत उत्तर पोस्ट करने के लिए क्षमा करें। मैंने सिर्फ देखा और तुरंत सोचा कि इंटीग्रल ज़ीरो है। बिंदु यह है कि यह पूरी तरह से मेरे दिमाग से चूक गया था :)xμ1
mpiktas

बहु चर मामले के बारे में क्या?

मैंने अभी एक शोध पत्र में देखा है कि kld $ KL (p, q) = seen * ((μ₂-μ²) ₂ + σ₁² + σ₂²) * (((1 / σ₁²) + (1 / σ₂²) - 2 होना चाहिए।
आकाश

1
मुझे लगता है कि आपके प्रश्न में एक टाइपो है, क्योंकि मैं इसे मान्य नहीं कर सकता और यह भी लगता है कि आपने अपने प्रश्न में बाद में सही संस्करण का उपयोग किया: मुझे लगता है कि यह होना चाहिए (माइनस पर ध्यान दें): मैंने आपके प्रश्न को संपादित करने की कोशिश की और इसके लिए प्रतिबंध लगा दिया, इसलिए शायद यह स्वयं करें।
p(x)logp(x)dx=12(1+log2πσ12)
p(x)logp(x)dx=12(1+log2πσ12)
वाई-स्प्रिन

इसका उत्तर मेरे 1996 के पेपर में आंतरिक नुकसान पर भी है ।
शीआन

जवाबों:


59

ठीक है, मेरा बुरा। त्रुटि अंतिम समीकरण में है:

KL(p,q)=p(x)logq(x)dx+p(x)logp(x)dx=12log(2πσ22)+σ12+(μ1μ2)22σ2212(1+log2πσ12)=logσ2σ1+σ12+(μ1μ2)22σ2212

लापता पर ध्यान दें । अंतिम पंक्ति शून्य हो जाती है जब और ।12μ1=μ2σ1=σ2


@mpiktas मेरा मतलब था कि प्रश्न वास्तव में है - बेयरज एक अच्छी तरह से प्रकाशित शोधकर्ता है और मैं एक अंडरग्रेड हूं। यह देखकर अच्छा लगा कि स्मार्ट लोग भी कभी-कभी इंटरनेट पर पूछने के लिए पीछे हट जाते हैं :)
एन। मैक।

3
is p याμ1σ1μ2σ2
कोंग

@Kong p , जैसा कि प्रश्न में दिया गया है। N(u1,σ1)
zplizzi

31

मुझे आपकी गणना पर एक नज़र नहीं थी, लेकिन यहाँ मेरा बहुत विवरण है। मान लीजिए कि एक सामान्य रैंडम वैरिएबल का घनत्व है, जिसका अर्थ है और विचरण , और यह कि सामान्य वैरिएबल का घनत्व है जिसका माध्य और विचरण । कुल्बैक-लीब्लर से दूरी है:pμ1σ12qμ2σ22qp

[log(p(x))log(q(x))]p(x)dx

=[12log(2π)log(σ1)12(xμ1σ1)2+12log(2π)+log(σ2)+12(xμ2σ2)2] ×12πσ1exp[12(xμ1σ1)2]dx

={log(σ2σ1)+12[(xμ2σ2)2(xμ1σ1)2]} ×12πσ1exp[12(xμ1σ1)2]dx

=E1{log(σ2σ1)+12[(xμ2σ2)2(xμ1σ1)2]}

=log(σ2σ1)+12σ22E1{(Xμ2)2}12σ12E1{(Xμ1)2}

=log(σ2σ1)+12σ22E1{(Xμ2)2}12

(अब ध्यान दें कि )(Xμ2)2=(Xμ1+μ1μ2)2=(Xμ1)2+2(Xμ1)(μ1μ2)+(μ1μ2)2

=log(σ2σ1)+12σ22[E1{(Xμ1)2}+2(μ1μ2)E1{Xμ1}+(μ1μ2)2]12

=log(σ2σ1)+σ12+(μ1μ2)22σ2212

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.