Kullback-Leibler (KL) विचलन का अधिकतम मूल्य क्या है


15

मैं अपने अजगर कोड में केएल विचलन का उपयोग करने जा रहा हूं और मुझे यह ट्यूटोरियल मिला है

उस ट्यूटोरियल पर, केएल विचलन को लागू करना काफी सरल है।

kl = (model * np.log(model/actual)).sum()

जैसा कि मैं समझता हूं, की संभावना वितरण modelऔर actualहोना चाहिए <= 1।

मेरा सवाल है, k की अधिकतम सीमा / अधिकतम संभव मूल्य क्या है? मुझे अपने कोड में अधिकतम सीमा के लिए kl दूरी का अधिकतम संभव मान ज्ञात करना होगा।


जवाबों:


19

या यहां तक ​​कि एक ही समर्थन के साथ, जब एक वितरण में दूसरे की तुलना में बहुत अधिक मोटी पूंछ होती है। लो जब p ( x ) = कॉची घनत्व x 1

KL(P||Q)=p(x)log(p(x)q(x))dx
तो कश्मीरएल(पी||क्यू)=1
p(x)=1π11+x2Cauchy densityq(x)=12πexp{x2/2}Normal density
और 1
KL(P||Q)=1π11+x2logp(x)dx+1π11+x2[log(2π)/2+x2/2]dx
वहाँ अन्य दूरी है कि के रूप में ऐसी घिरा रहना मौजूद
1π11+x2x2/2dx=+
  • दूरी, कुल भिन्नता दूरी के बराबर है,L¹
  • वासेरस्टीन दूरी
  • नरक की दूरी

1
बहुत अच्छी टिप्पणी @ शीआन
कार्लोस कैंपोस

धन्यवाद @ शीआन इसका मतलब है, यहां तक ​​कि दोनों वितरणों के लिए सभी डिब्बे का योग = 1 है, kl विचलन का कोई अधिकतम बंधन नहीं है? क्या आपके पास दो प्रायिकता वितरण के लिए कोई अन्य विकल्प दूरी समारोह है जिसने अधिकतम बाउंड / स्टैटिक बाउंड को परिभाषित किया है?
user46543

क्या P इस मामले में Q के संबंध में पूरी तरह से निरंतर है?
सांगवॉन्ग यून

कौनसे मामलेमें"? केएल को ऐसे वितरणों के रूप में परिभाषित नहीं किया गया है जो एक दूसरे के अनुसार बिल्कुल निरंतर नहीं हैं।
शीआन

13

ऐसे वितरण जिनके पास समान समर्थन नहीं है, केएल विचलन के लिए बाध्य नहीं है। परिभाषा देखें:

KL(P||Q)=p(x)ln(p(x)q(x))dx

यदि P और Q का समान समर्थन नहीं है, तो कुछ बिंदु जहाँ और , केएल अनंत तक जाता है। यह असतत वितरण के लिए भी लागू होता है, जो कि आपका मामला है। पी ( एक्स ' ) 0 क्यू ( एक्स ' ) = 0xp(x)0q(x)=0

संपादित करें: शायद संभाव्यता वितरण के बीच विचलन को मापने के लिए एक बेहतर विकल्प तथाकथित वासेरस्टीन दूरी होगी जो कि मीट्रिक है और केएल विचलन से बेहतर गुण हैं। यह डीप-लर्निंग में अपने अनुप्रयोगों के कारण काफी लोकप्रिय हो गया है (WGAN नेटवर्क देखें)


धन्यवाद @ carlos-campos मेरे वितरण में वास्तविक और मॉडल दोनों की एक ही स्थिति है जो सभी डिब्बे का योग है = 1. इसका मतलब है कि मेरी Kl विचलन अभी भी अधिकतम बाध्य नहीं है? मैं wassertein दूरी
user46543

क्या वासेरस्टीन या अर्थ मूवर की दूरी एक स्पष्ट अधिकतम सीमा है? क्योंकि मुझे इसकी आवश्यकता है।
user46543

@ user46543 वासेरस्टीन की दूरी जितनी अधिक हो सकती है
मार्क एल। स्टोन

Hi @ MarkL.Stone इसलिए दो प्रायिकता वितरणों के बीच की दूरी की गणना के लिए कोई दूरी कार्य नहीं है जिसमें स्थैतिक अधिकतम सीमा है? उदाहरण के लिए, जबकि दो प्रायिकता वितरण में 1 का योग है और दूरी की अधिकतम सीमा 1. 1. क्या मैं सही हूं?
user46543

4

कार्लोस और शीआन द्वारा उत्कृष्ट उत्तरों को जोड़ने के लिए , यह भी ध्यान रखना दिलचस्प है कि केएल विचलन के लिए परिमित होने के लिए एक पर्याप्त शर्त दोनों यादृच्छिक चर के लिए समान कॉम्पैक्ट समर्थन है, और संदर्भ घनत्व के लिए बाध्य होना चाहिए । यह परिणाम केएल विचलन (अधिकतम प्रमेय और नीचे प्रमाण देखें) के लिए एक अंतर्निहित बाध्यता भी स्थापित करता है।


प्रमेय: घनत्व तो और एक ही कॉम्पैक्ट समर्थन और घनत्व कि समर्थन घिरा हुआ है तो (यानी, ऊपरी बाध्य एक परिमित है) ।क्यू एक्स पी कश्मीर एल ( पी | | क्यू ) < pqXpKL(P||Q)<

प्रमाण: चूँकि पास कॉम्पैक्ट support इसका मतलब है कि कुछ सकारात्मक अनंत मूल्य है:एक्सqX

q_infxXq(x)>0.

इसी तरह, चूंकि का कॉम्पैक्ट सपोर्ट इसका मतलब है कि कुछ सकारात्मक वर्चस्व मूल्य है:pX

p¯supxXp(x)>0.

इसके अलावा, चूंकि ये दोनों एक ही समर्थन पर घनत्व हैं, और उत्तरार्द्ध बाध्य है, हमारे पास । इस का मतलब है कि:0<q_p¯<

supxXln(p(x)q(x))ln(p¯)ln(q_).

अब, को बाद की ऊपरी सीमा दें, हमारे पास स्पष्ट रूप से है। उस:L_ln(p¯)ln(q_)0L_<

KL(P||Q)=Xln(p(x)q(x))p(x)dxsupxXln(p(x)q(x))Xp(x)dx(ln(p¯)ln(q_))Xp(x)dx=L_<.

यह आवश्यक ऊपरी सीमा को स्थापित करता है, जो प्रमेय को साबित करता है।


परिणाम सही है लेकिन भारी है: एक बीटा घनत्व कॉम्पैक्ट समर्थन का आनंद नहीं लेता है जब । B(α,β)max(α,β)>1
शीआन

यह सच है: यह केवल एक पर्याप्त स्थिति है। कमजोर पर्याप्त परिस्थितियों का स्वागत है!
बेन - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.