केएल विचलन गैर-नकारात्मक क्यों है?


18

केएल विचलन गैर-नकारात्मक क्यों है?

सूचना सिद्धांत के दृष्टिकोण से, मुझे ऐसी सहज समझ है:

कहते हैं कि और दो असेम्बल हैं जो द्वारा लेबल किए गए तत्वों के एक ही सेट से बने होते हैं । और क्रमशः और से अधिक भिन्न संभाव्यता वितरण हैं।बीएक्सपी(एक्स)क्ष(एक्स)बी

सूचना सिद्धांत के नजरिए से, बिट्स की कम से कम राशि है जो कलाकारों की टुकड़ी लिए एक तत्व रिकॉर्ड करने के लिए आवश्यक है । ताकि की प्रत्याशा को कम से कम कितने बिट्स के रूप में व्याख्या की जा सके, जो हमें में औसतन एक तत्व को रिकॉर्ड करने के लिए आवश्यक हैं ।लॉग2(पी(एक्स))एक्स

Σएक्सnरोंएल-पी(एक्स)ln(पी(एक्स))

चूंकि यह सूत्र उन बिट्स पर एक निचली सीमा रखता है जिनकी हमें औसत पर जरूरत होती है, ताकि एक अलग पहनावा जो एक अलग संभाव्यता वितरण बारे में लाता है , यह प्रत्येक तत्व लिए जो बाउंड देता है वह निश्चित रूप से बिट नहीं होगा द्वारा दिया गया , जिसका अर्थ है कि प्रत्याशा में, यह औसत लंबाई निश्चित रूप से पूर्व की तुलना में अधिक होगी, जो to सुराग की ओर ले जाती है मैं p (x) और q के बाद से यहाँ नहीं डाल रहा हूँ (x) अलग हैं।क्यू ( एक्स ) एक्स पी ( एक्स ) Σ एक्स एन एस एम बी एल - पी ( एक्स ) ln ( क्ष ( एक्स ) ) Σ एक्स एन एस एम बी एल पी ( एक्स ) ln ( पी ( एक्स ) )बीक्ष(एक्स)एक्सपी(एक्स)

Σएक्सnरोंएल-पी(एक्स)ln(क्ष(एक्स))

Σएक्सnरोंएलपी(एक्स)ln(पी(एक्स))ln(क्ष(एक्स))>0
पी(एक्स)क्ष(एक्स)

यह मेरी सहज समझ है, क्या केएल विचलन साबित करने का एक शुद्ध गणितीय तरीका गैर-नकारात्मक है? समस्या के रूप में कहा जा सकता है:

दिए गए और दोनों वास्तविक रेखा पर सकारात्मक हैं, और , । सिद्ध गैर-नकारात्मक है।पी(एक्स)क्ष(एक्स)-+पी(एक्स)एक्स=1-+क्ष(एक्स)एक्स=1

-+पी(एक्स)lnपी(एक्स)क्ष(एक्स)

यह कैसे साबित किया जा सकता है? या अतिरिक्त शर्तों के बिना यह साबित किया जा सकता है?


1
यदि आप फानो की असमानता के प्रमाण को समझते हैं तो सापेक्ष एन्ट्रापी की गैर-सक्रियता को प्राप्त करना आसान है ।
लर्नर जांग

जवाबों:


30

प्रमाण 1:

पहले ध्यान दें कि सभी लिए ।ln-1>0

अब हम उस दिखाएंगे जिसका अर्थ है कि-डीएल(पी||क्ष)0डीएल(पी||क्ष)0

-डी(पी||क्ष)=-Σएक्सपी(एक्स)lnपी(एक्स)क्ष(एक्स)=Σएक्सपी(एक्स)lnक्ष(एक्स)पी(एक्स)(ए)Σएक्सपी(एक्स)(क्ष(एक्स)पी(एक्स)-1)=Σएक्सक्ष(एक्स)-Σएक्सपी(एक्स)=1-1=0

असमानता (ए) के लिए हमने शुरुआत में समझाया गया असमानता का उपयोग किया ।ln

वैकल्पिक रूप से आप गिब्स की असमानता के साथ शुरू कर सकते हैं जो बताता है:

-Σएक्सपी(एक्स)लॉग2पी(एक्स)-Σएक्सपी(एक्स)लॉग2क्ष(एक्स)

फिर यदि हम बाईं ओर दायीं ओर ले आते हैं:

Σएक्सपी(एक्स)लॉग2पी(एक्स)-Σएक्सपी(एक्स)लॉग2क्ष(एक्स)0Σएक्सपी(एक्स)लॉग2पी(एक्स)क्ष(एक्स)0

इसका कारण मैं इसे एक अलग प्रमाण के रूप में शामिल नहीं कर रहा हूं क्योंकि अगर आपको मुझसे गिब्स की असमानता साबित करने के लिए कहना है, तो मुझे केएल विचलन के गैर-नकारात्मकता से शुरू करना होगा और ऊपर से एक ही प्रमाण देना होगा।


प्रमाण 2: हम लॉग सम असमानता का उपयोग करते हैं :

Σमैं=1nमैंलॉग2मैंमैं(Σमैं=1nमैं)लॉग2Σमैं=1nमैंΣमैं=1nमैं

फिर हम दिखा सकते हैं कि : डीएल(पी||क्ष)0

डी(पी||क्ष)=Σएक्सपी(एक्स)लॉग2पी(एक्स)क्ष(एक्स)(ख)(Σएक्सपी(एक्स))लॉग2Σएक्सपी(एक्स)Σएक्सक्ष(एक्स)=1लॉग211=0

जहां (b) पर हमने लॉग सम विषमता का उपयोग किया है।


प्रमाण 3:

(थॉमस एम। कवर और जॉय ए। थॉमस की पुस्तक "एलीमेंट ऑफ इंफॉर्मेशन थ्योरी" से लिया गया)

-डी(पी||क्ष)=-Σएक्सपी(एक्स)लॉग2पी(एक्स)क्ष(एक्स)=Σएक्सपी(एक्स)लॉग2क्ष(एक्स)पी(एक्स)(सी)लॉग2Σएक्सपी(एक्स)क्ष(एक्स)पी(एक्स)=लॉग21=0

जहां (ग) हमने जेन्सेन की असमानता का इस्तेमाल किया है और यह तथ्य कि एक अवतल कार्य है।लॉग

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.