सूचना सिद्धांत की पाठ्यपुस्तक तत्व हमें एक उदाहरण देता है:
उदाहरण के लिए, यदि हमें यादृच्छिक चर का सही वितरण p पता था, तो हम औसत विवरण लंबाई H (p) के साथ एक कोड का निर्माण कर सकते हैं। यदि, इसके बजाय, हमने एक वितरण q के लिए कोड का उपयोग किया है, तो हमें यादृच्छिक चर का वर्णन करने के लिए औसत पर H (p) + D (p || q) बिट्स की आवश्यकता होगी।
उपरोक्त कथन को स्पष्ट करने के लिए, हम कह सकते हैं कि यदि हम सूचना वितरण को बदलते हैं (q से p तक) तो हमें नए वितरण को कोड करने के लिए औसतन D (p || q) की आवश्यकता है।
एक उदाहरण
मुझे इसे प्राकृतिक भाषा प्रसंस्करण में इसके एक अनुप्रयोग का उपयोग करके स्पष्ट करें।
गौर कीजिए कि बी लेबल वाले लोगों का एक बड़ा समूह मध्यस्थ है और उनमें से प्रत्येक को एक संज्ञा चुनने के लिए एक कार्य सौंपा गया है turkey
, animal
और book
इसे सी। को प्रेषित करना है। एक पुरुष नाम ए है जो उनमें से प्रत्येक को एक ईमेल भेजने के लिए भेज सकता है। उन्हें कुछ संकेत दिए। यदि समूह में किसी को भी ईमेल प्राप्त नहीं हुआ तो वे अपनी भौंहें बढ़ा सकते हैं और कुछ समय के लिए संकोच कर सकते हैं कि सी को क्या चाहिए। और चुने जाने वाले प्रत्येक विकल्प की संभावना 1/3 है। टोली समान वितरण (यदि नहीं, तो यह उनकी अपनी पसंद से संबंधित हो सकता है और हम ऐसे मामलों की उपेक्षा करते हैं)।
लेकिन अगर उन्हें एक क्रिया दी जाती है, जैसे baste
, उनमें से 3/4 चुन सकते हैं turkey
और 3/16 चुन सकते हैं animal
और 1/16 चुन सकते हैं book
। फिर क्रियाओं को जानने के बाद औसतन प्रत्येक मध्यस्थ में बिट्स की कितनी जानकारी प्राप्त होती है? यह है:
D(p(nouns|baste)||p(nouns))=∑x∈{turkey,animal,book}p(x|baste)log2p(x|baste)p(x)=34∗log23413+316∗log231613+116∗log211613=0.5709 bits
लेकिन अगर क्रिया दी गई है तो क्या होगा read
? हम कल्पना कर सकते हैं कि सभी book
बिना किसी हिचकिचाहट के साथ चयन करेंगे , फिर क्रिया से प्रत्येक मध्यस्थ के लिए औसत जानकारी प्राप्त होती read
है:
D(p(nouns|read)||p(nouns))=∑x∈{book}p(x|read)log2p(x|read)p(x)=1∗log2113=1.5849 bits
हम देख सकते हैं कि क्रिया read
मध्यस्थों को अधिक जानकारी दे सकती है। और यह कि रिश्तेदार एन्ट्रापी क्या माप सकते हैं।
चलिए जारी रखते हैं हमारी कहानी। यदि C को संदेह है कि संज्ञा गलत हो सकती है क्योंकि A ने उसे बताया कि हो सकता है कि उसने मध्यस्थों को गलत क्रिया भेजकर गलती की हो। फिर बिट्स में कितनी जानकारी इतनी बुरी खबर सी दे सकती है?
1) यदि A द्वारा दी गई क्रिया baste
:
D(p(nouns)||p(nouns|baste))=∑x∈{turkey,animal,book}p(x)log2p(x)p(x|baste)=13∗log21334+13∗log213316+13∗log213116=0.69172 bits
२) लेकिन अगर क्रिया होती तो क्या होता read
?
D(p(nouns)||p(nouns|baste))=∑x∈{book,∗,∗}p(x)log2p(x)p(x|baste)=13∗log2131+13∗log2130+13∗log2130=∞ bits
चूँकि C कभी नहीं जानता कि अन्य दो संज्ञाएं क्या होंगी और शब्दावली में कोई भी शब्द संभव होगा।
हम देख सकते हैं कि केएल विचलन असममित है।
मुझे आशा है कि मैं सही हूं, और यदि कृपया टिप्पणी न करें और मुझे सही करने में मदद करें। अग्रिम में धन्यवाद।