गुणात्मक रूप से क्रॉस एंट्रॉपी क्या है


15

यह प्रश्न सूत्र के रूप में, क्रॉस एन्ट्रॉपी की मात्रात्मक परिभाषा देता है।

मैं एक और अधिक महत्वपूर्ण परिभाषा की तलाश में हूं, विकिपीडिया कहता है:

सूचना सिद्धांत में, दो प्रायिकता वितरण के बीच क्रॉस एन्ट्रापी संभावनाओं के एक समूह से किसी घटना की पहचान करने के लिए आवश्यक बिट्स की औसत संख्या को मापता है, यदि कोडिंग स्कीम का उपयोग "सही" वितरण पी के बजाय किसी दिए गए प्रायिकता वितरण q के आधार पर किया जाता है। ।

मैंने उस हिस्से पर जोर दिया है जो मुझे यह समझने में परेशानी दे रहा है। मैं एक अच्छी परिभाषा चाहूंगा जिसमें एन्ट्रॉपी की अलग (पहले से मौजूद) समझ की आवश्यकता न हो।


1
आप क्रॉस- मेन्ट्रोपी की एक परिभाषा के लिए पूछ रहे हैं, एक ही समय में, एन्ट्रापी को ही परिभाषित करेगा । और सहज रूप से ऐसा ... यदि आपको एंट्रोपी की अवधारणा को समझने में परेशानी हो रही है, तो पहले मूल अवधारणा और फिर उसके किसी एक विस्तार को समझना एक अच्छा विचार होगा।
एलेकोस पापाडोपोलोस

1
व्यक्तिगत रूप से मुझे एन्ट्रॉपी की एक बुनियादी समझ थी (हालांकि मैंने इसे लागू किए लगभग 12 महीने हो चुके हैं)। लेकिन एंट्रोपी की एक मात्रात्मक अभिव्यक्ति, एक छोटे पैराग्राफ में फिट होनी चाहिए, और क्रॉस एन्ट्रॉपी को केवल एक और लेना चाहिए। इसलिए मुझे लगता है कि एक अच्छा जवाब दोनों को शामिल कर सकता है, ताकि पाठक को इसे समझने के लिए कहीं और संदर्भित करने की आवश्यकता न हो।
लिंडन व्हाइट

जवाबों:


23

एक घटना संभावना के साथ होने वाली सांकेतिक शब्दों में बदलना करने के लिए आप की जरूरत कम से कम लॉग 2 ( 1 / पी ) बिट्स (क्यों? देखने पर "शैनन के एन्ट्रापी में लघुगणक की भूमिका क्या है?" मेरा उत्तर )।plog2(1/p)

तो इष्टतम एन्कोडेड संदेश की औसत लंबाई एन्कोडिंग में है यह है कि,शैनन एन्ट्रापीमूल प्रायिकता वितरण का।

ipilog2(1pi),

हालांकि, अगर संभावना वितरण के लिए आप एन्कोडिंग जो एक अलग संभावना वितरण के लिए इष्टतम है का उपयोग क्यू , तो एन्कोडेड संदेश की औसत लंबाई है Σ मैं पी मैं code_length ( मैं ) = Σ मैं पी मैं लोग इन 2 ( 1Pक्यू हैपार एन्ट्रापी, जो तुलना में अधिक हैΣमैंपीमैंलोग इन2(1

Σमैंपीमैंcode_length (मैं)=Σमैंपीमैंलॉग2(1क्षमैं),
Σमैंपीमैंलॉग2(1पीमैं)

पी=(12,12,0,0)

फिर अगर हम इसे बेहतर तरीके से एनकोड करना चाहते हैं, तो हम ए को 0 और बी को 1 के रूप में एनकोड करते हैं, इसलिए हमें प्रति एक अक्षर में एक बिट इनकोडेड संदेश मिलता है। (और यह हमारे प्रायिकता वितरण के बिल्कुल शैनन एंट्रोपी है।)

पीक्यू=(14,14,14,14)


अच्छी व्याख्या, धन्यवाद। हालाँकि, विकिपीडिया परिभाषा sum_i [p_i * log (q_i)] है। आपका 1 / q_i का उपयोग संभव राज्यों की संख्या देता है, इसलिए log_2 यह दर्शाता है कि किसी एकल प्रतीक को एन्कोड करने के लिए आवश्यक बिट्स की संख्या में, लेकिन विकिपीडिया पृष्ठ कुछ अलग तरह से वर्णन कर रहा है।
Redcalx

4
@locster विकिपीडिया में यह राशि से पहले ऋण चिह्न है, जो होने के बराबर है 1/क्षमैं, जैसा लॉग(1/क्षमैं)=-लॉग(क्षमैं)
पायोत्र मिग्डल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.