वाह, बड़ा अच्छा सवाल! मुझे संकल्प समझाने की कोशिश करें। यह तीन अलग-अलग कदम उठाएगा।
ध्यान देने वाली पहली बात यह है कि एन्ट्रापी प्रति ड्रा की औसत बिट्स की औसत संख्या पर अधिक केंद्रित है , न कि बिट्स की अधिकतम संख्या के लिए।
आपकी नमूना प्रक्रिया के साथ, ड्रॉ के लिए आवश्यक यादृच्छिक बिट्स की अधिकतम संख्या बिट्स है, लेकिन आवश्यक बिट्स की औसत संख्या 2 बिट्स है ( 1/2 के साथ एक ज्यामितीय वितरण का औसत ) - यह इसलिए है क्योंकि एक है संभावना है कि आपको केवल 1 बिट की आवश्यकता है (यदि पहला बिट 1 निकला है), संभावना है कि आपको केवल 2 बिट्स की आवश्यकता है (यदि पहले दो बिट्स 01 हो जाते हैं), एक संभावना है कि आपको केवल 3 बिट्स की आवश्यकता है (यदि पहले तीन बिट्स 001 निकलते हैं), और इसी तरह।एनपी = 1 / 21 / 21 / 41 / 8
ध्यान देने वाली दूसरी बात यह है कि एन्ट्रापी वास्तव में एकल ड्रा के लिए आवश्यक बिट्स की औसत संख्या पर कब्जा नहीं करता है। इसके बजाय, एन्ट्रापी इस वितरण से iid ड्रॉ करने के लिए आवश्यक बिट्स के परिशोधन संख्या को पकड़ती है । मान लीजिए कि हमें ड्रॉ के लिए बिट्स की आवश्यकता है; तब एन्ट्रापी की सीमा के रूप में ।मीटरच( एम )मीटरf(m)/mm→∞
ध्यान देने वाली तीसरी बात यह है कि, इस वितरण के साथ, आप बार-बार एक ड्रॉ का नमूना लेने के लिए आवश्यकता से कम बिट्स के साथ iid ड्रॉ का नमूना ले सकते हैं । मान लीजिए आप भोलेपन से, (औसतन 2 अधिक यादृच्छिक बिट्स का प्रयोग करके), एक नमूना (औसतन 2 यादृच्छिक बिट्स लेता है) आकर्षित करने के लिए फिर एक और नमूना आकर्षित फैसला किया, और इतने पर जब तक आप इस दोहराया गया है बार। इसके लिए औसतन लगभग यादृच्छिक बिट्स की आवश्यकता होगी ।mm2m
लेकिन यह पता चला है कि से कम बिट्स का उपयोग करके ड्रॉ से नमूना लेने का एक तरीका है । यह विश्वास करना मुश्किल है, लेकिन यह सच है!m2m
मैं तुम्हें अंतर्ज्ञान दे दूं। मान लीजिए आप नमूने का परिणाम नीचे लिखा खींचता है, जहां वास्तव में बड़ी है। फिर परिणाम एक के रूप में निर्दिष्ट किया जा सकता है -बिट स्ट्रिंग। यह -bit string अधिकतर 0 की होगी, इसमें कुछ 1 है: विशेष रूप से, औसतन इसका लगभग 1 होगा (इससे अधिक या कम हो सकता है, लेकिन यदि पर्याप्त रूप से बड़ा है, तो आमतौर पर संख्या उस के करीब होगी)। 1 के बीच अंतराल की लंबाई यादृच्छिक है, लेकिन आम तौर पर के आसपास के क्षेत्र में कहीं न कहीं अस्पष्ट होगा (आसानी से आधा या दो बार हो सकता है या इससे भी अधिक, लेकिन परिमाण के उस क्रम में)। बेशक, पूरे लिखने के बजायmmmmm/2Nm2Nm-बिट स्ट्रिंग, हम इसे और अधिक संक्षिप्त रूप से अंतराल की लंबाई की सूची लिखकर लिख सकते हैं - जो कि सभी समान जानकारी को एक और अधिक संकुचित प्रारूप में ले जाता है। कितना अधिक रसीला? खैर, हम आमतौर पर प्रत्येक अंतराल की लंबाई का प्रतिनिधित्व करने के लिए बिट्स के बारे में आवश्यकता होगी ; और अंतराल के बारे में होगा ; इसलिए हमें बिट्स के बारे में कुल मिलाकर आवश्यकता होगी (थोड़ा अधिक हो सकता है, थोड़ा कम हो सकता है, लेकिन अगर पर्याप्त रूप से बड़ा है, तो यह आमतौर पर उसके करीब होगा)। यही कारण है कि एक की तुलना में बहुत छोटा है -बिट स्ट्रिंग।Nm/2NmN/2Nmm
और अगर वहाँ एक तरह से नीचे स्ट्रिंग लिखने के लिए यह सफलतापूर्वक है, शायद यह बहुत आश्चर्य की बात नहीं होगा अगर इसका मतलब है कि स्ट्रिंग की लंबाई के बराबर यादृच्छिक यादृच्छिक संख्या के साथ स्ट्रिंग उत्पन्न करने का एक तरीका है। विशेष रूप से, आप बेतरतीब ढंग से प्रत्येक अंतराल की लंबाई उत्पन्न करते हैं; यह साथ एक ज्यामितीय वितरण से नमूना ले रहा है , और यह औसतन ( ) औसतन लगभग यादृच्छिक बिट्स के साथ किया जा सकता है । आपको इस ज्यामितीय वितरण से iid की आवश्यकता होगी, इसलिए आपको कुल लगभग यादृच्छिक बिट्स की आवश्यकता होगी। (यह एक छोटा स्थिर कारक बड़ा हो सकता है, लेकिन बहुत बड़ा नहीं है।) और, ध्यान दें कि यह बिट्स की तुलना में बहुत छोटा है ।p=1/2N∼N2Nm/2N∼Nm/2N2m
तो, हम आपके वितरण से iid ड्रॉ का नमूना ले सकते हैं , बस यादृच्छिक बिट्स (लगभग) का उपयोग कर। याद रखें कि एन्ट्रापी । तो इसका मतलब है कि आपको एन्ट्रापी होने की उम्मीद करनी चाहिए (लगभग) । वह थोड़ा बहुत बंद है, क्योंकि उपरोक्त गणना स्केच और क्रूड थी - लेकिन उम्मीद है कि यह आपको कुछ अंतर्ज्ञान देता है कि एन्ट्रापी क्या है, और क्यों सब कुछ सुसंगत और उचित है।mf(m)∼Nm/2Nlimm→∞f(m)/mN/2N