यूनिकोड मानक में पर्याप्त कोड-बिंदु होते हैं, जो आपको उन सभी को संग्रहीत करने के लिए 4 बाइट्स की आवश्यकता होती है। यही UTF-32 एन्कोडिंग करता है। फिर भी UTF-8 एन्कोडिंग किसी भी तरह से "चर-चौड़ाई एन्कोडिंग" नामक कुछ का उपयोग करके इन्हें बहुत छोटे स्थानों में निचोड़ देता है।
वास्तव में, यह केवल एक बाइट में यूएस-एएससीआईआई के पहले 127 पात्रों का प्रतिनिधित्व करने का प्रबंधन करता है जो बिल्कुल वास्तविक एएससीआईआई की तरह दिखता है, इसलिए आप बहुत से एससीआई पाठ की व्याख्या कर सकते हैं जैसे कि यह यूटीएफ -8 इसके बिना कुछ भी नहीं कर सकता है। साफ़ - सुथरा तरीका। तो यह कैसे काम करता है?
मैं यहाँ अपना प्रश्न पूछने और उत्तर देने जा रहा हूँ क्योंकि मैंने इसे जानने के लिए थोड़ा-सा पढ़ने का काम किया और मुझे लगा कि यह किसी और को कुछ समय बचा सकता है। इसके अलावा, अगर मुझे इसमें से कुछ गलत मिला है तो कोई मुझे सही कर सकता है।