मूल बातें शुरू करने के लिए, सब कुछ यूएस-एएससीआईआई पर आधारित है, जो सेट में 128 कोड बिंदुओं के साथ 7 बिट कोड है, 7x या दशमलव 0-127 के माध्यम से हेक्स 00 गिना जाता है। यह कोड, अंग्रेजी अल्फ़ान्यूमेरिक, और मूल विराम चिह्नों को नियंत्रित करने के लिए मैप किया गया है
8 बिट कोड (बाइट) के लिए इसमें 1 बिट जोड़ने से हमें एक और 128 कोड अंक या विस्तारित ASCII मिलता है।
कैरेक्टर सेट / कोड पेजों को जल्दी-जल्दी बदलने की आवश्यकता थी कि जिस ऊपरी भाषा में आप प्रतिनिधित्व करना चाहते हैं, उसके लिए वर्णमाला को कवर करने के लिए वर्णों को ऊपरी 128 बिट्स में कोड बिंदुओं को कैसे मैप किया जाए। यह ज्यादातर पश्चिमी यूरोपीय भाषाओं के लिए यथोचित काम करता है। आईएसओ 8859-1 / लैटिन -1 इस तरह के एक चरित्र सेट का एक उदाहरण है। एक और विंडोज -1252 है जिसमें आईएसओ 8859-1 से बदलाव है ताकि इसे अधिक या विभिन्न पात्रों को कवर करने में मदद मिल सके।
चीनी, जापानी और कोरियाई जैसे अधिक जटिल वर्ण सेट वाली भाषाएं 256 कोड बिंदु सेट की क्षमताओं से अधिक हैं और उनके प्रतिनिधित्व को सक्षम करने के लिए एक डबल-बाइट कोड का उपयोग करती हैं।
यूनिकोड यूटीएफ -8 एक मल्टी-बाइट कैरेक्टर एन्कोडिंग स्कीम (1-4 बाइट्स) है जिसमें आईएसओ 8859-1 / लेटिन -1 के लिए पिछड़ी संगतता है और यह इसका पहला 128 कैरेक्टर है। इसमें 1 मिलियन से अधिक कोड बिंदुओं के लिए जगह है, जिसका अर्थ है कि प्रत्येक कोड बिंदु वास्तव में एक चरित्र का प्रतिनिधित्व कर सकता है, विस्तारित ASCII के साथ किए गए चक्कर के विपरीत, जिसका अर्थ है कि एक कोड चरित्र के नक्शे, चरित्र सेट / कोड पृष्ठ / के आधार पर भिन्न होते हैं। एन्कोडिंग।
फ़ॉन्ट्स ग्लिफ़ हैं जिन्हें कोड बिंदुओं पर मैप किया जाता है और नेत्रहीन वर्णों का प्रतिनिधित्व करते हैं। एक फ़ॉन्ट की सामग्री इस बात पर निर्भर करती है कि यह मूल रूप से किन भाषाओं को कवर करने के लिए थी। फ़ॉन्ट के भीतर क्या ग्लिफ़ हैं, यह देखने के लिए आप चरित्र मानचित्र का उपयोग कर सकते हैं ।
यूनिकोड फोंट सभी कोड बिंदुओं को आवश्यक रूप से कवर नहीं करते हैं, आपको यह देखने की आवश्यकता है कि उनका उपयोग करने का इरादा कहां था। उदाहरण के लिए, विंडोज 7 में, कैरेक्टर मैप को फायर करें और कैलीबरी में पात्रों को देखें और फिर उनकी तुलना एब्रीमा, मीरियो और रावी से करें। ध्यान दें कि वे बहुत भिन्न हैं क्योंकि प्रत्येक एक अलग भौगोलिक क्षेत्र के अनुरूप है।
यूनिकोड फोंट और विंडोज -1252 चरित्र सेट के रूप में, विंडोज यूनिकोड में विंडोज 1252 का अनुवाद करने के लिए विंडोज एक मैपिंग टेबल का उपयोग करता है, जहां यह "बेस्ट फिट" परिदृश्य के लिए आईएसओ 8859-1 से मेल नहीं खाता है, जहां विंडोज -1252 चरित्र में कुछ अक्षर हैं। सेट प्रदर्शित नहीं हो सकता है।