सामान्य
उन वर्णों को नियमित लैटिन-वर्णमाला पाठ के लिए नहीं, बल्कि ध्वन्यात्मक, सिरिलिक-वर्णमाला पाठ के लिए, गणितीय प्रतीकों (चर का प्रतिनिधित्व), या इसी तरह के रूप में उपयोग करने के लिए अभिप्रेत नहीं है। मूल लैटिन वर्णमाला में पाठ को सांकेतिक शब्दों में बदलने का एकमात्र यूनिकोड-अनुपालन तरीका इस उद्देश्य के लिए मुख्य रूप से उपयोग किए जाने वाले वर्णों का उपयोग करना है (यानी, मूल लैटिन यूनिकोड ब्लॉक से)।
कई अन्य मानकों के साथ, आपको यूनिकोड के उल्लंघन के बारे में दो बार सोचना चाहिए। इसके अलावा, यूनिकोड में कई लेखन प्रणाली शामिल हैं, मामलों का उपयोग करते हैं, और सामान जो अन्य मानकों 1 के साथ पीछे की संगतता के लिए मौजूद है 1 जो इसके सभी प्रेरणाओं को पूरी तरह से समझना अपने स्वयं का एक विज्ञान है। लंबी कहानी छोटी, जब तक आप वास्तव में नहीं जानते कि आप क्या कर रहे हैं, यह बहुत संभावना है कि कुछ टूट जाता है जिसे आपने दूर से सोचा भी नहीं है।
विशिष्ट उदाहरण
सरल उपयोग
एन्कोडेड पाठ केवल कुछ फ़ॉन्ट में प्रदान करने के लिए मौजूद नहीं है। इसकी व्याख्या स्क्रीन पाठकों द्वारा भी की जा सकती है। और एक स्क्रीन रीडर को यह अनुमान लगाने की आवश्यकता नहीं होनी चाहिए कि क्या
𝓽𝓱𝓮
का अर्थ है निश्चित लेख या गणितीय उत्पाद 2 चर 2 , 𝓱, और 𝓮 - जो कि उन वर्णों के लिए बने हैं। इसलिए सबसे अच्छा व्यवहार यह होगा कि यह इन वर्णों को मंत्रमुग्ध कर दे, उदाहरण के लिए निम्नलिखित शब्द:
बोल्ड स्क्रिप्ट स्मॉल टी, बोल्ड स्क्रिप्ट स्मॉल एच, बोल्ड स्क्रिप्ट स्मॉल ई
इसके बजाय इसे केवल "" नहीं कहना चाहिए क्योंकि तब यह गणितीय ग्रंथों को ठीक से नहीं पढ़ेगा जिनके प्रतीक एक शब्दवाचक शब्द बनाने के लिए होते हैं। 3
पोर्टेबिलिटी
यदि आपका पाठ आपके मशीन पर अच्छी तरह से प्रस्तुत किया गया है, तो इसका मतलब यह नहीं है कि यह पाठक के एक पर भी होगा। सबसे स्पष्ट उदाहरण यह है कि पाठक के पास इन वर्णों का समर्थन करने वाला कोई भी फ़ॉन्ट नहीं है या पाठ में सॉफ़्टवेयर द्वारा फॉलबैक फोंट का समर्थन नहीं किया गया है। जाहिर है, यह तेजी से कम आम होता जा रहा है। हालांकि ध्यान रखें कि डिस्लेक्सिक्स जैसे कुछ लोगों को विशेष फोंट की आवश्यकता होती है जो इन पात्रों का समर्थन करने की कम संभावना है।
लेकिन भले ही पाठक की मशीन केवल एक अलग फ़ॉन्ट का उपयोग करती है, इससे पाठ काफी कम पढ़ा जा सकता है। एक के लिए पहला उदाहरण है, इस 𝓉𝒽ℯ दो अलग अलग फोंट के साथ प्रदान की गई है:
फ्री सेरिफ़ पाठ को प्रस्तुत करता है जैसा कि आप चाहते होंगे कि पाठ का अनुकरण करने के लिए विशेष वर्णों का उपयोग करते समय इसका प्रतिपादन किया जाए, अर्थात् एक निरंतर स्ट्रोक के साथ लिखावट का अनुकरण करना। हालाँकि, इन पात्रों को गणितीय प्रतीकों के रूप में उपयोग करने के लिए बनाया गया है, जिससे कोई मतलब नहीं है। इसलिए STIX द्वारा रेंडरिंग , जो विशेष रूप से गणितीय उद्देश्यों के लिए डिज़ाइन किया गया है, इन वर्णों का उपयोग करने के लिए कैसे किया जाता है, इसके अनुरूप अधिक है।
एक दूसरे उदाहरण में , मान लीजिए कि आपने या पाठक ने किसी कारणवश “कुछ भी हो” कहा है। एक अच्छे फ़ॉन्ट के साथ, आपको 4 मिलेंगे :
इसका कारण यह है कि छोटे कैप साइरिलिक अक्षरों के साथ (आंशिक रूप से) नकली थे, और सिरिलिक इटैलिक्स कभी-कभी उनके ईमानदार समकक्षों से बहुत अलग दिखते हैं । तो फिर, यह उचित व्यवहार है।
खोज योग्यता
एक के रूप में पहला उदाहरण पर विचार आप एक उचित खोज चरित्र 𝒲 (गणितीय स्क्रिप्ट के साथ क्या करना चाहते हैं क्या डब्ल्यू )। मान लें कि खोज में दो मोड हैं, डिफ़ॉल्ट मोड और सटीक मोड (आमतौर पर केस-संवेदी कहा जाता है )। यह चरित्र होना चाहिए:
डिफ़ॉल्ट मोड में डब्ल्यू या डब्ल्यू की खोज करते समय पाया जाता है - उन लोगों के लिए जो विशेष चरित्र को खोज क्षेत्र में प्रवेश या कॉपी-पेस्ट करने से परेशान नहीं करना चाहते हैं;
सटीक मोड में found की खोज करते समय पाया जाता है - उन लोगों के लिए जो खोज करना चाहते हैं कि गणितीय चर में संबंधित चर का उल्लेख कहां है;
ऊपर की तरह एक खोज को तोड़ने के कारण सटीक मोड में 𝓌, w या W की खोज करते समय नहीं मिला ।
हालाँकि यदि आप नियमित पाठ का अनुकरण करने के लिए इस वर्ण का उपयोग करते हैं, तो इसे W या use के लिए सटीक मोड में खोजते हुए पाया जाना चाहिए , जो ऊपर दिए गए विवादों में है।
एक दूसरे उदाहरण के रूप में विचार करते हैं कि लैटिन वर्णों की खोज करते समय सिरिलिक पात्रों को कभी नहीं मिलना चाहिए और इसके विपरीत, क्योंकि वे पूरी तरह से अलग चीजें हैं। हालांकि अगर लैटिन छोटे कैप का अनुकरण करने के लिए सिरिलिक पात्रों का उपयोग किया जाता है, तो आपको ऐसा करने की आवश्यकता है, यदि आप नहीं चाहते कि खोज-क्षमता को तोड़ा जाए। इससे लोगों को बहुत सारे बेकार सामान मिलेंगे यदि वे एक दुर्लभ लैटिन-वर्णमाला शब्द की खोज करते हैं जो कि बस कुछ लोकप्रिय सिरिलिक-वर्णमाला शब्द (और इसके विपरीत) के छोटे छोटे अक्षरों के अनुरूप होता है।
एक सटीक खोज विकल्प इस समस्या को हल नहीं कर सकता है, क्योंकि यह उन अक्षरों में अन्य उद्देश्यों के लिए आरक्षित है।
सामान्य तौर पर , एक खोज का निर्माण करना असंभव है (विकल्पों की एक पागल राशि के बिना) जो स्टाइल लैटिन पाठ को अनुकरण करने के लिए विशेष वर्णों का उपयोग करके नहीं तोड़ा जाता है।
1 आप जानते हैं कि XKCD मानकों को एकीकृत करने की अपरिहार्य विफलता के बारे में है ? खैर, यूनिकोड सफल रहा।
2 या जो भी खाली संचालक है, वह प्रथक सम्मेलन में है
3 मुझे पता है कि आजकल बहुत कम गणितीय ग्रंथ इस एन्कोडिंग का समर्थन करते हैं या इसके अनुकूल कुछ है लेकिन बात यह है कि किसी दिन वे उम्मीद करते हैं। आपका यूनिकोड-एब्यूजिंग टेक्स्ट अभी भी आसपास हो सकता है और तब पढ़ा जा सकता है।
4 जब तक आप मैसेडोनियन या सर्बियाई के लिए स्थानीयकरण नहीं कर रहे हैं, जिसमें आपको अलग-अलग लेकिन फिर भी अवांछनीय परिणाम मिलेगा।