मुझे रोमन अंकों के लिए यूनिकोड के विशेष वर्णों का उपयोग क्यों करना चाहिए?

यह एक प्रश्न का उत्तर देने के लिए है जो रोमन अंकों के लिए यूनिकोड वर्णों पर इस प्रश्न पर टिप्पणी में उत्पन्न हुआ है :

एआई, एआई-एआई, एआई-एआई-एआई, वेई-एई, आदि टाइप करने के सामान्य तरीके पर यह आवश्यक या पसंदीदा क्यों है?

शुरुआत से शुरू करने के लिए, यूनिकोड के नंबर फॉर्म ब्लॉक में, रोमन अंकों के लिए कोड बिंदु मौजूद हैं जो पहली नज़र में मानक पूंजी लैटिन अक्षरों या उसके संयोजन (यू + 2160 - यू + 217 एफ) के समान हैं। उदाहरण के लिए, U + 2165 (रोमन न्यूमरल सिक्स) VI (लैटिन कैपिटल लेटर V और लैटिन कैपिटल लेटर I) की तरह दिखता है ।

इस प्रकार, यह सवाल उठता है कि किसी को उन अंकों का प्रतिनिधित्व करने के लिए उत्तरार्द्ध का उपयोग क्यों नहीं करना चाहिए और, Louis VIIइसके बजाय , टाइप करें Louis Ⅶ। जाहिर है, कोई विशेष वर्ण का उपयोग फोंट के साथ संगतता के मुद्दों से बचा जाता है जो उनका समर्थन नहीं करते हैं। लेकिन यहां तक कि अगर मुझे पता है कि पाठ को एक फ़ॉन्ट के साथ प्रदान किया जाएगा जो इन पात्रों का समर्थन करता है, तो मुझे उनका उपयोग करने में क्यों परेशान करना चाहिए?

fonts typesetting best-practice

— Wrzlprmft
स्रोत

जवाबों:

कई फोंट में आप वास्तव में रोमन अंकों के लिए यूनिकोड वर्णों का उपयोग करने और सिर्फ लैटिन अक्षरों से उन्हें कंपोज करने के बीच कोई अंतर नहीं पाएंगे। उदाहरण के लिए, FreeSans के साथ दिए गए निम्न शो Louis VII(शीर्ष) और Louis Ⅶ(रोमन अंकों के लिए कोडपॉइंट्स का उपयोग करके नीचे):

यहाँ छवि विवरण दर्ज करें

रिक्ति में एक छोटे अंतर के अलावा, जो संभवतः जानबूझकर नहीं था, आउटपुट समान है।

यहाँ DejaVu संस के साथ एक ही पाठ प्रस्तुत किया गया है:

यहाँ छवि विवरण दर्ज करें

जबकि पात्र अभी भी समान दिखते हैं, रिक्ति में काफी अंतर है। यह स्वाद का विषय हो सकता है कि क्या रोमन अंकों के लिए उत्तरार्द्ध बेहतर है, लेकिन यह निश्चित रूप से नियमित ऑल-कैप के लिए कर्लिंग का अच्छा विकल्प नहीं होगा।

लिनक्स लिबर्टिन एक कदम आगे जाता है:

यहाँ छवि विवरण दर्ज करें

यहां रोमन अंक बड़े अक्षरों से छोटे होते हैं, इस प्रकार फ़ॉन्ट के अरबी अंकों से मेल खाते हैं। सबसे महत्वपूर्ण बात, वे जुड़े हुए हैं, अक्सर हाथ से तैयार रोमन अंकों में पाए जाने वाले एक सुविधा को पुन: प्रस्तुत करते हैं।

अब, कुछ अभी भी तर्क दे सकते हैं कि उपरोक्त में कोई सुधार नहीं हुआ है या वे प्रयास के लायक नहीं हैं। तो यहाँ एक मामला है, जहाँ यूनिकोड वर्णों का उपयोग नहीं करने पर भयानक परिणाम प्राप्त होंगे:

यहाँ छवि विवरण दर्ज करें

(ध्यान दें कि अंकों का छोटा आकार कुछ वास्तविक ऐतिहासिक टाइपसेटिंग को दर्शाता है।) स्क्रिप्ट या कैलीग्राफिक फोंट के लिए कुछ ऐसा ही हो सकता है।

रोमन अंकों के लिए विशिष्ट यूनिकोड बिंदुओं के बिना, बाद की समस्या को हल करना केवल इसके साथ संभव होगा:

एक जटिल OpenType सुविधा (या समान) का उपयोग करना जो यह पता लगाने की कोशिश करता है कि क्या कैपिटल अक्षरों का एक क्रम एक रोमन अंक है। यह अनिवार्य रूप से उन शब्दों के साथ समस्या पैदा करेगा जो एक वैध रोमन अंक भी होंगे।
एक सरल ओपन टाइप सुविधा का उपयोग करना, जिसे हर रोमन अंक के लिए मैन्युअल रूप से सक्रिय करने की आवश्यकता होती है।
यूनिकोड के निजी-उपयोग क्षेत्र का उपयोग करना। रोमन अंक का समर्थन करने वाले दो फोंट के बीच स्विच करने पर भी संगतता मुद्दों को सुनिश्चित करने की संभावना है।

यूनिकोड के दृष्टिकोण से, कैपिटल लैटिन अक्षरों और रोमन अंकों के बीच का विशाल शब्दार्थ अंतर पहले से ही रोमन अंकों के अलग-अलग एन्कोडिंग के लिए पर्याप्त होना चाहिए।

— Wrzlprmft
स्रोत

रोमन संख्याओं को किसी भी समस्या से निकालने के लिए कौन सा समसामयिकी और आरंभिकता से अलग है, दोनों को एक फ़ॉन्ट के साथ छोटे कैप का सेट शामिल करके ठीक से संभाला जाएगा? मैं उम्मीद करूंगा कि छोटे परिदृश्यों के बजाय "VII" को अपरकेस का उपयोग करते हुए दिखाया जाना चाहिए, जहां "नाटो" या "पीएम" को उसी तरह दिखाया जाना चाहिए। हालांकि, क्रॉसबार को "VII" से जोड़ने का एक तरीका होना अच्छा है, लेकिन "वीआईपी" नहीं, मुझे यकीन नहीं है कि जब पाठ के भीतर अंकों का उपयोग किया जाता है, तो क्रॉसबार को कनेक्ट नहीं किया जाना चाहिए ।

— सुपरकैट

बहुत अच्छे ने अपने विस्तारित शब्दार्थों को थोड़ा जोड़ा, लेकिन यदि आप अपने उत्तर में शामिल करना चाहते हैं तो सोआ और बीमार को हटा दें।

— पूजा

@ सुपरकार्ट: मुझे बिल्कुल यकीन नहीं है कि आप क्या लक्ष्य कर रहे हैं, लेकिन मेरे अनुभव में, आधुनिक टाइपोग्राफी में, रोमन अंकों में हमेशा पूंजी का आकार होता है, जबकि जर्मन के अलावा अन्य भाषाओं में, ऑल-कैप्स एब्रीविएशन के लिए छोटे कैप का उपयोग करने के लिए यह कल्पनीय है। ब्लैक लिटर टाइपोग्राफी में, आप ऑल-कैप्स एब्रीविएशन के लिए और रोमन अंकों के लिए एक रोमन फ़ॉन्ट का उपयोग करेंगे, लेकिन कभी-कभी आप छोटे रोमन अंकों (ऊपर के रूप में) और कुछ बहुत ही विशेष अवसरों के लिए, आप ब्लैक-ऑल-कैप्स का उपयोग करेंगे।

— Wrzlprmft

@Rzlprmft: मैं रोमन अंकों की अपेक्षा करता हूं कि वे "पीएम" या "नाटो" जैसी चीजों के समान आकार के मुद्रित हों; कुछ संदर्भों में, इस तरह की चीजों को पूर्ण आकार की राजधानियों के रूप में मुद्रित किया जाता है, लेकिन दूसरों में जो उन्हें बहुत अधिक बाहर खड़ा करती है। यदि एक फ़ॉन्ट में बड़े अक्षरों का एक सेट होता है जिसका डिज़ाइन, बाकी के फ़ॉन्ट के संबंध में, "पीएम" या "नाटो" के लिए उपयुक्त था, तो मुझे लगता है कि यह रोमन अंकों के लिए भी उपयुक्त होगा।

— सुपरकैट

@ सुपरकैट: नियमित रूप से रोमन फ़ॉन्ट के लिए, हां (हालांकि कोई यह तर्क दे सकता है कि क्या यह करना सबसे अच्छा होगा)। लेकिन ब्लैक लिटर और स्क्रिप्ट फोंट के बारे में क्या? इसके अलावा, आप इससे क्या निष्कर्ष निकालते हैं?

— Wrzlprmft

TL; DR यूनिकोड संघ ने लैटिन पत्र का उपयोग करने की सिफारिश की जहां संभव हो और अंक नहीं, जो कि पूर्व-एशियाई टाइपोग्राफी के साथ संगतता के लिए शामिल है।

पूरी कहानी: (उपरोक्त कथन के औचित्य के साथ)

जब तक आप कुछ पूर्व-एशियाई टाइपोग्राफी नहीं कर रहे हैं, तो यूनिकोड (U + 2160 - U + 217F) से (गैर-पुरातन) रोमन अंक वर्णों का उपयोग करना हैक है।

ये चरित्र पूर्व-यूनिकोड पूर्व-एशियाई मानकों के अनुकूलता के लिए शामिल किए गए हैं। ये पात्र लंबवत रहते हैं जहाँ पूर्व-एशियाई पाठ ऊपर से नीचे की ओर टाइपसेट होता है, जबकि आम तौर पर, लैटिन वर्णों (जैसे नाम) में पाठ इस संदर्भ में बग़ल में लिखे जाते हैं।

यूनिकोड मानक के पिछले संस्करण के शब्दों में (वी 7.0, अध्याय 22, पृष्ठ 20।।) :

रोमन संख्याएँ। अधिकांश उद्देश्यों के लिए, उपयुक्त लैटिन अक्षरों के अनुक्रमों से रोमन अंकों की रचना करना बेहतर है। हालांकि, 12 से अधिक रोमन अंकों के अपरकेस और लोअरकेस वेरिएंट, प्लस एल, सी, डी और एम, को एशियाई एशियाई मानकों के साथ संगतता के लिए संख्या प्रपत्र ब्लॉक (यू + 2150..यू + 218 एफ) में एन्कोड किया गया है। लैटिन अक्षरों के दृश्यों के विपरीत, ये प्रतीक ऊर्ध्वाधर लेआउट में सीधे बने रहते हैं। इसके अतिरिक्त, कुछ स्थानों में, कॉम्पैक्ट तारीख प्रारूप महीने के लिए रोमन अंकों का उपयोग करते हैं, लेकिन एकल चरित्र के उपयोग की उम्मीद कर सकते हैं।

तो, सिद्धांत रूप में, रोमन अंकों और पत्र के बीच का अंतर अमीर पाठ का विषय है, जैसे कि इटैलिक्स, एक फ़ॉन्ट परिवर्तन, या वैकल्पिक संयुक्ताक्षर। @Rzlprmft शो के रूप में कहा गया है कि, कुछ फॉन्ट इसे एक अच्छी रेटिंग को रखते हुए प्रत्येक रोमन अंक के लिए एक फ़ॉन्ट परिवर्तन से बचने के लिए उपयोग करते हैं।

XII के लिए एक चरित्र का अस्तित्व और XIII के लिए इसका मतलब है कि एक ही अंक के कई अलग-अलग एन्कोडिंग हैं, जो पाठ खोज में कठिनाइयों की ओर जाता है: यदि आप लुई XII और लुई XIII के बारे में लिखते हैं, तो आप शायद XIII को X I / I के रूप में लिखेंगे। I + I, लेकिन क्या आप XII को एकल चरित्र के रूप में लिखेंगे? या X + I + I के साथ XIII के अनुरूप प्रदर्शन हो? रोमन अंक वर्णों का उपयोग करते समय इस प्रश्न का कोई एक अच्छा जवाब नहीं है, और इसीलिए यूनिकोड संघ ने लैटिन अक्षरों का उपयोग करने की सिफारिश की है जब संभव हो और अंक नहीं।

संपादित करें: शुरुआत में TL; DR अभिकथन जोड़ा गया

— फ्रैडरिक ग्रॉशंस
स्रोत

" यूनिकोड कंसोर्टियम लैटिन अक्षरों का उपयोग करने की सलाह देता है जब संभव हो और अंक नहीं।" यह इस समय की तुलना में अधिक प्रमुख होना चाहिए।

— Ixrec

यूनिकोड शब्दार्थ के दृष्टिकोण से यह यहाँ का सबसे अच्छा उत्तर है। रोमन अंक वर्णों को पसंद करने के लिए कुछ फोंट के साथ व्यावहारिक कारण हो सकते हैं, और यह निश्चित रूप से एक स्वतंत्र ग्राफिक डिजाइन विचार है, लेकिन शब्दार्थ यह गलत है।

— आर ..

यह कैसे दिखता है, इस दृष्टिकोण से बहुत अंतर नहीं हो सकता है। इसलिए यदि आप केवल मुद्रित सामग्री प्रकाशित करते हैं, तो कोई अंतर नहीं है, सिवाय इसके कि कुछ फॉन्ट के रूप में Wrzlprmft उनके उत्कृष्ट उत्तर को इंगित करता है।

शब्दार्थ महत्वपूर्ण हैं

शब्दार्थ अंतर बहुत बड़ा है। रोमन अंकों का उपयोग करने से यह स्पष्ट रूप से स्पष्ट हो जाता है कि आप अक्षर V के बजाय नंबर 5 की बात कर रहे हैं। निश्चित रूप से वे एक जैसे दिखते हैं, लेकिन उनका मतलब अलग है। इसका मतलब यह होगा कि जब आप "XX संस्करण 5" खोजते हैं, तो खोज इंजन में "XX मार्क V" खोजने का एक उच्च मौका हो सकता है।

वास्तव में कारण यह है कि कुछ चीजें बुरी तरह से काम करती हैं, क्योंकि हम अर्थ संबंधी जानकारी को एम्बेड नहीं करते हैं। अगर हम करेंगे तो दुनिया वास्तव में एक बेहतर जगह होगी। तो सही अर्थ का उपयोग करना शब्द प्रोसेसर में स्टाइल का उपयोग करते हुए मैन्युअल रूप से स्टाइलिंग के समान है। मानव छोर पर थोड़ा अंतर है, लेकिन स्वचालन में बड़ी शक्ति।

फोंट को अलग-अलग रोमन अंक बनाने चाहिए

फ़ॉन्ट निर्माता वास्तव में इनका उपयोग नहीं कर रहे हैं क्योंकि वे बहुत बार उपयोग नहीं किए जाते हैं। लेकिन इनका उपयोग करके आप उन अक्षरों पर रोमन अंक स्लैब प्राप्त कर सकते हैं जो उन्हें पाठ से अलग करते हैं। इसलिए यह सुविधा दुर्लभ है क्योंकि यह एक दुर्लभ उपयोग है। फ़ॉन्ट्स वास्तव में सब कुछ लागू नहीं करते हैं, और न ही उन्हें करना चाहिए। इनके उपयोग से आपको लाभ होगा यदि वे मौजूद हैं।

निष्कर्ष

यह सब निश्चित रूप से एक चिकन और अंडे के प्रकार की समस्या है। यदि लोग विशेष वर्ण श्रेणियों का उपयोग नहीं करते हैं, तो उन श्रेणियों के लिए कोई विशेष भत्ते नहीं बनाए जाएंगे। इसलिए फ़ॉन्ट विशेष रूप से स्टाइल किए गए रोमन शाब्दिकों का समर्थन नहीं करेगा, क्योंकि ऐसा करने से सुविधाओं पर कोई बर्बाद नहीं होगा। खोज के लिए भी यही बात लागू होती है: यदि कोई भी रोमन शाब्दिक का उपयोग नहीं करता है, तो कोई भी खोज इंजन रोमन शाब्दिक नहीं पाएगा और शब्दार्थ खो जाता है। शब्दार्थ सही अर्थ न अपनाने से पीड़ित होता है। यह बात निश्चित रूप से यूनिकोड वर्णों की एक विस्तृत श्रृंखला पर भी लागू होती है।

इनपुट जटिलता के रूप में, हाँ अधिकांश उपयोगकर्ता विस्तारित वर्ण नहीं लिख सकते हैं, लेकिन किसी जानकार व्यक्ति के लिए ऐसा करने का कोई बहाना नहीं है, अगर यह समझ में आता है। अगर किसी ने चीजों को बेहतर नहीं बनाया तो कोई प्रगति नहीं होगी। नरक यहां तक कि शब्द में टाइपिंग / अल्फा द्वारा अल्फा लिखने के लिए मोड हैं। तो वास्तव में कोई कारण नहीं है कि अंकों को टैग करने का एक आसान तरीका या ऑटो भी उन्हें इस तरह का सुझाव नहीं दे सकता है। फिर से अगर कोई ऐसा नहीं करता है तो उसे कभी भी व्यापक रूप से गोद नहीं मिलेगा।

— joojaa
स्रोत

वास्तव में एक खोज इंजन "लुई rather" के बजाय "लुई VII" की खोज करते समय बेहतर परिणाम देता है, इसलिए कि वास्तव में अधिकांश सामग्री ऐसे उपकरणों के साथ उत्पन्न होती है जो इस तरह के ठीक शब्दार्थ भेद की अनुमति नहीं देते हैं।

— xpereta

@xpereta हाँ क्योंकि लोग शब्दार्थ की परवाह नहीं करते हैं। हालांकि अगर वे तब आप आसानी से अंक के लिए 7 मैच होगा। दुनिया में बहुत सी अक्षमता है क्योंकि लोग ओटी को महत्वपूर्ण नहीं मानते हैं कि चीजों के शब्दार्थिक अंतर को स्पष्ट रूप से इंगित करें जब वे आसानी से ऐसा कर सकते थे। कंप्यूटर वास्तव में अंतर नहीं जानता है भले ही एक इंसान होगा

— joojaa

@ जूजा इस मामले में, यह शायद इस तथ्य के साथ अधिक है कि VII easier की तुलना में आसान परिमाण के आदेश है। मुझे यकीन नहीं है कि कभी बदल जाएगा।

— Ixrec

मैं अपने निष्कर्ष को समाप्त करने के लिए पिछले पैराग्राफ पर थोड़ा विस्तार करूंगा कि इस तरह के विशेष वर्णों का व्यापक उपयोग व्यापक फ़ॉन्ट कार्यान्वयन को प्रोत्साहित करेगा।

— नाथन तुग्गी

मैं शब्दार्थ के संबंध में इस उत्तर पर दृढ़ता से प्रश्न करता हूं। यूनिकोड रोमन अंक वर्ण <compat>लैटिन अक्षरों के संगत अनुक्रमों के समतुल्य हैं , जो दृढ़ता से यह बताता है कि यूनिकोड में वे एकमात्र कारण कुछ विरासत (शायद CJK) वर्ण सेटों के साथ गोल-ट्रिप संगतता के लिए हैं। इस तरह के पात्रों को आम तौर पर विरासत के एन्कोडिंग में बनाए गए विश्वासपूर्वक गोल-ट्रिपिंग दस्तावेजों के अलावा उपयोग नहीं किया जाना चाहिए।

— आर ..