शॉर्ट के साथ जाने का एक और कारण यह है कि यह अन्य उदाहरणों से मेल खाता है जहां आप मार्कअप में निर्धारित वर्ण निर्दिष्ट कर सकते हैं। उदाहरण के लिए:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
संगति त्रुटियों को कम करने और कोड को अधिक पठनीय बनाने में मदद करती है।
ध्यान दें कि चारसेट विशेषता केस-असंवेदनशील है। आप UTF-8 या utf-8 का उपयोग कर सकते हैं, हालाँकि UTF-8 अधिक स्पष्ट, अधिक पठनीय, अधिक सटीक है।
इसके अलावा, मेटा चार्सेट विशेषता या पृष्ठ शीर्ष लेख में UTF-8 के अलावा किसी भी मान का उपयोग करने के लिए बिल्कुल कोई कारण नहीं है। 1999 में HTML4 के बाद से वेब दस्तावेज़ों के लिए UTF-8 डिफ़ॉल्ट एन्कोडिंग है और आधुनिक वेब पेज बनाने का एकमात्र व्यावहारिक तरीका है।
इसके अलावा, आपको UTF-8 में HTML संस्थाओं का उपयोग नहीं करना चाहिए। कॉपीराइट प्रतीक जैसे वर्ण सीधे टाइप किए जाने चाहिए। 5 आरक्षित मार्कअप वर्णों के लिए आपके द्वारा उपयोग की जाने वाली एकमात्र इकाइयाँ हैं: से कम, एम्परसेंड, प्राइम, डबल प्राइम। संस्थाओं को एक HTML पार्सर की आवश्यकता होती है, जिसे आप हमेशा आगे जाने के लिए उपयोग नहीं करना चाहते हैं, वे त्रुटियां पेश करते हैं, आपके कोड को कम पठनीय बनाते हैं, आपकी फ़ाइल का आकार बढ़ाते हैं, और कभी-कभी विभिन्न ब्राउज़रों में गलत तरीके से डिकोड करते हैं जो आपके द्वारा उपयोग की गई संस्थाओं के आधार पर होता है। कॉपीराइट, ट्रेडमार्क, खुली बोली, नज़दीकी बोली, एपोस्ट्रोफ़, एम डैश, एन डैश, बुलेट, यूरो, और आपके सामग्री में आपके द्वारा सामना किए जाने वाले किसी भी अन्य वर्ण को टाइप / सम्मिलित करना सीखें, और अपने कोड में उन वास्तविक पात्रों का उपयोग करें। मैक में एक कैरेक्टर व्यूअर है जिसे आप कीबोर्ड सिस्टम वरीयता में बदल सकते हैं, और आप पा सकते हैं और फिर उन वर्णों को खींच सकते हैं और छोड़ सकते हैं जिनकी आपको ज़रूरत है, या मिलान करने वाले कीबोर्ड व्यूअर का उपयोग करके देख सकते हैं कि कौन सी कुंजी टाइप करनी है। उदाहरण के लिए, ट्रेडमार्क विकल्प + 2 है। UTF-8 में हर लिखित मानव भाषा के सभी अक्षर और चिन्ह शामिल हैं। तो वहाँ का उपयोग करने के लिए कोई बहाना नहीं है - बजाय उन्हें एक पानी का छींटा। विराम चिह्न और टाइपोग्राफी के नियमों को भी सीखना बुरा नहीं है ... उदाहरण के लिए, यह जानना कि एक अवधि एक करीबी उद्धरण के अंदर जाती है, बाहर नहीं।
सामग्री-प्रकार और एन्कोडिंग जैसी किसी चीज़ के लिए टैग का उपयोग करना अत्यधिक विडंबनापूर्ण है, क्योंकि उन चीजों को जाने बिना, आप मेटा टैग का मान प्राप्त करने के लिए फ़ाइल को पार्स नहीं कर सकते।
नहीं, यह सच नहीं है। ब्राउज़र फ़ाइल को ब्राउज़र के डिफ़ॉल्ट एन्कोडिंग के रूप में पार्स करना शुरू कर देता है, या तो UTF-8 या ISO-8859-1। चूंकि US-ASCII ISO-8859-1 और UTF-8 दोनों का एक उपसमूह है , इसलिए ब्राउज़र ठीक तरह से पढ़ सकता है ... यह एक ही है। जब ब्राउज़र मेटा चारसेट टैग का सामना करता है, यदि एन्कोडिंग ब्राउज़र के पहले से उपयोग किए जा रहे से अलग है, तो ब्राउज़र निर्दिष्ट एन्कोडिंग में पृष्ठ को पुनः लोड करता है। यही कारण है कि हम मेटा टैगसेट टैग को शीर्ष पर रखते हैं, हेड टैग के ठीक बाद, कुछ भी करने से पहले, शीर्षक भी। इस तरह से आप अपने शीर्षक में UTF-8 वर्णों का उपयोग कर सकते हैं।
आपको अपनी फ़ाइल को बिना BOM के UTF-8 एन्कोडिंग में सहेजना होगा
यह कड़ाई से सच नहीं है। यदि आपके दस्तावेज़ में केवल US-ASCII वर्ण हैं, तो आप इसे US-ASCII के रूप में सहेज सकते हैं और UTF-8 के रूप में सेवा कर सकते हैं, क्योंकि यह एक सबसेट है। लेकिन अगर यूनिकोड वर्ण हैं, तो आप सही हैं, आपको बिना BOM के UTF-8 के रूप में सहेजना होगा।
यदि आप एक अच्छा टेक्स्ट एडिटर चाहते हैं जो UTF-8 में आपकी फ़ाइलों को बचाएगा, तो मैं नोटपैड ++ की सलाह देता हूं।
मैक पर, मैक ऐप स्टोर से नंगे हड्डियों के टेक्स्टवेलर (मुफ़्त), या नंगे हड्डियों के BBEdit का उपयोग करें, जो मैक ऐप स्टोर पर $ 39.99 के लिए है ... इस तरह के एक महान उपकरण के लिए बहुत सस्ता है। किसी भी ऐप में, दस्तावेज़ विंडो के नीचे एक मेनू होता है जहाँ आप दस्तावेज़ एन्कोडिंग निर्दिष्ट करते हैं और आप आसानी से "UTF-8 नो बीओएम" चुन सकते हैं। और निश्चित रूप से आप इसे प्राथमिकता में नए दस्तावेज़ों के लिए डिफ़ॉल्ट के रूप में सेट कर सकते हैं।
लेकिन अगर आपका वेबसर्वर HTTP हेडर में एन्कोडिंग का कार्य करता है, जिसकी सिफारिश की जाती है, दोनों [मेटा टैग] अनावश्यक हैं।
यह गलत है। आपको निश्चित रूप से HTTP शीर्ष लेख में एन्कोडिंग सेट करना चाहिए, लेकिन आपको इसे मेटा चारसेट विशेषता में भी सेट करना चाहिए ताकि पृष्ठ को उपयोगकर्ता द्वारा सहेजा जा सके, ब्राउज़र से बाहर स्थानीय भंडारण पर और फिर बाद में फिर से खोला, जिस स्थिति में एन्कोडिंग का एकमात्र संकेत मौजूद होगा जो मेटा चारसेट विशेषता है। आपको एक ही कारण के लिए एक आधार टैग भी सेट करना चाहिए ... सर्वर पर, आधार टैग अनावश्यक है, लेकिन जब स्थानीय भंडारण से खोला जाता है, तो आधार टैग पृष्ठ को काम करने में सक्षम बनाता है जैसे कि यह सर्वर पर है, सभी के साथ जगह में संपत्ति और इतने पर, कोई टूटी हुई लिंक नहीं।
AddDefaultCharset UTF-8
या आप केवल विशेष फ़ाइल प्रकारों के एन्कोडिंग को बदल सकते हैं जैसे:
AddType text/html;charset=utf-8 html
UTF-8 और लैटिन -1 (ISO-8859-1) दोनों फाइलों को परोसने के लिए एक टिप UTF-8 फाइलों को "टेक्स्ट" एक्सटेंशन और लैटिन -1 फाइल "txt" को देना है।
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
अंत में, यूनिक्स लाइन के अंत के साथ अपने दस्तावेज़ों को सहेजने पर विचार करें, न कि विरासत डीओएस या (क्लासिक) मैक लाइन के अंत में, जो मदद नहीं करते हैं और चोट लग सकती है, विशेषकर नीचे की रेखा के रूप में हम उन विरासत प्रणालियों से आगे और आगे बढ़ते हैं। मान्य HTML5, UTF-8 एन्कोडिंग और यूनिक्स लाइन अंत के साथ एक HTML दस्तावेज़ एक काम अच्छी तरह से किया गया है। आप साझा और संपादित कर सकते हैं और स्टोर कर सकते हैं और पढ़ सकते हैं और पुनर्प्राप्त कर सकते हैं और कई संदर्भों में उस दस्तावेज़ पर भरोसा कर सकते हैं। यह लिंगुआ फ्रेंका है। यह डिजिटल पेपर है।