unicode पर टैग किए गए जवाब

यूनिकोड पाठ के एन्कोडिंग, प्रतिनिधित्व और हैंडलिंग के लिए एक मानक है, जिसमें लिखित पाठ के लिए आवश्यक सभी पात्रों का समर्थन करने के इरादे से सभी लेखन प्रणाली, तकनीकी प्रतीक और विराम चिह्न शामिल हैं।

12
यूनिकोड वर्णों से विशिष्ट अंक (ń ǹ ñ ñ ņ marks marks marks marks marks marks marks (() निकालें
मैं एक एल्गोरिथ्म को देख रहा हूं, जो कि डिक्ट्रिटिक्स ( टिल्ड , राउंडफ्लेक्स , कैरेट , ओम्लूट , कैरन ) और उनके "सरल" चरित्र वाले पात्रों के बीच मैप कर सकता है । उदाहरण के लिए: ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ …

5
वास्तव में अच्छा, खराब UTF-8 उदाहरण परीक्षण डेटा [बंद]
बन्द है। यह प्रश्न स्टैक ओवरफ्लो दिशानिर्देशों को पूरा नहीं करता है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? सवाल को अपडेट करें ताकि यह स्टैक ओवरफ्लो के लिए विषय पर हो । 3 साल पहले बंद हुआ । इस प्रश्न …
88 unicode  utf-8 

8
मैं जावा में गैर-मुद्रण योग्य यूनिकोड वर्णों को कैसे बदल सकता हूं?
निम्नलिखित ASCII नियंत्रण वर्ण (के लिए आशुलिपि [\x00-\x1F\x7F]) की जगह लेगा : my_string.replaceAll("\\p{Cntrl}", "?"); निम्नलिखित सभी ASCII गैर-मुद्रण योग्य वर्णों (शॉर्टहैंड के लिए [\p{Graph}\x20]) को प्रतिस्थापित करेंगे , जिसमें उच्चारण वर्ण भी शामिल हैं: my_string.replaceAll("[^\\p{Print}]", "?"); हालांकि, न तो यूनिकोड स्ट्रिंग्स के लिए काम करता है। क्या किसी के पास …
88 java  string  unicode 

12
क्या TCHAR अभी भी प्रासंगिक है?
मैं विंडोज़ प्रोग्रामिंग के लिए नया हूँ और पेटज़ोल्ड पुस्तक पढ़ने के बाद मुझे आश्चर्य होता है: तार को घोषित करने के लिए TCHARप्रकार और _T()फ़ंक्शन का उपयोग करना अच्छा है या क्या मुझे नए कोड में तार wchar_tऔर L""तार का उपयोग करना चाहिए ? मैं केवल Windows 2000 और …
87 c++  c  windows  unicode  wchar-t 

13
<0xEF, 0xBB, 0xBF> वर्ण फाइलों में दिखाई दे रहे हैं। उन्हें कैसे हटाया जाए?
मैं जावास्क्रिप्ट फ़ाइलों की कंप्रेसिंग कर रहा हूं और कंप्रेसर शिकायत कर रहा है कि मेरी फाइलों में उनका चरित्र है। मैं इन पात्रों को कैसे खोज सकता हूं और उन्हें हटा सकता हूं?
86 file  unicode  utf-8  utf 

6
का उपयोग 'utf8;' मुझे 'प्रिंट में व्यापक चरित्र' देता है
यदि मैं निम्नलिखित पर्ल कार्यक्रम चलाता हूं: perl -e 'use utf8; print "鸡\n";' मुझे यह चेतावनी मिली: Wide character in print at -e line 1. अगर मैं यह पर्ल प्रोग्राम चलाता हूं: perl -e 'print "鸡\n";' मुझे चेतावनी नहीं मिलती। मैंने सोचा use utf8था कि एक पर्ल स्क्रिप्ट में UTF-8 …
86 perl  unicode  utf-8 

2
C ++ wchar_t और wstrings के साथ "गलत" क्या है? व्यापक पात्रों के लिए कुछ विकल्प क्या हैं?
मैं सी ++ समुदाय (विशेष रूप से ## c ++ freenode पर) में बहुत से लोगों को देखा है के उपयोग के क्रोध wstringsऔर wchar_t, और Windows API में उनके उपयोग। के साथ wchar_tऔर wstring, और अगर मैं अंतर्राष्ट्रीयकरण का समर्थन करना चाहता हूं, तो व्यापक पात्रों के लिए कुछ …

2
Regex: InCombiningDiacriticalMarks क्या है?
निम्नलिखित कोड को बहुत स्पष्ट रूप से उच्चारण वर्णों को सादे पाठ में बदलने के लिए जाना जाता है: Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); मैंने अपनी "हाथ से बनाई गई" विधि को इस एक से बदल दिया, लेकिन मुझे प्रतिस्थापन के "रेगेक्स" भाग को समझने की आवश्यकता है 1) "InCombiningDiacriticalMarks" क्या है? …
86 java  regex  unicode 

1
WebClient.DownloadString में एन्कोडिंग मुद्दों के कारण आम अक्षरों में परिणाम होता है, लेकिन ब्राउज़र ठीक है
निम्नलिखित कोड: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&amp;start=0&amp;max_results=20")); एक चर में परिणाम textहोता है, जिसमें कई अन्य चीजें शामिल हैं, स्ट्रिंग "$ Ar $ -Minkowski अंतरिक्ष, अदिश क्षेत्र, और लोरेंत्ज़ इंविरियन का मुद्दा" हालाँकि, जब मैं फ़ायरफ़ॉक्स में उस URL पर जाता हूं, तो मुझे मिलता है $ ar $ -Minkowski …

4
इस यूनिकोड डेटाबेस के लिए पायथन का "सर्वश्रेष्ठ ASCII" कहां है?
मेरे पास कुछ पाठ हैं जो यूनिकोड विराम चिह्न का उपयोग करते हैं, जैसे बाएं डबल उद्धरण, एपोस्ट्रोफ के लिए सही एकल उद्धरण, और इसी तरह, और मुझे एएससीआईआई में इसकी आवश्यकता है। क्या पायथन के पास स्पष्ट ASCII के विकल्प के साथ इन पात्रों का एक डेटाबेस है, इसलिए …
85 python  unicode  ascii 

1
C ++ 11 में स्ट्रिंग शाब्दिक के लिए यूनिकोड एन्कोडिंग
संबंधित प्रश्न के बाद , मैं C ++ 11 में नए चरित्र और स्ट्रिंग शाब्दिक प्रकारों के बारे में पूछना चाहता हूं। ऐसा लगता है कि अब हमारे पास चार प्रकार के अक्षर हैं और पांच प्रकार के स्ट्रिंग साहित्यिक हैं। चरित्र प्रकार: char a = '\x30'; // character, no …

5
MySQL VARCHAR लंबाई और UTF-8
MySQL में, यदि मैं VARCHAR(32)UTF-8 तालिका में एक नया क्षेत्र बनाता हूं तो इसका मतलब है कि मैं उस क्षेत्र में 32 बाइट डेटा या 32 वर्ण (बहु-बाइट) संग्रहीत कर सकता हूं?
84 mysql  unicode  utf-8  varchar 

21
यूनिकोड एन्कोडिंग के साथ स्ट्रिंग को अक्षरों की एक स्ट्रिंग में कैसे परिवर्तित किया जाए
मेरे पास बच गए यूनिकोड पात्रों के साथ एक स्ट्रिंग है \uXXXX, और मैं इसे नियमित यूनिकोड अक्षरों में बदलना चाहता हूं। उदाहरण के लिए: "\u0048\u0065\u006C\u006C\u006F World" बन जाना चाहिए "Hello World" मुझे पता है कि जब मैं पहले स्ट्रिंग को प्रिंट करता हूं तो यह पहले से ही दिखाता …
84 java  unicode  encoding 

3
पायथन में यूनिकोड () और एनकोड () कार्यों का उपयोग
मुझे पथ चर के एन्कोडिंग और इसे SQLite डेटाबेस में डालने की समस्या है। मैंने इसे एनकोड ("utf-8") फ़ंक्शन के साथ हल करने की कोशिश की, जिसने मदद नहीं की। फिर मैंने यूनिकोड () फ़ंक्शन का उपयोग किया जो मुझे यूनिकोड टाइप करता है । print type(path) # &lt;type 'unicode'&gt; …

8
सी प्रोग्रामिंग: यूनिकोड के लिए कार्यक्रम कैसे करें?
यूनिकोड प्रोग्रामिंग को सख्त करने के लिए और क्या आवश्यक हैं? क्या इसका मतलब यह है कि मेरे कोड को charकहीं भी प्रकारों का उपयोग नहीं करना चाहिए और उन कार्यों का उपयोग करने की आवश्यकता है जो इससे निपट सकते हैं wint_tऔर wchar_t? और इस परिदृश्य में मल्टीबाइट चरित्र …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.