मैं नोटपैड ++ में यूनिकोड पाठ को कैसे संपादित कर सकता हूं?


26

कभी-कभी मैं अंग्रेजी पाठ को संपादित करता हूं जिसमें यूनिकोड वर्ण शामिल होते हैं। किसी कारण से, मेरे PC पर, Notepad ++ यूनिकोड वर्णों को ??? में परिवर्तित कर देता है, जिससे पाठ दूषित हो जाता है और वह सारा डेटा खो जाता है। मैं यूनिकोड वर्णों को संरक्षित करते हुए, इस तरह के पाठ को संपादित करने का एक तरीका ढूंढ रहा हूं। मैं अपने फ़ॉन्ट के रूप में कंसोल का उपयोग कर रहा हूं । यदि फ़ॉन्ट में वे सभी वर्ण नहीं हैं, तो जब मैं नोटपैड ++ (विंडोज के कीबोर्ड के माध्यम से) से पाठ को कॉपी करता हूं तो मुझे डेटा क्यों खोना चाहिए?


यह हो सकता है कि आप एक प्लगइन का उपयोग कर रहे हैं जो यूनिकोड का समर्थन नहीं करता है?
Ivo फ्लिप

यदि वे बक्से में प्रश्न चिह्न हैं, तो यह वास्तव में लापता ग्लिफ़ के लिए फ़ॉन्ट का ग्लिफ़ है और आपका डेटा गुम नहीं हुआ है
जॉय

नहीं इसके बक्से में नहीं, इसके बजाय सादे? ' चरित्र। की पुष्टि की।
रोबिनिक्स

1
आपको फ़ॉन्ट बदलने की आवश्यकता हो सकती है। देख superuser.com/questions/16831/...
RamyenHead

जवाबों:


15

यदि फ़ाइल वास्तव में यूनिकोड में एन्कोडेड है, तो नोटपैड ++ को इसे स्वचालित रूप से पता लगाना चाहिए। Consolas फॉन्ट मेरे लिए अच्छी तरह से काम करता है। आप इन दो मेनू विकल्पों में से एक को आजमा सकते हैं:

  • एनकोडिंग -> UTF-8 में एनकोड करें
  • एन्कोडिंग -> UTF-8 में कनवर्ट करें

मुझे पूरा यकीन है कि पहला वही करेगा जो आप चाहते हैं।


मेरे पास प्रारूप मेनू नहीं है।
वैल

1
पोस्टरिटी के लिए, आपको एन्कोडिंग मेनू की आवश्यकता होती है, प्रारूप की नहीं
केन बेलोज

15

प्रश्न में वर्णित समस्या तब होती है जब एक खाली / नया दस्तावेज़ "ANSI" पर सेट किया जाता है, और इसमें यूनिकोड वर्णों को चिपकाया जाता है।

खाली / नए दस्तावेज़ के साथ उपयोग किए जाने पर कोई ऑटो-डिटेक्शन नहीं है, कम से कम नोटपैड ++ के संस्करण में नहीं मैंने इसे (v5.4.5) पर परीक्षण किया। "ANSI" एक नए दस्तावेज़ के लिए नोटपैड ++ में डिफ़ॉल्ट है, जब तक कि मेनू सेटिंग में सेट नहीं किया जाता है → वरीयताएँ → टैब नया दस्तावेज़ / ओपन डायरेक्ट्री निर्देशिका

समाधान

समाधान को चिपकाने से पहले UTF-8 को एन्कोडिंग सेट करना है , मेनू प्रारूपUTF-8 में एनकोड करें :

मेनू कमांड "मेनू प्रारूप / UTF-8 में एनकोड" निष्पादित होने के बारे में

उदाहरण

मैंने कुछ पाठ को एक नए नोटपैड ++ दस्तावेज़, रूसी (русский язык, russkiy yazyk) से कॉपी किया , फ़ायरफ़ॉक्स से विकिपीडिया पृष्ठ रूसी भाषा दिखा रहा है ।

यदि एन्कोडिंग को "ANSI" से नहीं बदला गया है तो यह परिणाम है:

एक नया नोटपैड ++ दस्तावेज़ में डिफ़ॉल्ट "ANSI" से एन्कोडिंग को बदले बिना यूनिकोड स्ट्रिंग "रूसी (русский язык, russkiy yazyk) को चिपकाने का परिणाम।

यदि एन्कोडिंग को बदल दिया जाता है तो यह परिणाम है:

एक नया नोटपैड ++ दस्तावेज़ में डिफ़ॉल्ट "ANSI" से "UTF-8" में एन्कोडिंग को बदलने के बाद यूनिकोड स्ट्रिंग "रूसी (русский язык, russkiy yazyk) को चिपकाने का परिणाम।

जैसा कि नीचे दिए गए चित्र में देखा जा सकता है ( सिरिलिक भाग हाइलाइट किया गया है), नोटपैड ++ वास्तव में यूनिकोड वर्णों को एएससीआईआई 63 (हेक्साडेसिमल 3 एफ), प्रश्न चिह्न में परिवर्तित करता है। यही कारण है कि क्लिपबोर्ड के माध्यम से पाठ की प्रतिलिपि बनाते समय यूनिकोड वर्ण खो जाते हैं ( "एएनएसआई" मोड में) (यह एक फ़ॉन्ट मुद्दा नहीं है - जानकारी खो गई है)।

उक्त दस्तावेज़ के एक हेक्स दृश्य का स्क्रीनशॉट

पर परीक्षण किया गया: नोटपैड ++ v5.4.5 (UNICODE)।


5

अच्छी खबरें और बुरी खबरें हैं।

अच्छी खबर: नोटपैड ++ यूनिकोड का समर्थन करता है (कम से कम जो मैं इकट्ठा कर सकता हूं)।

बुरी खबर: जाहिर है यूनिकोड का समर्थन केवल विंडोज एक्सपी पर है।

मेरे पास वास्तव में मेरे सामने एक विंडोज मशीन नहीं है। मुझे जो याद है, उससे कहीं कहीं प्रारूप मेनू के तहत एक एन्कोडिंग मेनू है। यूनिकोड के लिए एन्कोडिंग वास्तव में सबसे अधिक यूटीएफ -8 है।

यहाँ नोटपैड ++ में यूनिकोड समर्थन की 'सुंदर' तस्वीर है,

यहाँ छवि विवरण दर्ज करें


3

यूनिकोड विंडोज 7 पर पूरी तरह से काम करता है। जो एकमात्र मुद्दा सामने आता है वह यह है कि आपको उन पात्रों को फिर से लिखना होगा जिन्हें बदल दिया गया है। यह मेरे साथ हुआ है। मैं स्कैंडिनेवियाई पत्रों के साथ लिख रहा हूं इसलिए ä -> E4, ö -> F6। यह उन सभी को बदलने के लिए बट में दर्द है, लेकिन यह इसके लायक है।

यदि आप ANSI -> UTF-8 से किसी पृष्ठ को एनकोड करते हैं तो कुछ वर्ण समस्याएं होंगी।

मेरा सुझाव है कि आप पहले UTF-8 में एक नया पेज बनाएँ और फिर अपनी जानकारी को कॉपी / पेस्ट करें। तब कोई परेशानी नहीं होगी / नहीं होनी चाहिए।


1

यह मेरे लिए काम किया है:

मैंने अपने पीसी पर शैली विन्यासकर्ता में कूरियर न्यू के लिए फ़ॉन्ट को बदल दिया (अंग्रेजी / अमेरिकी चरित्र सेट के साथ विंडोज 7 और गैर-यूनिकोड सेट के लिए रोमानियाई)। यह कूरियर न्यू एंड ताहोमा फोंट + UTF-8 एन्कोडिंग के साथ काम कर रहा है।


0

शीर्ष मेनू पर Encodingतब चुनें चुनें Encode in UTF-8या Encode in UTF-8 Without BOMफिर आप यूनिकोड एन्कोडिंग में पाठ को संपादित कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.