नोटपैड ++ में किसी फ़ाइल की एन्कोडिंग UTF-8 पर सेट है, लेकिन एन्कोडिंग वास्तव में ASCII है


0

जब मैं उन्हें नोटपैड ++ के साथ उपयोग करता हूं तो मुझे कुछ पाठ फ़ाइलों को UTF-8 पाठ फ़ाइलों के रूप में एनकोड करना होगा। हालाँकि, कभी-कभी मेरे पास UTF-8 को नोटपैड ++ में एन्कोडिंग के रूप में चुना जाता है, लेकिन फ़ाइल वास्तव में एएससीआईआई में है। मैं इसे दो अलग-अलग तरीकों से जानता हूं।

पहली विधि यह है कि मैं XAMPP पर मोबीकी नामक एक साधारण विकि इंजन का उपयोग करता हूं जो केवल UTF-8 को विशेष वर्णों को सही ढंग से एनकोड करेगा। मेरा पाठ फ़ाइल Mobiki के साथ सही ढंग से प्रदर्शित नहीं हो रहा है। दूसरी विधि जो मैंने http://www.checkfiletype.com वेबपृष्ठ पर लागू की है, जाँचने के लिए इस्तेमाल की । जब मैं उस पृष्ठ पर समस्या फ़ाइलों को अपलोड करता हूं, तो वेबसाइट मुझे बताती है कि फ़ाइल ASCII प्रारूप में एन्कोडेड है। मोबिक्विक के साथ काम करने वाले अन्य पेज यूटीएफ -8 प्रारूप में एनकोडेड होते हैं, जैसा कि वेबसाइट द्वारा दिया गया है।

नोटपैड ++ फाइल को यूटीएफ -8 फाइल होने के लिए मजबूर क्यों नहीं कर रहा है और / या मैं नोटपैड ++ कैसे बना सकता हूं? मैंने "कन्वर्ट टू यूटीएफ -8" का चयन करने की कोशिश की, भले ही नोटपैड ++ यह दर्शाता है कि फाइल पहले से ही यूटीएफ -8 में एन्कोडेड है, लेकिन इस रूपांतरण के लिए मदद नहीं की।

मुझे कुछ अन्य फ़ोरम पोस्ट मिले, जो एक समान समस्या का वर्णन करते हैं, लेकिन उनका समाधान केवल एक नई टेक्स्ट फ़ाइल बनाना था। मैं एक नई पाठ फ़ाइल बनाने के बिना एक समाधान खोजने की उम्मीद करता हूं।


जानकारी के लिए धन्यवाद। उस फ़ाइल के लिए हाँ, नोटपैड ++ निचले दाएं कोने में UTF-8 प्रदर्शित करता है, लेकिन यह गलत प्रतीत होता है। फ़ाइल में मेरी विकि के साथ समस्याएँ हैं, और checkfiletype.com वेबसाइट से पता चलता है कि यह ASCII है। इसलिए, शायद यह एक बग है जैसा कि आपने संकेत दिया हो सकता है।
अज़ीम ५ a


क्या यह संभव है कि UTF-8 के रूप में एन्कोड की गई फाइल में पहले तीन बाइट्स में "BOM" (बाइट ऑर्डर मार्क) हो। यह बीओएम यूटीएफ -8 के लिए अर्थहीन है क्योंकि बाइट ऑर्डर के बारे में केवल यूसीएस -2 / यूटीएफ -16 / यूसीएस -4 देखभाल। लेकिन कुछ संपादकों ने इसे UTF एन्कोडिंग मार्क के रूप में दुरुपयोग किया है।
ज़ैन लिंक्स

जवाबों:


1

ऐसी फाइलें जिनमें केवल ASCII अक्षर होते हैं, उन्हें ASCII और UTF-8 एन्कोडिंग में पहचान के रूप में दर्शाया जाता है। जब तक फ़ाइल में कम से कम एक गैर- ASCII वर्ण न हो, दोनों में कोई अंतर नहीं होता है।

जो भी आपकी समस्या पैदा कर रहा है वह एन्कोडिंग नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.