बाइट ऑर्डर मार्क के बिना लिब्रे ऑफिस से UTF-8 टेक्स्ट निर्यात करना


5

लिबरऑफिस में, यदि मैं किसी दस्तावेज़ को फ़ाइल प्रकार "एन्कोडेड टेक्स्ट" के रूप में सहेजता हूं और "यूनिकोड (UTF-8)" को एन्कोडिंग के रूप में चुनता हूं, तो यह हमेशा टेक्स्ट के प्रारंभ में बाइट ऑर्डर मार्क (BOM) लिखता है। ऐसा तब भी किया जाता है जब ऐसा कोई भी चिह्न (जैसे आयातित ISO-8859-8 पाठ) के साथ शुरू हुआ पाठ निर्यात करता है। क्या BOM की पीढ़ी को दबाने का कोई तरीका है?

के अनुसार यूनिकोड डॉक्स : " जहां UTF-8 का उपयोग पारदर्शी रूप से 8-बिट वातावरण में किया जाता है, BOM का उपयोग किसी भी प्रोटोकॉल या फ़ाइल प्रारूप के साथ हस्तक्षेप करेगा जो शुरुआत में विशिष्ट ASCII वर्णों की अपेक्षा करता है "यह वास्तव में मैं चल रहा समस्या है, क्योंकि पाठ एक कार्यक्रम है कि एक प्रारंभिक BOM की उम्मीद नहीं है खिलाया जा रहा है।

जवाबों:


1

2018 लंबित है पैच एक से जुड़ा है प्रासंगिक 2011 बग रिपोर्ट

मार्टिन वैन जीजल 2018-02-26 18:48:14 यूटीसी

मैंने समीक्षा के लिए एक पैच बनाया। इस पैच के साथ यदि आप करते हैं:

1) फ़ाइल - & gt; के रूप रक्षित करें...
2) टाइप चुनें = "टेक्स्ट (एनकोडिंग चुनें)"
3) "टेक्स्ट का उपयोग करें ..." पर क्लिक करें
4) अंतिम संवाद में एक चेकबॉक्स होगा "बाइट-ऑर्डर-मार्क शामिल करें"। यदि आप इसे अन-चेक करते हैं, तो BOM आउटपुट में शामिल नहीं होगा।

वीडियो डेमो संलग्न

लिंक की समीक्षा करें: https://gerrit.libreoffice.org/#/c/50388/


यह जानकर अच्छा लगा कि यह आखिरकार संबोधित किया जा रहा है। BOM UTF-16 एन्कोडिंग के लिए उपयोगी है, लेकिन इसका कोई मूल्य नहीं है और इसे UTF-8 निर्यात के लिए हटा दिया जाना चाहिए। मैंने इस रिपोर्ट को बग रिपोर्ट थ्रेड में देखा: "मैं इससे सहमत हूं। लेकिन वर्तमान में हमारे पास बहुत कम डेवलपर्स हैं। इसमें कई साल लग सकते हैं। ऐसी स्थिति के लिए क्षमा करें।" यह सात साल से चल रहा है, इसलिए जिसने भी यह टिप्पणी की है वह स्पष्ट रूप से एक अच्छा अनुमानक है। :)
Ted Hopp

-1

सेव फॉर्म के साथ फाइल को सेव करते समय, ऑल फॉर्मैट के तहत टेक्स्ट एनकोडेड को चुनें, फिर सेव करें। जब फ़ाइल स्वरूप संवाद की पुष्टि होती है, तो पाठ एन्कोडेड प्रारूप का उपयोग करें चुनें। ASCII फ़िल्टर विकल्प संवाद फिर सामने आता है। पश्चिमी यूरोप (ASCII / US) का चयन करें और ठीक पर क्लिक करें। यदि आप उसके बाद हेक्स संपादक जैसे ब्लिस के साथ परिणामी फ़ाइल की जांच करते हैं, तो आप देखेंगे कि बीओएम चला गया है।


4
अच्छी तरह से BOM चला गया है, लेकिन फ़ाइल अब UTF-8 में एन्कोडेड नहीं है!
kreemoweet

1
और फिर कोई भी पश्चिमी यूरोप के चरित्र के साथ-साथ पश्चिमी यूरोप के पात्र 127 से ऊपर भी नहीं गए हैं
phuclv

क्षमा करें, लेकिन यह प्रश्न को बिल्कुल भी संबोधित नहीं करता है। मुझे बिना BOM के LibreOffice से UTF-8 टेक्स्ट को एक्सपोर्ट करने का तरीका चाहिए
Ted Hopp

@ अच्छी तरह से, क्या होगा यदि आप उस विकल्प को चुनते हैं जो वह कहता है? फ़ाइल पर "फ़ाइल" कमांड चलाएं, और देखें कि यह क्या कहता है। आप UTF-8 फ़ाइल के हेक्स को संपादित करने और BOM को हटाने का प्रयास कर सकते हैं। क्या आपने कोई कोशिश की?
barlop

1
@barlop - वह विकल्प जो गैर-ASCII वर्णों (जैसे, सिरिलिक, हिब्रू, ग्रीक, आदि) के स्थान पर फ़ाइल में कचरे का परिणाम बताता है, मैं यह देखने में विफल रहा कि "फ़ाइल" कमांड कैसे उपयोगी होगी। हेक्स को संपादित करना और बीओएम को हटाना यहां या वहां एक फ़ाइल के लिए काम कर सकता है, लेकिन उत्पादन कार्य के लिए पूरी तरह से अनुपयुक्त है। इसके अलावा, यह मेरे सवाल को बिल्कुल भी संबोधित नहीं करता है: क्या लिबर ऑफिस से बीओएम की पीढ़ी को दबाने का कोई तरीका है?
Ted Hopp
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.