मैं मैक ओएस एक्स 10.8 में कमांड लाइन उपयोगिता को कॉल करना चाहूंगा जो मुझे मानक पश्चिमी मैक ओएस रोमन एन्कोडिंग में सहेजी गई पाठ फ़ाइल को अधिक सामान्य यूटीएफ -8 में बदलने की क्षमता देता है।
मैं अपने द्वारा बनाए गए AppleScript से उपयोगिता को कॉल करूंगा। बहुत बड़े टेक्स्ट ब्लॉक के साथ काम करते समय AppleScript बेहद धीमा है। जैसे, मैं ओएस एक्स कमांड लाइन का उपयोग करके अपने पाठ पार्सिंग और रूपांतरण करना चाहता हूं। मुझे "sed" नामक एक टूल मिला है, जो मुझे टेक्स्ट पार्सिंग करने की अनुमति देता है। हालाँकि, अभी भी फ़ाइल के कई तत्व हैं जिन्हें साफ करने की आवश्यकता है, जो अक्षर कचरा के रूप में दिखाई देते हैं यदि फ़ाइल utf-8 (उदाहरण के लिए स्मार्ट उद्धरण और दीर्घवृत्त) के रूप में खोली जाती है।
मैं सोच रहा हूं कि पाठ एन्कोडिंग रूपांतरण के लिए फ़ाइल में सभी गैर-utf8 वर्णों को समाप्त करने में मदद मिल सकती है। हालाँकि, मैं यह नहीं देख सकता कि कैसे "sed" टेक्स्ट एन्कोडिंग को आसानी से बदल सकता है।
मैं पहले से ही टेम्प्लेट फ़ाइल को मैकक्रोमन के रूप में सहेजा हुआ हूँ, अंतर्निहित AppleScript रूटीन का उपयोग करके डिस्क पर।
क्या आप में से किसी के पास अंतर्निहित कमांड-लाइन टूल के रूप में कोई विचार है जो पाठ एन्कोडिंग को परिवर्तित कर सकता है? प्रदर्शन और बिल्ट-इन के लिए कमांड-लाइन, क्योंकि मेरी स्क्रिप्ट के अन्य उपयोगकर्ताओं के पास आवश्यक टूलसेट नहीं होगा यदि यह अंतर्निहित नहीं है।
आपकी सहायताके लिए धन्यवाद!