मेरे पास कई ज़िप-फाइलें हैं जहां जर्मन umlauts (äüöÄÜÖß) के लिए एन्कोडिंग त्रुटियां हैं। वे दोनों फ़ाइल नाम में दिखाते हैं। ज़िप के साथ-साथ इस तरह शामिल निर्देशिकाओं और फ़ाइलों में शामिल हैं:
- फुनफ = फूउन्फ
- रैबर = राऊबेर
- Überfall = U╠êberfall
और इसी तरह। आमतौर पर मैं लिनक्स का उपयोग करता हूं, लेकिन इस मुद्दे के कारण मैंने एक विंडोज 7 वीएम की भी कोशिश की, लेकिन इसके परिणामस्वरूप समान एन्कोडिंग गड़बड़ हो जाती है। लिनक्स पर मैंने कनवम् और डिटॉक्स के साथ खेला, लेकिन कोई सफलता नहीं मिली।
जब मैं उपयोग करता हूं
- convmv -f iso-8859-1 -t utf8 --replace --notest -r *
मुझे "स्किपिंग, पहले से ही UTF-8" मिलता है।
इस बारे में कोई विचार?
find -type f -print0 |xargs -r -n1 -0 convmv -f WINDOWS-1252 -t UTF-8 --notest
यह वर्तमान dir से फ़ाइलों को आगे की ओर खोजता है और प्रत्येक फ़ाइल पर अलग से convmv चलाता है। फ़ाइलनाम को अशक्त सूची के रूप में जाना जाता है।