मेरे पास कई ज़िप-फाइलें हैं जहां जर्मन umlauts (äüöÄÜÖß) के लिए एन्कोडिंग त्रुटियां हैं। वे दोनों फ़ाइल नाम में दिखाते हैं। ज़िप के साथ-साथ इस तरह शामिल निर्देशिकाओं और फ़ाइलों में शामिल हैं:
- फुनफ = फूउन्फ
- रैबर = राऊबेर
- Überfall = U╠êberfall
और इसी तरह। आमतौर पर मैं लिनक्स का उपयोग करता हूं, लेकिन इस मुद्दे के कारण मैंने एक विंडोज 7 वीएम की भी कोशिश की, लेकिन इसके परिणामस्वरूप समान एन्कोडिंग गड़बड़ हो जाती है। लिनक्स पर मैंने कनवम् और डिटॉक्स के साथ खेला, लेकिन कोई सफलता नहीं मिली।
जब मैं उपयोग करता हूं
- convmv -f iso-8859-1 -t utf8 --replace --notest -r *
मुझे "स्किपिंग, पहले से ही UTF-8" मिलता है।
इस बारे में कोई विचार?
find -type f -print0 |xargs -r -n1 -0 convmv -f WINDOWS-1252 -t UTF-8 --notest यह वर्तमान dir से फ़ाइलों को आगे की ओर खोजता है और प्रत्येक फ़ाइल पर अलग से convmv चलाता है। फ़ाइलनाम को अशक्त सूची के रूप में जाना जाता है।