मेरे पास अरबी, अंग्रेजी, रूसी फाइलों का एक गुच्छा है जो utf-8 में एन्कोडेड हैं। पर्ल स्क्रिप्ट का उपयोग करके इन फ़ाइलों को संसाधित करने की कोशिश कर रहा है, मुझे यह त्रुटि मिलती है:
Malformed UTF-8 character (fatal)
इन फ़ाइलों की सामग्री को मैन्युअल रूप से जांचते हुए, मुझे उनमें कुछ अजीब अक्षर मिले। अब मैं फ़ाइलों से इन वर्णों को स्वचालित रूप से हटाने का एक तरीका ढूंढ रहा हूं।
इसे करने का कोई तरीका है?