लिनक्स पर, मेरे पास बहुत सारी फाइलों के साथ एक निर्देशिका है। उनमें से कुछ में गैर-एएससीआईआई अक्षर हैं, लेकिन वे सभी वैध यूटीएफ -8 हैं । एक कार्यक्रम में एक बग होता है जो इसे गैर-एएससीआईआई फ़ाइल नाम के साथ काम करने से रोकता है, और मुझे यह पता लगाना होगा कि कितने प्रभावित हैं। मैं इसके साथ ऐसा करने जा रहा था find
और फिर गैर- ASCII वर्णों को प्रिंट करने के लिए एक grep करता हूं , और फिर wc -l
नंबर खोजने के लिए एक करता हूं । यह grep होना जरूरी नहीं है; मैं किसी भी मानक यूनिक्स नियमित अभिव्यक्ति का उपयोग कर सकता हूं , जैसे पर्ल , sed , AWK , आदि।
हालाँकि, क्या 'किसी भी चरित्र के लिए एक नियमित अभिव्यक्ति है जो ASCII वर्ण नहीं है'?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]