लिनक्स पर, मेरे पास बहुत सारी फाइलों के साथ एक निर्देशिका है। उनमें से कुछ में गैर-एएससीआईआई अक्षर हैं, लेकिन वे सभी वैध यूटीएफ -8 हैं । एक कार्यक्रम में एक बग होता है जो इसे गैर-एएससीआईआई फ़ाइल नाम के साथ काम करने से रोकता है, और मुझे यह पता लगाना होगा कि कितने प्रभावित हैं। मैं इसके साथ ऐसा करने जा रहा था findऔर फिर गैर- ASCII वर्णों को प्रिंट करने के लिए एक grep करता हूं , और फिर wc -lनंबर खोजने के लिए एक करता हूं । यह grep होना जरूरी नहीं है; मैं किसी भी मानक यूनिक्स नियमित अभिव्यक्ति का उपयोग कर सकता हूं , जैसे पर्ल , sed , AWK , आदि।
हालाँकि, क्या 'किसी भी चरित्र के लिए एक नियमित अभिव्यक्ति है जो ASCII वर्ण नहीं है'?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]