सभी गैर- ASCII वर्ण और लाइन नंबर, जिस पर वे एक फ़ाइल में पाए जाते हैं जैसे एक कमांड लाइन उपयोगिता का उपयोग मुद्रित करने के लिए एक आसान तरीका है grep
, awk
, perl
, आदि?
मैं UTF-8 से ASCII में एक टेक्स्ट फ़ाइल की एन्कोडिंग को बदलना चाहता हूं, लेकिन ऐसा करने से पहले, फ़ाइल रूपांतरण दिनचर्या द्वारा प्रभावित अप्रत्याशित चरित्र परिवर्तनों से बचने के लिए गैर-ASCII वर्णों के सभी उदाहरणों को मैन्युअल रूप से बदलना चाहते हैं।
LC_ALL=C grep -n -P [$'\x80'-$'\xFF']
जहां पहला बिट टकराव को बंद कर देता है।