मुझे सभी गैर- ASCII (\ x00- \ x7F) वर्णों को एक स्थान से बदलने की आवश्यकता है। मुझे आश्चर्य है कि पायथन में यह मृत-आसान नहीं है, जब तक कि मैं कुछ याद नहीं कर रहा हूं। निम्न फ़ंक्शन केवल सभी गैर- ASCII वर्णों को निकालता है:
def remove_non_ascii_1(text):
return ''.join(i for i in text if ord(i)<128)
और यह गैर-ASCII वर्णों को वर्ण कोड बिंदु में बाइट्स की मात्रा के अनुसार रिक्त स्थान की मात्रा के –
साथ प्रतिस्थापित करता है (अर्थात वर्ण को 3 स्थानों से बदल दिया जाता है):
def remove_non_ascii_2(text):
return re.sub(r'[^\x00-\x7F]',' ', text)
मैं एक ही स्थान के साथ सभी गैर-एएससीआईआई पात्रों को कैसे बदल सकता हूं?
के असंख्य के समान अतः सवाल , कोई भी पता चरित्र प्रतिस्थापन के रूप में विरोध किया करने के लिए अलग करना , और इसके साथ ही सभी गैर-ascii नहीं वर्ण एक विशिष्ट चरित्र को संबोधित।