जब मैंने cut
आज उपयोग किया , तो मुझे पता चला कि यह एक चरित्र के रूप में UTF-8 चरित्र का इलाज नहीं करता है, लेकिन 3 वर्ण क्योंकि यह 3 बाइट्स लंबा है।
यह कई उपकरणों के लिए आम तौर पर सच लगता है।
क्या इसके संस्करण coreutils
UTF-8 से अवगत हैं?
मेरा locale
आउटपुट:
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
यहाँ है जब cut
काम नहीं करता है
echo 哈哈 | cut -c 2-
��哈
सही आउटपुट होना चाहिए
哈
यदि cut -c
मल्टीबाइट पात्रों के साथ काम किया जाता है।
cut
कमांड लाइन के कुछ उदाहरण भी जोड़ सकते हैं ?
echo ßßßß | cut -c 2-
-> �ßßß
( LANG=en_US.UTF-8
)
locale
ठीक से सेट किया ?locale
(W / o तर्क) कमांड इनवोकेशन का पढ़ना क्या है ?