मैंने पाया कि ASCII में सॉर्ट परिणाम:
स्रोत फ़ाइल test
:
1-
11-
1-a
11-a
ASCII का उपयोग करके सॉर्ट करें:
$ LANG=en_US.ascii sort test
1-
1-a
11-
11-a
और UTF-8 का उपयोग करना:
$ LANG=en_US.utf8 sort test
1-
11-
11-a
1-a
मुझे लगता है कि यह इतना सहज है, और यह शब्दकोष नहीं है।
क्या चरित्र '-' ( 002d
) हमेशा कम नहीं होता है [0-9]
( 0030-0039
)? UTF-8 कोलेशन में सामान्य नियम क्या है?
और इसे कैसे दरकिनार किया जाए, बस -
कम करें और फिर [0-9]
लिनक्स में UTF-8 के लिए अन्य पात्रों को अपरिवर्तित रखें? (तो यह का परिणाम को प्रभावित करता है सकते हैं ls --sort
, sort
आदि)
sort
जीएनयू कोरुटिल्स से 8.5 के साथ , "1-" हमेशा "11-" से पहले आता है, किसी भी स्थान के साथ।