मैंने हमेशा माना है कि sort
बिना किसी अतिरिक्त तर्क के, शाब्दिक क्रम में एक फ़ाइल को सॉर्ट करेगा। हालाँकि आज मैं निम्नलिखित परीक्षण मामले में भाग गया:
sort test2.txt
a/a
a/c
a//c
a/d
जैसा कि आप देख सकते हैं कि तीसरी लाइन में दो स्लैश हैं, इसलिए दूसरी स्लैश एक ऐसी जगह है जहां पड़ोसी लाइनों में क्रमशः 'c' और 'd' अक्षर होते हैं। मुझे संदेह है कि '/' किसी भी कोड-पृष्ठ में 'c' और 'd' के बीच आता है, इसलिए मुझे लगता है कि डिफ़ॉल्ट तुलना एल्गोरिथ्म कड़ाई से शाब्दिक नहीं है।
क्या कुछ पूर्व-प्रसंस्करण है (जैसे गैर-अक्षरों को हटाना?) या विशेष मामलों (जैसे "एक या अधिक प्रतीकों का एक अनुक्रम प्रतीकों के किसी अन्य अनुक्रम के बराबर है?") प्रतीकों की तुलना करने के लिए।
मैंने man
पेज पढ़ा है sort
लेकिन मुझे वहाँ कोई ज्ञान नहीं मिला।
मैं उपयोग करता हूं
sort --version
sort (GNU coreutils) 8.5
Copyright (C) 2010 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
Written by Mike Haertel and Paul Eggert.
और मुझे वास्तव में आगे के विश्लेषण के लिए लाखों URL को क्रमबद्ध करने की आवश्यकता है, जो शाब्दिक आदेश मानता है - क्या कोई विकल्प हैं जो मैं sort
इसे प्राप्त करने के लिए पारित कर सकता हूं ?