यह पाइपलाइन एक महत्वपूर्ण कारक (परिणाम देखें) द्वारा सबसे तेज अन्य उत्तर से तेज है। यह उपयोग करता है tr
और tac
। इसे 2 ASCII बाइट्स (\ x00- \ x7F) का उपयोग करने की आवश्यकता है जो आपके डेटा में मौजूद नहीं हैं।
\x00
आम तौर पर एक अच्छा विकल्प है, जैसा कि है \x01
, लेकिन आप किसी भी ASCII बाइट का उपयोग कर सकते हैं जो डेटा में नहीं है।
इस उदाहरण में, SPACE और TAB सीमांकक वर्ण के रूप में। डेलीमीटर मल्टी-बाइट या सिंगल हो सकता है। आउटपुट सीमांकक एक एकल स्थान है।
यहाँ आज्ञा है। फ़ाइल नाम numberof fields
_x दिखाता हैnumber of lines
<"$file" tr ' \t\n' '\0\0\1' |tr -s '\0' '\n' |tac |tr '\n' ' ' |tr '\1' '\n'
यदि आप अप्रयुक्त बाइट्स की जांच करना चाहते हैं, तो आप इस वैकल्पिक awk
स्क्रिप्ट के साथ पहले से जांच कर सकते हैं । कुल मिलाकर, इस वैकल्पिक स्क्रिप्ट को चलाने के दौरान, अन्य मेट्रों की तुलना में अभी भी काफी तेज है (अब तक :) .. यहाँ प्री-प्रोसेसिंग स्क्रिप्ट है।
o=($(<"$file" char-ascii-not-in-stream)); x="${o[0]}"; y="${o[1]}"
<"$file" tr ' \t\n' "$x$x$y" |tr -s "$x" '\n' |tac |tr '\n' ' ' | tr '$y' '\n' >"$file".$user
यह जागृत लिपि है: char-ascii-not-in-stream
#!/usr/bin/awk -f
{c[$0]} END{for(i=0;i<=127;i++) {if(sprintf("%c", i) in c);else {printf "\\%03o ",i}}}
इस स्क्रिप्ट के लिए समय का दूसरा सेट, समय शामिल है char-ascii-not-in-stream
।
Peter.O {tr,tac,tr} ==== file_10_x10000
real 0m0.013s 0m0.015s
user 0m0.020s 0m0.020s
sys 0m0.008s 0m0.012s
user11136 {python} ===== file_10_x10000
real 0m0.057s
user 0m0.048s
sys 0m0.008s
jmp {python} =========== file_10_x10000
real 0m0.160s
user 0m0.160s
sys 0m0.000s
rush {awk} ============= file_10_x10000
real 0m0.121s
user 0m0.120s
sys 0m0.000s
##############################################
Peter.O {tr,tac,tr} ==== file_1000_x1000
real 0m0.048s 0m0.059s
user 0m0.040s 0m0.040s
sys 0m0.040s 0m0.048s
user11136 {python} ===== file_1000_x1000
real 0m0.158s
user 0m0.136s
sys 0m0.028s
jmp {python} =========== file_1000_x1000
real 0m0.327s
user 0m0.320s
sys 0m0.008s
rush {awk} ============= file_1000_x1000
real 0m0.832s
user 0m0.820s
sys 0m0s012s
##############################################
Peter.O {tr,tac,tr} ==== file_1000000_x50
real 0m5.221s 0m6.458s
user 0m4.208s 0m5.248s
sys 0m2.624s 0m2.396s
user11136 {python} ===== file_1000000_x50
real 0m16.286s
user 0m10.041s
sys 0m5.148s
jmp {python} =========== file_1000000_x50
real 0m22.845s
user 0m20.705s
sys 0m1.140s
rush {awk} ============= file_1000000_x50
real 0m44.793s
user 0m43.583s
sys 0m0.848s
##############################################
perl -lane 'print join " ", reverse @F'