[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
"" सर्वर "" में है: 8 GByte RAM + 16 GByte SWAP, x> 300 GByte मुक्त स्थान, amd64, डेस्कटॉप CPU। वैज्ञानिक लिनक्स 6.6। LOAD बनाने के लिए इस पर और कुछ नहीं चलता है। कुछ सेकंड के बाद अवाक गर्भपात हो जाता है .. out.txt ~ 1.6 GByte है। GNU Awk 3.1.7।
प्रश्न : मैं लाइनों के क्रम को बनाए रखते हुए डुप्लिकेट लाइनों को कैसे हटा सकता हूं? मामला भी महत्वपूर्ण है, पूर्व: "ए" और "ए" दो अलग लाइन है, इसे रखना होगा। लेकिन "ए" और "ए" डुप्लिकेट है, केवल पहले एक की आवश्यकता है।
उत्तर किसी भी चीज़ में हो सकता है .. अगर जागना इसके लिए अच्छा नहीं है .. तो perl / sed .. समस्या क्या हो सकती है?
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
अद्यतन: मैंने एक आरएचईएल मशीन पर यह कोशिश की, यह गर्भपात नहीं करता है, लेकिन मेरे पास इसे खत्म करने के लिए इंतजार करने का समय नहीं था .. क्यों एसएल लिनक्स आरएचईएल से अलग नहीं है?
अद्यतन: मैं एक Ubuntu 14 आभासी gues पर कोशिश कर रहा हूँ .. अब तक यह काम करता है! यह एक ulimit समस्या नहीं है: mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
दो मशीनों में संस्करण क्या हैं ?
out.txt
? यदि आप इसे एक छोटी फ़ाइल पर आज़माते हैं तो क्या यह एक ही कमांड काम करता है? मशीन पर कितने उपयोगकर्ता? क्या प्रक्रिया के लिए पर्याप्त उपलब्ध स्मृति थी? क्या इनपुट फ़ाइल की लाइन 8547098 के बारे में कुछ खास है?