मेरे पास लगभग 200 जीबी लॉग डेटा प्रतिदिन उत्पन्न होता है, लगभग 150 विभिन्न लॉग फ़ाइलों के बीच वितरित किया जाता है।
मेरे पास एक स्क्रिप्ट है जो फ़ाइलों को एक अस्थायी स्थान पर ले जाती है और अस्थायी निर्देशिका पर एक टार-बज़ 2 करती है।
मुझे अच्छे परिणाम मिलते हैं क्योंकि 200 जीबी लॉग लगभग 12-15 जीबी तक संकुचित होते हैं।
समस्या यह है कि यह फ़ाइलों को संपीड़ित करने के लिए हमेशा के लिए लेता है। क्रॉन नौकरी दैनिक पर 2:30 पूर्वाह्न चलाता है और 5 तक चलाने के लिए जारी है: 00-6: 00 PM।
क्या संपीड़न की गति में सुधार करने और तेजी से काम पूरा करने का एक तरीका है? कोई विचार?
अन्य प्रक्रियाओं और सभी के बारे में चिंता न करें, वह स्थान जहां संपीड़न होता है एक NAS पर है , और मैं एक समर्पित VM पर NAS माउंट कर सकता हूं और वहां से संपीड़न स्क्रिप्ट चला सकता हूं ।
यहाँ संदर्भ के लिए शीर्ष का उत्पादन है :
top - 15:53:50 up 1093 days, 6:36, 1 user, load average: 1.00, 1.05, 1.07
Tasks: 101 total, 3 running, 98 sleeping, 0 stopped, 0 zombie
Cpu(s): 25.1%us, 0.7%sy, 0.0%ni, 74.1%id, 0.0%wa, 0.0%hi, 0.1%si, 0.1%st
Mem: 8388608k total, 8334844k used, 53764k free, 9800k buffers
Swap: 12550136k total, 488k used, 12549648k free, 4936168k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
7086 appmon 18 0 13256 7880 440 R 96.7 0.1 791:16.83 bzip2
7085 appmon 18 0 19452 1148 856 S 0.0 0.0 1:45.41 tar cjvf /nwk_storelogs/compressed_logs/compressed_logs_2016_30_04.tar.bz2 /nwk_storelogs/temp/ASPEN-GC-32459:nkp-aspn-1014.log /nwk_stor
30756 appmon 15 0 85952 1944 1000 S 0.0 0.0 0:00.00 sshd: appmon@pts/0
30757 appmon 15 0 64884 1816 1032 S 0.0 0.0 0:00.01 -tcsh
tar.bz2
फ़ाइल पर लिखें ?
top
आउटपुट दिखाता है कि आपकी एकल-थ्रेडेड bzip2
प्रक्रिया एक कोर को अधिकतम कर रही है, लेकिन यह कि आप इसे क्वाड-कोर सिस्टम पर चला रहे हैं (एक प्रक्रिया 100% सीपीयू -> 25.1%
उपयोगकर्ता-स्पेस सीपीयू समय, 74% निष्क्रिय)। इसलिए मामूली बदलावों के साथ, आप 4 गुना तेजी से जा सकते हैं, जब तक कि कुछ और अड़चन न बने। गाइल्स उत्तर को ध्यान से पढ़ें। संपीड़न करने के लिए डेटा रखने वाले डिस्क के रूप में उसी बॉक्स में सीपीयू का उपयोग करने पर विचार करें। (आप अपनी कुछ फ़ाइलों को एक बॉक्स पर, दूसरे पर दूसरों को और बाद में संग्रहित कर सकते हैं, इसलिए दोनों CPU का उपयोग किया जाता है।)