मेरे पास Intel (R) Pentium (R) CPU G640 @ 2.80 GHz और 8 GB RAM वाला पीसी है। मैं EXT3 फाइल सिस्टम के साथ इस पर वैज्ञानिक लिनक्स 6.5 चला रहा हूं।
इस सेटअप पर, मैं sort -u
200 गीगाबाइट फ़ाइल पर सबसे तेज़ तरीका क्या कर सकता हूं ?
क्या मुझे फ़ाइल को छोटी फ़ाइलों (8 जीबी से छोटी) में विभाजित करना चाहिए, sort -u
उन्हें, उन्हें एक साथ रखना, फिर उन्हें फिर से एक अलग आकार में विभाजित करना, sort -u
फिर से, आदि? या कोई सॉर्टिंग स्क्रिप्ट्स, प्रोग्राम हैं जो मेरी सीमित मात्रा में रैम के साथ इस बड़ी फाइल को संभाल सकते हैं?
parallel
लिए जीएनयू की आवश्यकता होगी जो मुझे लगता है parallel
कि कुछ सिस्टम पर डिफ़ॉल्ट रूप से स्थापित किए गए अधिक्यूटाइल के बजाय है ।
sort(1)
पर अंतरिक्ष से बाहर चला सकता है /tmp
; यदि हां, तो आप पर्यावरण चर TMPDIR
, या ध्वज के साथ अस्थायी फ़ाइलों के लिए एक और क्षेत्र नामित कर सकते हैं-T=<tmpdir>
/tmp
।