मुझे यकीन है कि किसी को नीचे की आवश्यकता थी, लाइन द्वारा एक बड़ी .gz फ़ाइल को विभाजित करने का एक त्वरित तरीका क्या है? अंतर्निहित पाठ फ़ाइल में 120million पंक्तियाँ हैं। मेरे पास एक बार में पूरी फ़ाइल को गनज़िप करने के लिए पर्याप्त डिस्क स्थान नहीं है इसलिए मैं सोच रहा था कि क्या कोई व्यक्ति किसी bash / perl स्क्रिप्ट या टूल के बारे में जानता है जो फ़ाइल (या तो .gz या इनर .txt) को 3x 40mn लाइन फ़ाइलों में विभाजित कर सकता है। । यानी इसे कॉल करना:
bash splitter.sh hugefile.txt.gz 4000000 1
would get lines 1 to 40 mn
bash splitter.sh hugefile.txt.gz 4000000 2
would get lines 40mn to 80 mn
bash splitter.sh hugefile.txt.gz 4000000 3
would get lines 80mn to 120 mn
शायद इन समाधानों की एक श्रृंखला कर रहा है या क्या गनज़िप-सी को पूरी फ़ाइल को अनज़िप करने के लिए पर्याप्त स्थान की आवश्यकता होगी (यानी मूल समस्या): गनज़िप -c हैवीफ़ाइल। Txt.gz | सिर 4000000
नोट: मुझे अतिरिक्त डिस्क नहीं मिल सकती है।
धन्यवाद!