लाइनों की संख्या के अनुसार एक पाठ फ़ाइल को विभाजित करने की कमान


16

स्थिति:

मेरे पास एक पाठ फ़ाइल है जो लगभग 1.5GB है जिसमें 4000000लाइनों के बारे में है।

मैं इसे आयात करना चाहता हूं Libreoffice calcऔर जैसा कि आप जानते हैं कि आप इस विशाल फ़ाइल को बड़ी संख्या में लाइनों के साथ आयात नहीं कर सकते हैं (मुझे लगता है कि अधिकतम 65000 लाइन है)।

वैसे भी मुझे क्या चाहिए एक साधारण कमांड है जो इस फाइल को प्रत्येक फाइल में लाइनों की संख्या के साथ छोटी फाइलों में विभाजित कर सकती है <65000 लाइन।


@ ठाकरमैनिया: किया।
तरुण

जवाबों:


19

आप splitकमांड का उपयोग कर सकते हैं :

split -l N /path-to-file

जहाँ N अधिकतम पंक्तियों की संख्या है जो एक फ़ाइल में हो सकती है।

यह कमांड फाइल को छोटी फाइलों में से प्रत्येक में N संख्या रेखाओं के साथ विभाजित करेगा ।

man splitअधिक जानकारी के लिए उपयोग करें ।


3

यदि आप विभाजन का उपयोग करते हैं और कई फाइलें बनाते हैं तो आपकी अगली समस्या यह होगी कि उन सभी फाइलों में उस डेटा को हेरफेर करने के लिए Calc का उपयोग कैसे किया जाए। और वह एक समस्या को दूसरे पर डाल रहा है। 65000 लाइनों के साथ यह 62 (!) पेज होगा।

आप सिर्फ गलत टूल का उपयोग कर रहे हैं। डेटा आयात करने के लिए Libreoffice Base या MySQL का उपयोग करें और फिर उस डेटा पर गणना और / या हेरफेर करने के लिए Libreoffice Calc का उपयोग करें।

इस सीमा के बारे में कि आप उपयोग कर रहे हैं लिबरऑफिसवर्सन पर निर्भर करता है:

  • प्री 3.3.3: सीमा 65 536 पंक्तियाँ हैं
  • 3.3.3 और बाद में: 1 048 576 पंक्तियाँ (1M)

यदि आप चाहते हैं कि आप 4 पृष्ठों के साथ 3.3 मीटर + के साथ 4 मीटर रिकॉर्ड कर सकते हैं लेकिन लिब्रे ऑफिस का बेस मॉड्यूल पर्याप्त नहीं होने पर लगभग कोई पंक्ति सीमा के साथ आयात कर सकता है। यहाँ यह कैसे करना है में एक परिचय है और यहाँ आयात फ़ाइल के साथ एक उदाहरण डेटाबेस है । आधार में डेटा को हेरफेर करना आसान और त्वरित है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.