संबंधित, लेकिन कोई संतोषजनक जवाब नहीं: मैं एक बड़ी पाठ फ़ाइल को 500 शब्दों या उसके अंशों में कैसे विभाजित कर सकता हूं?
मैं एक टेक्स्ट फ़ाइल ( http://mattmahoney.net/dc/text8.zip ) को> 10 ^ 7 शब्दों के साथ एक पंक्ति में लेने की कोशिश कर रहा हूं , और इसे प्रत्येक एन शब्दों के साथ लाइनों में विभाजित करता हूं । मेरा वर्तमान दृष्टिकोण काम करता है, लेकिन काफी धीमा और बदसूरत है (शेल स्क्रिप्ट का उपयोग करके):
i=0
for word in $(sed -e 's/\s\+/\n/g' input.txt)
do
echo -n "${word} " > output.txt
let "i=i+1"
if [ "$i" -eq "1000" ]
then
echo > output.txt
let "i=0"
fi
done
मैं इसे कैसे तेज या अधिक कॉम्पैक्ट बना सकता हूं, इस पर कोई सुझाव?