मेरे पास बहुत अलग श्रृंखला है जिसमें कोई अलग चरित्र नहीं है, नीचे दिए गए प्रारूप में:
http://example.comhttp://example.nethttp://example.orghttp://etc...
मैं चाहता हूं कि प्रत्येक URL एक नई पंक्ति में हो। मैंने "http: //" के सभी उदाहरणों को "\ nhttp: //" के साथ प्रयोग करके इसे करने की कोशिश की
sed 's_http://_\nhttp://_g' urls.txt
लेकिन एक विभाजन दोष होता है (स्मृति उल्लंघन)। मैं केवल यह बता सकता हूं कि फ़ाइल का सरासर आकार (यह 100GB से अधिक है) सेड कुछ सीमा से अधिक हो रहा है।
मैं फ़ाइल को प्रसंस्करण के लिए कई छोटी फ़ाइलों में विभाजित कर सकता था, लेकिन "http: //" के सभी उदाहरणों को बरकरार रखने की आवश्यकता होगी।
क्या ऐसा करने के लिए इससे अच्छा तरीका है?