HTML पाठ फ़ाइलों को पाठ फ़ाइल में निकालें


0

मेरे पास बहुत सी HTML फ़ाइलों वाला एक फ़ोल्डर है, मैं केवल इस HTML के शरीर में निहित पाठ को txt फ़ाइल में निकालना चाहूंगा, मैं यह कैसे कर सकता हूं?

जवाबों:


1

आप निर्देशिका में प्रत्येक फ़ाइल पर पुनरावृत्ति कर सकते हैं और HTML को प्लेनटेक्स्ट को रेंडर करने के लिए एक कमांड-लाइन ब्राउज़र जैसे lynx या w3m का उपयोग कर सकते हैं और इसे टेक्स्ट फ़ाइल में सहेज सकते हैं।

लिंक्स उदाहरण:

lynx -dump in.html > out.txt

w3m उदाहरण:

w3m -dump in.html > out.txt
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.