मैं एक सौ html स्रोत कोड फ़ाइलों की एक जोड़ी है। मुझे <div>
इनमें से प्रत्येक फ़ाइल से एक विशेष तत्व की सामग्री को निकालने की आवश्यकता है इसलिए मैं प्रत्येक फ़ाइल के माध्यम से लूप में एक स्क्रिप्ट लिखने जा रहा हूं। तत्व संरचना इस प्रकार है:
<div id='the_div_id'>
<div id='some_other_div'>
<h3>Some content</h3>
</div>
</div>
क्या कोई ऐसा तरीका सुझा सकता है जिसके द्वारा मैं the_div_id
linux कमांड लाइन का उपयोग करके div और सभी चाइल्ड एलिमेंट्स और कंटेंट को एक फाइल से निकाल सकूँ ?
hxselect
की तुलना में इनपुट प्रारूप के बारे में अधिक picky हैpup
। उदाहरण के लिए, मैं हो रही हैInput is not well-formed. (Maybe try normalize?)
साथhxselect
जहांpup
बस इसे पार्स करने।