मैं एक सौ html स्रोत कोड फ़ाइलों की एक जोड़ी है। मुझे <div>इनमें से प्रत्येक फ़ाइल से एक विशेष तत्व की सामग्री को निकालने की आवश्यकता है इसलिए मैं प्रत्येक फ़ाइल के माध्यम से लूप में एक स्क्रिप्ट लिखने जा रहा हूं। तत्व संरचना इस प्रकार है:
<div id='the_div_id'>
<div id='some_other_div'>
<h3>Some content</h3>
</div>
</div>
क्या कोई ऐसा तरीका सुझा सकता है जिसके द्वारा मैं the_div_idlinux कमांड लाइन का उपयोग करके div और सभी चाइल्ड एलिमेंट्स और कंटेंट को एक फाइल से निकाल सकूँ ?
hxselectकी तुलना में इनपुट प्रारूप के बारे में अधिक picky हैpup। उदाहरण के लिए, मैं हो रही हैInput is not well-formed. (Maybe try normalize?)साथhxselectजहांpupबस इसे पार्स करने।