मैं वेब पेज के सभी बाहरी लिंक कैसे निकालूं और उन्हें एक फ़ाइल में सहेजूं?

11

यदि आपके पास कोई कमांड लाइन टूल है जो बहुत अच्छा होगा।

linux command-line

— RogerioO
स्रोत

18

आपको 2 उपकरण चाहिए, lynx और awk , इसे आज़माएं:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' > links.txt

यदि आपको नंबरिंग लाइन की आवश्यकता है, तो कमांड nl का उपयोग करें , यह कोशिश करें:

$ lynx -dump http://www.google.com.br | awk '/http/{print $2}' | nl > links.txt

— Ielton
स्रोत

मुझे नहीं लगता कि यह रिश्तेदार के लिए काम करेगा

— श्रीधर सरनोबत

8

यहाँ लेल्टन के उत्तर में सुधार किया गया है: आपको लिनेक्स के लिए कुछ उपयोगी विकल्प नहीं मिलेंगे।

lynx -listonly -nonumbers -dump http://www.google.com.br

अगर आपको नंबर चाहिए

lynx -listonly -dump http://www.google.com.br

— मैक्स
स्रोत

0

मैं स्क्रीन स्क्रैपिंग तकनीकों पर सुंदर सूप की सिफारिश करूंगा।

— वेस्ले
स्रोत

0

अगर कमांड लाइन एक बल नहीं है तो आप कॉपी ऑल लिंक फ़ायरफ़ॉक्स एक्सटेंशन का उपयोग कर सकते हैं ।

— माजिद आज़मी
स्रोत