मैंने html फ़ाइलों को डाउनलोड करने के लिए wget का उपयोग किया, फ़ाइल में चित्र कहाँ संग्रहीत हैं?


15

फ़ायरफ़ॉक्स बहुत धीमी गति से लोड हो रहा था, इसलिए मैंने wgetHTML फ़ाइलों को सहेजने के लिए उपयोग करने का निर्णय लिया था। मैंने निम्न कमांड का उपयोग किया,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

फ़ाइलों को मेरे होम फ़ोल्डर में सहेजा गया है। लेकिन मुझे नहीं पता कि चित्र कहाँ संग्रहीत किए गए हैं Anki। मुझे उनका उपयोग करने की आवश्यकता है ।

तो चित्र कहाँ संग्रहीत हैं?


यह लेख विकल्प बताता है और वे कैसे उपयोगी हैं।
Wilf

जवाबों:


34

मैं यहाँ के बजाय --page-requisites( -pलघु के लिए) का उपयोग करना पसंद करता हूं -rक्योंकि यह वह सब कुछ डाउनलोड करता है जिसे पृष्ठ को प्रदर्शित करने की आवश्यकता होती है लेकिन कोई अन्य पृष्ठ नहीं है, और मुझे यह सोचने की ज़रूरत नहीं है कि मुझे किस तरह की फाइलें चाहिए।

वास्तव में मैं आमतौर पर कुछ का उपयोग कर रहा हूँ

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

इसका मतलब है की:

  • -E: .htmlयदि यह एक HTML फ़ाइल है, लेकिन फ़ाइल नाम के लिए आवेदन करें, लेकिन इसमें .htmlया इसके समान समाप्त नहीं होता है
  • -H: अन्य होस्ट से भी फाइलें डाउनलोड करें
  • -k: डाउनलोड करने के बाद किसी भी लिंक को इसमें कन्वर्ट करें ताकि वे डाउनलोड की गई फाइलों की ओर इशारा करें
  • -p: उचित ऑफ़लाइन देखने के लिए पृष्ठ को कुछ भी चाहिए डाउनलोड करें

मैं यहाँ की तलाश में आया था -H, और के बारे में जानने के लिए खुश था -Eऔर -kभी। धन्यवाद!
चार्ल्स क्लेटन

2

-r पैरामीटर का उपयोग करके अपनी छवियों सहित पूरे फ़ोल्डर को डाउनलोड करने में सक्षम होना चाहिए।

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

छवि फ़ाइलों को अलग से भी डाउनलोड कर रहा है

मुझे लगता है कि यह आदेश आपको मिल सकता है।

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

यह आपको छवियों और आपको किस प्रकार की फ़ाइलों को सहेजने के लिए स्थान निर्दिष्ट करने की अनुमति देता है। शायद छवियों को इस तरह से डाउनलोड करना आसान है।

स्रोत :

-r पुनरावर्ती पुनर्प्राप्ति को सक्षम करता है। अधिक जानकारी के लिए पुनरावर्ती डाउनलोड देखें।

-प्राथमिक उपसर्ग को सेट करता है जहां सभी फाइलें और निर्देशिका सहेजे जाते हैं।

केवल कुछ फ़ाइल प्रकारों को पुनर्प्राप्त करने के लिए एक श्वेतसूची सेट करता है। स्ट्रिंग्स और पैटर्न स्वीकार किए जाते हैं, और दोनों का उपयोग अल्पविराम से अलग की गई सूची में किया जा सकता है (जैसा कि ऊपर देखा गया है)। अधिक जानकारी के लिए फ़ाइलों के प्रकार देखें।

छवि फ़ाइलों को अपने फ़ोल्डर से कॉपी करना

मैंने देखा है कि वेबसाइट PNG छवि फ़ाइलों का उपयोग करती है। आप बस अपने फोल्डर से कॉपी कर सकते हैं। यह उस फ़ोल्डर में चलाया जाना चाहिए जहां आपने वेबपृष्ठ संग्रहीत किया था।

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget केवल पृष्ठ की HTML फ़ाइल को डाउनलोड करता है, पृष्ठ की छवियों को नहीं, क्योंकि पृष्ठ के HTML फ़ाइल में चित्र URL पर लिखे जाते हैं। आप जो चाहते हैं, उसे करने के लिए, -R(पुनरावर्ती) का उपयोग करें , -Aछवि फ़ाइल प्रत्यय के साथ --no-parentविकल्प, विकल्प, इसे चढ़ने के लिए नहीं, और --levelविकल्प के साथ 1

विशेष रूप से wget -R -A .jpg,.png,.gif --no-parent --level <url>

और भी बेहतर, अधिकांश ब्राउज़रों में ऑफ़लाइन देखने के लिए पृष्ठों को सहेजने के तरीके हैं

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.