एक से जुड़े सभी वेबपेजों को कैसे बचाया जाए


15

मैं इस वेबपृष्ठ और इसके द्वारा लिंक किए गए सभी पृष्ठों को सहेजना चाहूंगा । और सहेजे गए वेबपृष्ठों के बीच समान लिंकिंग होने की उम्मीद है।

क्या प्रत्येक जुड़े पृष्ठों को खोलने और सहेजने के बजाय कुछ तरीके हैं?

जवाबों:


12

आप वह कर सकते हैं जो आप wget कमांड लाइन उपयोगिता के साथ करना चाहते हैं । यदि आप इसे -rविकल्प प्रदान करते हैं , तो यह वेब पृष्ठों को पुन: डाउनलोड करेगा। उदाहरण के लिए:

wget -r http://mat.gsia.cmu.edu/orclass/integer/integer.html

यह उस वेबपृष्ठ को डाउनलोड करेगा और इससे जुड़ी कुछ भी सामग्री। आप इसे केवल एक निश्चित स्तर के स्तर पर ही पुनर्जीवित कर सकते हैं, ऐसा करने के लिए, आप बस -rएक संख्या प्रदान करते हैं । जैसे:

wget -r 5 http://mat.gsia.cmu.edu/orclass/integer/integer.html

@ मर्क: धन्यवाद! अब मैं mat.gsia.cmu.edu/orclass डाउनलोड करने का प्रयास करता हूं और इसके द्वारा कमांड wget -r mat.gsia.cmu.edu/orclass पृष्ठों का उपयोग करता हूं । wget एक निर्देशिका mat.gsia.cmu.edu बनाएगा, जिसके तहत मैं निर्दिष्ट करूँगा और इसके अंतर्गत पृष्ठ डाउनलोड करूँगा। लेकिन डाउनलोड किए गए पृष्ठों के बीच लिंक उनके रास्तों में mat.gsia.cmu.edu नहीं है, इसलिए यह एक समस्या बन जाती है और मैं लिंक पर क्लिक करके एक पृष्ठ से दूसरे पृष्ठ पर नहीं जा सकता। मैं सोच रहा था कि समस्या को क्यों और कैसे हल किया जाए? धन्यवाद!
टिम

मुझे नहीं लगता कि आप बाहरी लिंक @Tim को पुन: डाउनलोड कर सकते हैं।
वफ़र

क्या "बाहरी लिंक" का मतलब मौजूदा पथ के तहत नहीं है?
टिम

@ समय: बाहरी लिंक से मेरा मतलब उन लिंक्स से है जो mat.gsi.cmu.edu के बाहर संदर्भित करते हैं
Wuffers

1
@ समय: ओह, ठीक है। गलतफहमी के लिए खेद है। मुझे लगता है कि आप HTML फ़ाइलों को संपादित करने और उन्हें काम करने की कोशिश करने के लिए संपादन करने का प्रयास कर सकते हैं।
वफ़र्स

11

यह धागा अभी पुराना है, लेकिन अन्य लोग इसे देख सकते हैं। धन्यवाद, वफ़र्स, मुझे सही दिशा में इंगित करने के लिए, लेकिन, वफ़र्स के जवाब पर विस्तार करने के लिए: वाइज़ के एक आधुनिक संस्करण में लिंक को फिर से शुरू करने और उन्हें स्थानीय रिश्तेदार लिंक होने के लिए पैच करने के लिए कई उपयोगी विकल्प हैं ताकि आप एक स्थानीय प्रतिलिपि नेविगेट कर सकें। एक वेब साइट की। स्थानीय लिंक पैच करने के लिए -r विकल्प का उपयोग करने के लिए -r विकल्प का उपयोग करें, -H विकल्प मूल एक के अलावा अन्य डोमेन में पार करने के लिए, -D विकल्प को सीमित करने के लिए कि आप किस डोमेन में पार करते हैं, -l विकल्प को सीमित करने के लिए पुनरावृत्ति की गहराई, और -p विकल्प यह सुनिश्चित करने के लिए कि आपके ट्रैवर्सल की पत्तियों में वह सब कुछ है जो उन्हें सही ढंग से प्रदर्शित करने की आवश्यकता है। उदाहरण के लिए, निम्नलिखित एक पेज डाउनलोड करेगा और वह सब कुछ जो इसे तुरंत लिंक करता है, इसे स्थानीय रूप से ब्राउज़ करने योग्य बनाता है,

wget -r -l 1 -p -k -H -D domain.com,relateddomain.com http://domain.com/page/in/domain

ऊपर दिए गए कमांड के समान, मैं बाहरी डेटा के मेगाबाइट को डाउनलोड किए बिना अपने स्थानीय डिस्क पर, बाहरी लिंक के साथ एक विकी पृष्ठ का एक हिस्सा डाउनलोड करने में सक्षम था। अब, जब मैं अपने ब्राउज़र में रूट पेज खोलता हूं, तो मैं इंटरनेट कनेक्शन के बिना पेड़ को नेविगेट कर सकता हूं। एकमात्र अड़चन यह थी कि रूट पेज को उपनिर्देशिकाओं में दफन किया गया था और मुझे इसे प्रदर्शित करने के लिए सुविधाजनक बनाने के लिए एक शीर्ष-स्तरीय पुनर्निर्देशन पृष्ठ बनाना था। इसे ठीक करने के लिए कुछ परीक्षण और त्रुटि हो सकती है। Wget मैन पेज पढ़ें और प्रयोग करें।


4

आप क्रैक जैसे वेबसाइट क्रॉलर का उपयोग कर सकते हैं , जो मुफ़्त है।

वेबसाइट से;

[कैंट्रैक] आपको इंटरनेट से एक स्थानीय निर्देशिका में वर्ल्ड वाइड वेब साइट डाउनलोड करने की अनुमति देता है, जो सभी निर्देशिकाओं का पुन: निर्माण कर रहा है, आपके कंप्यूटर से सर्वर से HTML, छवियां और अन्य फाइलें प्राप्त कर रहा है। HTTrack मूल साइट के सापेक्ष लिंक-संरचना की व्यवस्था करता है। बस अपने ब्राउज़र में "प्रतिबिंबित" वेबसाइट का एक पृष्ठ खोलें, और आप साइट को लिंक से लिंक तक ब्राउज़ कर सकते हैं, जैसे कि आप ऑनलाइन देख रहे थे।


1
+1 उत्कृष्ट अनुप्रयोग! लेकिन यह सभी लिंक किए गए ज़िप फ़ाइलों को भी हथियाना है, जो मैं नहीं चाहता था। लेकिन फिर मुझे पहले निर्देश पढ़ना चाहिए था!
फिनलेबोब

हाँ, यह फ़ाइलों को डाउनलोड करेगा तो सभी लिंक का पालन करेगा। (@Finlaybob क्या आप जानते हैं कि आपकी प्रोफ़ाइल पर सूचीबद्ध मुखपृष्ठ हैक कर लिया गया है?)
RJFalconer

मैं नहीं था! मैं इसे देखूंगा - मुझे बताने के लिए धन्यवाद!
फिनालेबॉब
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.