मैं आमतौर पर httrack
किसी साइट से वेब सामग्री को डाउनलोड / मिरर करने के लिए उपयोग करता हूं ।
$ httrack http://2011.example.com -K -w -O . -%v --robots=0 -c1 %e0
इसके बाद यह चलता है कि आप एक निर्देशिका संरचना के साथ बचे हैं जो स्थानीय और ब्राउज़ करने योग्य है। उदाहरण के लिए:
$ ls -l
total 304
-rw-r--r-- 1 saml saml 4243 Aug 17 10:20 backblue.gif
-rw-r--r-- 1 saml saml 828 Aug 17 10:20 fade.gif
drwx------ 3 saml saml 4096 Aug 17 10:20 hts-cache
-rw-rw-r-- 1 saml saml 233 Aug 17 10:20 hts-in_progress.lock
-rw-rw-r-- 1 saml saml 1517 Aug 17 10:20 hts-log.txt
-rw------- 1 saml saml 271920 Aug 17 10:22 hts-nohup.out
-rw-r--r-- 1 saml saml 5141 Aug 17 10:20 index.html
drwxr-xr-x 10 saml saml 4096 Aug 17 10:21 2011.example.com
जैसा कि आप डाउनलोड करते हैं, आप निम्न प्रकार के आउटपुट देखेंगे:
Bytes saved: 21,89KiB Links scanned: 12/45 (+4)
Time: 2s Files written: 4
Transfer rate: 2,65KiB/s (2,65KiB/s) Files updated: 1
Active connections: 1 Errors: 7
Current job: parsing HTML file (57%)
request - 2011.example.com/cgi-bin/hostnames.pl 0B / 8,00KiB
इसे पृष्ठभूमि और / या गर्भपात किया जा सकता है और बाद में फिर से शुरू किया जा सकता है। यह सुविधाओं के मामले में हिमशैल का सिर्फ एक सिरा है। डाउनलोड को सेट करने और उसकी प्रगति होने के साथ ही इसकी निगरानी के लिए एक GUI भी है।
httrack
वेबसाइट पर और googling द्वारा व्यापक प्रलेखन है ।