ब्लॉग को मिरर के साथ मिरर करें

मैं एक ब्लॉग, जैसे www.example.com, के साथ दर्पण की कोशिश कर रहा हूँ wget।

मैं निम्नलिखित विकल्पों के साथ wget का उपयोग करता हूं (शेल चर सही तरीके से प्रतिस्थापित किए गए हैं):

wget -m -p -H -k -E -np \
    -w 1 \
    --random-wait \
    --restrict-file-names=windows \
    -P $folder \
    -Q${quota}m \
    -t 3 \
    --referer=$url \
    -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
    -e robots=off \
    -D $domains
    -- $url

ब्लॉग में अन्य डोमेन पर रहने वाले चित्र शामिल हैं।

भले ही मैंने -pविकल्प निर्दिष्ट किया हो (लिंक की गई पृष्ठ परिसंपत्तियाँ डाउनलोड करें) जब तक मैं प्रत्येक -Dविकल्प में स्पष्ट रूप से निर्दिष्ट नहीं करता, तब तक ये चित्र डाउनलोड नहीं हो रहे हैं ।

अगर मैं -Dविकल्प को छोड़ देता हूं तो wget बाहर के हर लिंक का अनुसरण करेगा www.example.comऔर पूरे इंटरनेट को डाउनलोड करेगा।

क्या यह संभव है wgetकि प्रत्येक लिंक का पालन करें www.example.comऔर प्रत्येक पृष्ठ की आवश्यक संपत्ति को डाउनलोड करें, चाहे वे एक ही डोमेन पर रहते हों या मेरे बिना प्रत्येक डोमेन को स्पष्ट रूप से निर्दिष्ट करने के लिए नहीं हैं?

wget mirroring

— कोस्टा एंडरियनोपोलोस
स्रोत

मैं यह भी एक अच्छा जवाब खोजने के लिए प्यार करता हूँ। मैंने एक ही स्थिति में दौड़ लगाई है और एक भी ऐसा मंगलाचरण नहीं पा सका है जिसने यह किया है। मैंने wget -N -E -H -k -K -pपहली बार उपयोग करना समाप्त कर दिया , और गायब लिपि से जुड़े चित्रों को लाने के लिए एक स्क्रिप्ट के साथ आया।

— नींबू

इस के अनुसार , क्रैक इसके लिए एक हत्यारा है। मैं इसे अगली बार wget के बजाय एक शॉट दूँगा।

— नींबू

अपने ब्लॉग को मानकर (पृष्ठ की संपत्ति घटाकर) एक से अधिक डोमेन नहीं फैला रहा है, -D $domainsसाथ ही दोनों को हटाने का प्रयास करें -H। इसके बिना -Hअपने डोमेन के भीतर रहना चाहिए, लेकिन फिर भी डायरेक्ट पेज की संपत्ति को पुनः प्राप्त करें, तब भी जब वे एक अलग डोमेन पर हों।

— ब्लबरडाइब्लूब

नहीं, एकमात्र तरीका उन डोमेन को निर्दिष्ट करना है जिन्हें आप उपयोग करना चाहते हैं -D या --domains = [डोमेन सूची] (अल्पविराम से अलग सूची के रूप में)

— स्पार्क्स
स्रोत