मैं एक बड़े ओवरहाल से पहले एक काफी बड़ी साइट (20,000+ पृष्ठ) को दर्पण करने की कोशिश कर रहा हूं। मूल रूप से, मुझे नए पर काटने से पहले एक बैकअप की आवश्यकता होती है, जब हम अपनी ज़रूरत की कोई चीज़ भूल जाते हैं (हम लॉन्च के समय लगभग 1,000 पृष्ठ होंगे)। साइट को एक सीएमएस पर चलाया जाता है जिसे मैं आसानी से उपयोग करने योग्य डेटा से नहीं निकाल सकता, इसलिए मैं प्रतिलिपि को दांव के साथ बनाने की कोशिश कर रहा हूं।
मेरी समस्या यह है कि कमांड में --convert-links या -k की उपस्थिति के बावजूद, wget वास्तव में लिंक परिवर्तित नहीं करता है। मैंने झंडे के विभिन्न संयोजनों के एक जोड़े की कोशिश की है, लेकिन मैं उस आउटपुट को प्राप्त करने में सक्षम नहीं हूं जिसकी मुझे आवश्यकता है। हाल ही में असफल प्रयास था:
nohup wget --mirror -k -l10 -PafscSnapshot --html-extension -R *calendar* -o wget.log http://www.example.org &
मैंने --kup- रूपांतरित, और --convert -k के बजाय -k (ऐसा नहीं है कि यह मायने रखता है) को भी शामिल किया है। मैंने इसे बिना और -ए-एल के साथ किया है, फिर से कोई बात नहीं कि उन्हें कोई फर्क नहीं पड़ना चाहिए।
फ़ाइलों में परिणाम जिनके पास अभी भी लिंक हैं:
http://www.example.org/ht/d/sp/i/17770
//
होस्टनाम के बाद? मुझे आश्चर्य है कि अगर वह फेंक रहा हैwget
का पार्सर ...