ऑफ़लाइन उपयोग के लिए मीडियाविकि कैसे डंप करें?


16

मैं साप्ताहिक आधार पर मीडियाविकि साइट का एक ऑफ़लाइन संस्करण बनाने में सक्षम होना चाहूंगा।

DumpHTML विस्तार वास्तव में, मैं क्या चाहते हैं करता है के रूप में यह सभी लेख और मीडिया फ़ाइलों उदासीनता, लेकिन मैं, सभी लेख फेंक दिया है की किसी भी सूचकांक नहीं देख सकते हैं तो मैं डंप में नेविगेट नहीं कर सकते।

XML डंप फ़ीचर MediaWiki के बारे में पढ़ना , मुझे आश्चर्य है कि क्या यह संभव है कि इन फ़ाइलों को देखने के लिए किसी प्रोग्राम का उपयोग किया जाए या शायद उन्हें html में परिवर्तित किया जाए?

या फिर मीडियाविकि साइट के ऑफ़लाइन संस्करण बनाने के अन्य तरीके हैं?


क्या आपको वास्तव में एक सूचकांक की आवश्यकता है? बस शुरू Main Pageकरें और वहां से लिंक का पालन करें।
इल्मरी करोनन

यहां MediaWiki साइट का एक स्थिर संस्करण बनाने के लिए Cam Webb के निर्देश हैं । यहाँ मेरे अपने हैं , अगर वे किसी की मदद करते हैं। दोनों स्थैतिक परिणाम के लिंक देते हैं ( मेरा यहाँ )।
एलन पर माइकल एलन

जवाबों:


8

आप एक वेबक्रॉलर टूल का उपयोग कर सकते हैं जो साइट को HTML फ़ाइलों के रूप में बचाएगा। सभी लिंक परिवर्तित हो जाएंगे, इसलिए आप मुख्य पृष्ठ खोल सकते हैं, कह सकते हैं और फिर लिंक पर क्लिक करके सभी साइट पर पहुंच सकते हैं।

इन उपकरणों की एक संख्या उपलब्ध हैं। मैं wget का उपयोग करता हूं , जो कमांड लाइन आधारित है और इसमें हजारों विकल्प हैं, इसलिए बहुत अनुकूल नहीं है। हालाँकि यह काफी शक्तिशाली है।

उदाहरण के लिए, यहाँ कमांड लाइन है जिसका उपयोग मैंने अपने मीडियाविकि साइट को डंप करने के लिए किया था। मेरा सुझाव है कि आप प्रत्येक विकल्प को स्वयं उपयोग करने से पहले समझ लें:

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

10

आप विकिमीडिया डंप साइट-pages-articles.xml.bz2 से ले सकते हैं और उन्हें विकीटाक्सी (ऊपरी बाएं कोने में डाउनलोड) के साथ संसाधित कर सकते हैं । विकिटाक्सी आयात उपकरण फ़ाइल के बाहर (विकिपीडिया के लिए लगभग 15 जीबी) फ़ाइल बनाएगा । लेखों के माध्यम से खोज करने के लिए उस फ़ाइल का उपयोग विकीएक्सटी कार्यक्रम द्वारा किया जाएगा। अनुभव ब्राउज़र अनुभव के समान है।.taxi.bz2

या आप कीवीक्स का उपयोग कर सकते हैं , तेजी से सेट अप करने के लिए क्योंकि यह पहले से ही संसाधित डंप ( .zimफाइलें) प्रदान करता है । जैसा कि टिप्पणी में निर्दिष्ट किया गया है कि कीवीक्स के लिए अन्य मीडियाविकि साइटों को लेने के लिए mwofflinerउपयोग किया जा सकता है, यह सभी के साथ काम नहीं कर सकता है क्योंकि उनके पास कस्टम मतभेद हो सकते हैं लेकिन यह एकमात्र संस्करण है जो मैं भर में आया था।

विकिमीडिया सामान को साथ ले जाना wgetअच्छा अभ्यास नहीं है। अगर बहुत से लोग यह करेंगे कि यह साइटों को अनुरोधों से भर सकता है।


बाद में उस केस के लिए संपादित करें जिसे आप ऑफ़लाइन भी चाहते हैं:

XOWA प्रोजेक्ट

यदि आप विकिपीडिया का पूर्ण दर्पण (चित्रों सहित) पूर्ण एचटीएमएल प्रारूपण करना चाहते हैं जो कि ३० घंटे में डाउनलोड हो जाएगा , तो आपको इसका उपयोग करना चाहिए:

अंग्रेजी विकिपीडिया में बहुत अधिक डेटा है। 20.0+ GB टेक्स्ट के साथ 13.9+ मिलियन पेज हैं, साथ ही 3.7+ मिलियन थंबनेल भी हैं।

XOWA :

यह सब आपके कंप्यूटर पर सेट करना एक त्वरित प्रक्रिया नहीं होगी ... आयात को स्वयं 80GB डिस्क स्थान और पाठ संस्करण के लिए पांच घंटे के प्रसंस्करण समय की आवश्यकता होगी। यदि आप चित्र चाहते हैं, तो संख्या 100GB डिस्क स्थान और 30 घंटे के प्रसंस्करण समय तक बढ़ जाती है। हालांकि, जब आप कर रहे हैं, तो आपके पास एक पूर्ण, हाल ही में अंग्रेजी विकिपीडिया की छवियों के साथ प्रतिलिपि होगी जो 128 जीबी एसडी कार्ड पर फिट हो सकते हैं।

लेकिन ऑफ़लाइन संस्करण ऑनलाइन संस्करण की तरह बहुत अधिक है, इसमें फ़ोटो आदि शामिल हैं: (मैंने पूरी तरह से ऑफ़लाइन लेख का परीक्षण किया) यहाँ छवि विवरण दर्ज करें


बाद में संपादित करें यदि उपरोक्त में से कोई भी लागू न हो:

अगर विकी विकिमीडिया का हिस्सा नहीं है या उसके पास एक डंप नहीं है, तो गीथूब पर एक प्रोजेक्ट है जो डाउनलोड करता है कि विकी इसके उपयोग का उपयोग करता है:

WikiTeam - विकिपीडिया से लेकर सबसे नन्हे विकियों तक, हम विकी को संग्रहित करते हैं


1
एक कस्टम मीडियाविकी इंस्टॉलेशन को डंप करने के मामले में, XOWA ऐसा करने में काफी सक्षम है (कुछ मुद्दे मौजूद हो सकते हैं), निम्नलिखित लेख xowa.org/home/wiki/App/Wiki_types/Wikia.com काफी उपयोगी है। कस्टम विकियों के साथ किवीक्स का उपयोग अभी तक परीक्षण किया जा रहा है (एक को पहले github.com/kiwix/mwoffliner या किसी अन्य टूल के साथ विकी को डंप करने की आवश्यकता है )
एस्केलेटर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.