मैं वर्तमान में EC2 पर एक उदाहरण का निर्माण कर रहा हूं, जिस पर हम काम कर रहे कुछ प्रोजेक्ट्स के लिए संपूर्ण पृथ्वी के डेटा के पूरे Planet.osm स्नैपशॉट को आयात करने के लिए। मैंने एक बड़े उबंटू x64 का उदाहरण दिया है और पोस्टग्रेज डेटाबेस के लिए एक ईबीएस वॉल्यूम पर बहुत सारे अलग-अलग स्टोरेज को संलग्न किया है और इसे पीजीएसक्यूएल डेटा को घर में संशोधित किया है।
अब सर्वर को osm2pgsql
स्नैपशॉट आयात करने के लिए उपयोग करने में समस्या हो रही है ... विभिन्न मेमोरी कॉन्फिगरेशन और व्हाट्सएप के साथ कुछ प्रयासों के बाद, इस प्रक्रिया को "किल्ड" के माध्यम से अधिकांश तरीके से प्राप्त करने के बाद आउटपुट करता रहता है; एक बार "लंबित तरीकों से गुजरने" के दौरान इसे मार दिया गया था और अगली बार, स्लिम कैश को थोड़ा समायोजित करने के बाद, यह दुर्घटनाग्रस्त होने से पहले "प्रसंस्करण के तरीकों" पर पहुंच गया। मैंने जो पढ़ा है, यह आम तौर पर स्मृति मुद्दों के कारण होता है।
यहाँ आयात चलाने का मेरा नवीनतम प्रयास है:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
और यहाँ EC2 पर एक बड़े उदाहरण के लिए चश्मा दिए गए हैं:
बड़े इंस्टेंस 7.5 जीबी मेमोरी, 4 ईसी 2 कंप्यूट यूनिट्स (2 ईसी 2 कंप्यूट यूनिट्स के साथ 2 वर्चुअल कोर), 850 जीबी लोकल इंस्टेंस स्टोरेज, 64-बिट प्लेटफॉर्म
मेरा सवाल है - osm2pgsql और Postgres के लिए ट्यूनिंग आवश्यकताओं को निर्धारित करने के लिए कुछ अच्छे बेंचमार्क संसाधन हैं? आयात की गति मेरे लिए भी महत्वपूर्ण नहीं है, मैं यह सुनिश्चित करने में सक्षम होना चाहता हूं कि प्रक्रिया सुरक्षित रूप से पूरी हो जाए, भले ही इसमें 4 या 5 दिन लगें ... मैंने फ्रेडरिक राम के " प्रतिपादन का अनुकूलन " पढ़ा है। श्रृंखला "(पीडीएफ) दस्तावेज पिछले साल के एसओटीएम से, लेकिन क्या अन्य अच्छे विचार / संसाधन हैं?