PostgreSQL के लिए काफी नया है, मैंने पहले कभी इसका इस्तेमाल करके बड़ी तैनाती नहीं की है। लेकिन, मुझे एंटरप्राइज सॉल्यूशन का अच्छा अनुभव है और मैं पोस्टग्रेएसक्यूएल का उपयोग करके जो कुछ मैंने सीखा, उसे लागू करने की कोशिश करना चाहता हूं।
मेरे पास साइट है जो बड़ी संख्या में डेटा और ट्रैफ़िक को संभालने के लिए आकार में है। EC2 इंस्टेंसेस और EBS वॉल्यूम का उपयोग करके इंफ्रास्ट्रक्चर को amazon (AWS) पर उपयोग करके बनाया जाएगा।
विश्लेषण और रिपोर्टिंग को संभालने के लिए डिज़ाइन में दो डेटाबेस, एक मुख्य लेनदेन डेटाबेस और एक डेटा वेयरहाउस होना चाहिए।
मुख्य लेनदेन डेटाबेस
लाइव वेबसाइट के लिए उपयोग किया जाएगा, साइट समवर्ती उपयोगकर्ताओं को स्केल करने के लिए कई नोड्स पर बनाया गया है। मुख्य रूप से हमें इस मामले के लिए डेटाबेस की आवश्यकता होती है पढ़ने के संचालन में बेहद तेज, हम उम्मीद करते हैं> 30% वार्षिक वृद्धि के साथ 100GB डेटा। इस बिंदु पर, हम दो EC2 सर्वरों का उपयोग करने की योजना बना रहे हैं ( और बाद में हमें जितनी आवश्यकता हो उतना अधिक जोड़ सकते हैं )।
मेरा प्रश्न, उपरोक्त आवश्यकताओं के लिए अनुशंसित सेटअप क्या है? साथ ही, क्या टेबल और वॉल्यूम विभाजन को प्रबंधित करने का कोई तरीका है? क्या एडब्ल्यूएस सेटअप का उपयोग करने के लिए सिफारिशें हैं?
डेटा वेयरहाउस डेटाबेस
मुख्य रूप से मुख्य आयाम में सभी डेटा को समय आयाम में कैप्चर करने के लिए उपयोग किया जाएगा। इसलिए, मुख्य डेटाबेस से भी हटाए गए रिकॉर्ड DWH में कैप्चर किए जाएंगे। इसलिए, डेटा बहुत बड़ा होगा और विकास भी बड़ा होगा। यदि आवश्यक हो तो हम युगल EC2 उदाहरण या अधिक का भी उपयोग करेंगे।
इस मामले में अनुशंसित सेटअप क्या है? निरंतर लेखन (ETL) की वजह से इसके लिए तेज लेखन संचालन की आवश्यकता होगी। क्या हम PostgreSQL में OLAP क्यूब्स बना सकते हैं? यदि हाँ, वहाँ किसी को यह एक कोशिश की है?
डेटाबेस से जुड़ना
वेब सर्वर क्वेरी और लिखने के लिए मुख्य डेटाबेस से जुड़ेंगे। हम वर्तमान में django का उपयोग करके एक एप्लिकेशन विकसित कर रहे हैं जो कनेक्ट करने के लिए देशी लाइब्रेरी का उपयोग करता है। क्या एक ही मूल विधि का उपयोग करने की सिफारिश की गई है? या हमें pgpool को कॉन्फ़िगर करना चाहिए?
डेटा वेयरहाउस (ETL)
मुख्य और लोड से डेटा गोदाम तक पढ़ने के लिए ईटीएल प्रक्रियाओं के निर्माण के लिए अनुशंसित तरीका क्या है? कोई उपकरण? पद्धति का पालन करने के लिए? ETL प्रक्रियाओं के निर्माण में PostgreSQL कोई उपयोगी कार्य / उपकरण प्रदान करता है?