मैं ग्राहकों को डेटा के सैकड़ों टेराबाइट्स (SQL सर्वर प्रतिष्ठानों में) के साथ देखना शुरू कर रहा हूं। जैसा कि कुछ उद्यमों में डेटा की कुल मात्रा एक पेटाबाइट के सार्थक अंशों तक पहुंचती है, मैं सामूहिक ज्ञान आधार को कैनवास पर रखना चाहूंगा कि डेटा के उस परिमाण से निपटने वाले लोग इसे सुरक्षित करने के लिए क्या कर रहे हैं।
स्पष्ट मुद्दा यह है कि एंटरप्राइज़-क्लास स्टोरेज, हेक, यहां तक कि सिर्फ RAID-5 का उपयोग करके, उस डेटा के कई बैकअपों को संग्रहीत करना बहुत महंगा है।
मेरे द्वारा देखे गए विकल्प इस प्रकार हैं:
- किसी अन्य डेटा-सेंटर में डेटा की एक मिरर कॉपी बनाएं, और इसे लगातार अंतर करें (जो भी तंत्र आपके डेटा स्रोत के लिए उपलब्ध है - जैसे लॉग-शिपिंग या SQL सर्वर के साथ मिररिंग का उपयोग करके)
- एक नियमित संपीड़न एल्गोरिथ्म का उपयोग करके नियमित बैकअप लें (संभवतः केवल तभी उपयुक्त हो जब डेटा भारी रूप से संकुचित होने के लिए अच्छी तरह से उधार देता है )
- डेटा के महत्वपूर्ण / बदलते भागों के टुकड़े का बैकअप लें।
- डेटा का बैकअप न लें और भ्रष्टाचार-देवताओं पर भरोसा करें।
मैं विकल्प 4 को डिफ़ॉल्ट के रूप में अपनाया जा रहा हूं, और एक HA / DR विशेषज्ञ के रूप में यह वास्तव में डरावना है, लेकिन मैं एक विकल्प के रूप में क्या सलाह देता हूं? मुझे लगता है कि # 1 सबसे अच्छा दृष्टिकोण है, लेकिन "मुझे ऐसा नहीं लगता" सामान्य उत्तर है जब # 4 के अलावा कोई विकल्प और संभवतः # 3 का सुझाव दिया जाता है।
अब, निश्चित रूप से यह डेटा की परिवर्तन-दर और आलोचना पर निर्भर करता है। इस बात का जवाब देने की आवश्यकता नहीं है कि जैसा कि मैंने Microsoft पर काम करते समय SQL सर्वर के सभी HA फीचर्स के लिए ज़िम्मेदार हुआ करता था, इसलिए मैं 'यह निर्भर करता है ’तर्कों पर अच्छी तरह से वाकिफ है - यह मेरा कैच-वाक्यांश है :-)
मैं किसी भी ऐसे विकल्प के बारे में सुनने में दिलचस्पी लेता हूँ जिसे मैंने याद किया है, या यह सुनने के लिए कि हर कोई एक ही नाव में है और अधिक भंडारण पर बहुत सारे पैसे खर्च करने का कोई वास्तविक विकल्प नहीं है।
अग्रिम धन्यवाद - उचित क्रेडिट सभी सुविचारित और व्यक्त उत्तरों को दिया जाएगा।