मुझे WAN पर एक ऑफ-साइट बैकअप कार्य करने का काम सौंपा गया है। दोनों स्टोरेज बॉक्स FreeBSD आधारित NAS बॉक्स हैं जो ZFS चल रहे हैं।
सप्ताह में एक या दो बार, 15-60 गीगा फोटोग्राफी डेटा कार्यालय एनएएस को डंप हो जाता है। मेरा काम यह पता लगाना है कि इस डेटा को साइट से कैसे प्राप्त किया जा सकता है, जितना संभव हो सके बहुत कम DSL कनेक्शन (~ 700Kb / s अपलोड) का उपयोग करके। प्राप्त बॉक्स बहुत बेहतर आकार में है, 30Mb / s डाउन, 5Mb / s ऊपर।
मुझे पता है, हार्ड ड्राइव को ऑफ-साइट ले जाने से डेटा बहुत तेज़ी से आगे बढ़ेगा, लेकिन यह इस मामले में एक विकल्प नहीं है।
मेरे विकल्प या तो प्रतीत होते हैं:
- ZFS वृद्धिशील ssh पर भेजें
- rsync
rsync एक समय सम्मानित समाधान है, और किसी चीज़ को बाधित होने पर भेजने को फिर से शुरू करने की सभी महत्वपूर्ण क्षमता है। यह कई फ़ाइलों पर पुनरावृत्ति करने और डेडअप के बारे में नहीं जानने का नुकसान है।
ZFS स्नैपशॉट भेजना थोड़ा कम डेटा स्थानांतरित कर सकता है (यह फ़ाइल सिस्टम के बारे में बहुत अधिक जानता है, डिडअप कर सकता है, मेटाडेटा परिवर्तन को rsync से अधिक कुशलता से पैकेज कर सकता है) और केवल कॉपी करने के बजाय फाइल सिस्टम को ठीक से नकल करने का लाभ है व्यक्तिगत रूप से फ़ाइलें (जो अधिक डिस्क गहन है)।
मैं ZFS प्रतिकृति प्रदर्शन के बारे में चिंतित हूं [1] (हालांकि यह लेख एक वर्ष पुराना है)। मैं इस बात से भी चिंतित हूं कि यदि कुछ नीचे जाता है तो हस्तांतरण को फिर से शुरू करने में सक्षम है - स्नैपशॉट की क्षमता इसमें शामिल नहीं है। पूरे सिस्टम को पूरी तरह से हाथों-हाथ लेने की जरूरत है।
[१] http://wikitech-static.wikimedia.org/articles/z/f/s/Zfs_replic.html
किसी भी विकल्प का उपयोग करते हुए, मुझे ट्रैफ़िक को डी-प्रायोरिटी में निर्दिष्ट पोर्ट के माध्यम से रूट करने में सक्षम होना चाहिए, फिर राउटर पर क्यूओएस का उपयोग करना चाहिए। मुझे प्रत्येक हस्तांतरण के दौरान दोनों साइटों पर उपयोगकर्ताओं पर एक बड़े नकारात्मक प्रभाव से बचने की आवश्यकता है, क्योंकि इसमें कई दिन लगेंगे।
इसलिए ... इस मुद्दे पर मेरी सोच है। क्या मैंने कोई अच्छा विकल्प याद किया है? क्या किसी और ने भी कुछ ऐसा ही सेट किया है?