मुझे यकीन नहीं है कि सच rsync अमेज़न के लिए एक अच्छा फिट है।
जैसा कि मैं इसे समझता हूं, मानक rsync एल्गोरिथम का अर्थ है कि ग्राहक किसी फ़ाइल के प्रत्येक ब्लॉक के लिए हैश की गणना करता है और सर्वर इसकी प्रतिलिपि के लिए हैश की गणना करता है और क्लाइंट को उन हैश को भेजता है, जिसका अर्थ है कि ग्राहक यह निर्धारित कर सकता है कि कौन से ब्लॉक बदल गए हैं और अपलोड करने की आवश्यकता है।
अमेज़ॅन के लिए यह दो समस्याएं पैदा करता है कि बहुत सारी हैश को इंटरनेट पर भेजना पड़ता है और यह उन सभी हैश की गणना करने के लिए प्रसंस्करण शक्ति लेता है जो अमेज़ॅन की लागत में वृद्धि करेंगे - शायद यही कारण है कि वे इसे तीसरे पक्ष के प्रदाताओं को छोड़ सकते हैं जो कर सकते हैं उस सुविधा के लिए अतिरिक्त शुल्क लें।
क्लोन के लिए, वे स्पष्ट रूप से कहीं और हैश का भंडारण कर रहे हैं और कहीं-कहीं क्लोन के आधार पर भिन्न हो सकते हैं। उनके लिए यह संभव होगा कि वे अमेज़ॅन पर एक अलग वस्तु के रूप में या अमेज़न पर संग्रहीत डेटाबेस के रूप में हैश को स्टोर कर सकें या वे उन्हें स्थानीय और दूर से स्टोर कर सकें।
इसे करने के फायदे और फायदे हैं। यदि अलग-अलग फ़ाइलों में हैश को दूर से संग्रहीत किया जाता है, तो उन्हें लगातार पुनर्प्राप्त करना महंगा हो सकता है। यदि किसी डेटाबेस में हैश को दूरस्थ रूप से संग्रहीत किया जाता है, तो यह डेटाबेस बड़ा हो सकता है और उन्हें लगातार पुनर्प्राप्त करना और उन्हें अपडेट करना महंगा हो सकता है। यदि हैश स्थानीय रूप से संग्रहीत किया जाता है, तो यह लागत को कम करने में मदद करता है, लेकिन अन्य जटिलताओं और समस्याओं का परिचय देता है।
(बेशक अमेज़ॅन के पास अन्य सेवाएं हैं, इसलिए अमेज़ॅन डीबी में एक डेटाबेस रखना संभव होगा)
एक उदाहरण के रूप में, मैंने कई साल पहले एक शुरुआती rsync क्लोन की कोशिश की। यह अमेज़ॅन के मूल्य निर्धारण संरचना को ध्यान में रखने के लिए नहीं लिखा गया था और प्रत्येक ब्लॉक के हैश को पुनः प्राप्त करने के लिए बहुत सारे http जारी कर रहा था और चूंकि प्रत्येक को अमेज़ॅन चार्ज मिलता था, इसका मतलब था कि मेरे बिल का भंडारण हिस्सा तेजी से गिर गया था, स्थानांतरण हिस्सा फूल।
मैं rsync + s3rsync + s3 के बजाय अनुलिपि + s3 का उपयोग करके क्या खोता हूं?
आप इस तथ्य को खो देते हैं कि rsync के साथ आप जानते हैं कि आप अपनी बैकअप फ़ाइलों के साथ स्रोत फ़ाइलों की तुलना कर रहे हैं। द्वैधता और अन्य क्लोन के साथ, आप अपनी स्रोत फ़ाइलों की तुलना एक हैश के साथ कर रहे हैं जो बैकअप के प्रदर्शन के दौरान लिया गया था। उदाहरण के लिए, S3 को सीधे एक्सेस करना और उसकी एक फाइल को हैश के पुनर्संरचना या हैश डेटाबेस को अपडेट किए बिना बदलना संभव हो सकता है।