यह आमतौर पर क्यों माना जाता है कि RAID 5 सिस्टम बड़े डिस्क आकार के लिए उपयुक्त नहीं हैं? RAID 6 के लिए भी यही सच है?
संदर्भ: http://www.zdnet.com/article/why-raid-5-stops-working-in-2009/
यह आमतौर पर क्यों माना जाता है कि RAID 5 सिस्टम बड़े डिस्क आकार के लिए उपयुक्त नहीं हैं? RAID 6 के लिए भी यही सच है?
संदर्भ: http://www.zdnet.com/article/why-raid-5-stops-working-in-2009/
जवाबों:
RAID 5 बड़े डिस्क आकारों के लिए विश्वसनीय नहीं हो सकता है इसका कारण यह है कि सांख्यिकीय रूप से, भंडारण उपकरण (यहां तक कि जब वे सामान्य रूप से काम कर रहे होते हैं) त्रुटियों के लिए प्रतिरक्षा नहीं होते हैं। इसे यूबीई (कभी-कभी यूआरई) कहा जाता है अपरिवर्तनीय बिट त्रुटि दर, और यह बाइट्स की संख्या प्रति पूर्ण-क्षेत्र त्रुटियों में उद्धृत है। उपभोक्ता घूर्णी हार्ड डिस्क ड्राइव के लिए, यह मीट्रिक सामान्य रूप से 10 ^ -14 पर निर्दिष्ट किया जाता है, जिसका अर्थ है कि आपको प्रति 10 ^ 14 बाइट्स पढ़ने में एक असफल क्षेत्र पढ़ने को मिलेगा। (घातांक कैसे काम करते हैं, इसकी वजह से 10 ^ -14 एक समान है जो प्रति 10 ^ 14 है।)
10 ^ 14 बाइट्स एक बड़ी संख्या की तरह लग सकता है, लेकिन यह वास्तव में एक आधुनिक बड़े (कहते हैं 4-6 टीबी) ड्राइव पर पूरी तरह से पढ़े जाने वाले कुछ ही पास हैं। RAID 5 के साथ, जब एक ड्राइव विफल होता है, तो मौजूद होता है नहीं अतिरेक, जिसका अर्थ है कि कोई भी त्रुटि गैर-सुधार योग्य है: किसी भी अन्य ड्राइव से कुछ भी पढ़ने में कोई समस्या, और नियंत्रक (चाहे हार्डवेयर या सॉफ़्टवेयर) को पता नहीं होगा कि क्या करना है। उस बिंदु पर, आपकी सरणी टूट जाती है।
RAID 6 क्या करता है एक जोड़ रहा है दूसरा समीकरण के लिए अतिरेक डिस्क। इसका मतलब है कि भले ही एक ड्राइव पूरी तरह से विफल हो जाए, RAID 6 एक रीड एरर को सहन करने में सक्षम है एक उसी समय में अन्य ड्राइव में, और फिर भी सफलतापूर्वक आपके डेटा को फिर से संगठित करता है। इस नाटकीय रूप से किसी एकल समस्या की संभावना को कम करता है जिससे आपका डेटा अनुपलब्ध हो जाता है, हालाँकि यह संभावना को समाप्त नहीं करता है; एक ड्राइव के फेल होने की स्थिति में, एक अतिरिक्त ड्राइव के बजाय डेटा के लिए एक समस्या को विकसित करने की आवश्यकता है, जो अब अप्राप्य है। दो अतिरिक्त ड्राइव को एक समस्या विकसित करने की आवश्यकता है उसी सेक्टर में वहाँ के लिए एक समस्या है।
बेशक, वह 10 ^ -14 का आंकड़ा है सांख्यिकीय उसी तरह से जैसे कि घूर्णी हार्ड ड्राइव में आमतौर पर एक उद्धरण होता है सांख्यिकीय 2.5% के आदेश पर AFR (वार्षिक विफलता दर)। जिसका अर्थ होगा कि औसत ड्राइव 20-40 साल तक चलना चाहिए; स्पष्ट रूप से मामला नहीं। त्रुटियां बैचों में होती हैं; आप किसी समस्या के किसी संकेत के बिना 10 ^ 16 या 10 ^ 17 बाइट्स पढ़ने में सक्षम हो सकते हैं, और फिर आपको दर्जनों या सैकड़ों शॉर्ट ऑर्डर में पढ़ने की त्रुटियां मिलती हैं।
RAID वास्तव में उस बाद वाली समस्या को बनाता है और भी बुरा बहुत समान वर्कलोड और वातावरण (तापमान, कंपन, बिजली अशुद्धियों, आदि) के लिए ड्राइव को उजागर करने से। स्थिति इस तथ्य से और भी बदतर हो गई है कि कई RAID सरणियों को कमीशन और एक समूह के रूप में स्थापित किया गया है, जिसका अर्थ है कि जब तक पहली विफलता नहीं होती है, तब तक सरणी के सभी ड्राइव समान राशि के पास बहुत सक्रिय हो जाएंगे। समय की। यह सब बनाता है सहसंबद्ध असफलताएँ बहुत अधिक होने की संभावना है: जब एक ड्राइव विफल हो जाता है, तो ऐसा होने की बहुत संभावना है कि अतिरिक्त ड्राइव सीमांत हैं और जल्द ही विफल हो सकते हैं। सामान्य उपयोगकर्ता गतिविधि के साथ पूर्ण रीड पास का तनाव एक अतिरिक्त ड्राइव को विफल करने के लिए धक्का देने के लिए पर्याप्त हो सकता है। जैसा कि हमने देखा, RAID 5 के साथ, एक ड्राइव नॉनफंक्शनल के साथ, कोई भी कहीं और त्रुटि पढ़ने से एक स्थायी त्रुटि हो जाएगी और आपके सरणी को केवल एक पड़ाव पर लाने की अत्यधिक संभावना है। RAID 6 के साथ, आपके पास रिवाइवलिंग प्रक्रिया के दौरान आगे की त्रुटियों के लिए कम से कम कुछ मार्जिन है।
क्योंकि UBE को बाइट्स की संख्या के अनुसार पढ़ा जाता है, और बाइट की संख्या को पढ़कर यह पता चलता है कि कितने बाइट्स को स्टोर किया जा सकता है, 100 एमबी ड्राइव के सेट के साथ एक अच्छा सेटअप होने के लिए क्या इस्तेमाल किया जा सकता है? 1 टीबी ड्राइव का एक सेट और 4-6 टीबी ड्राइव के सेट के साथ पूरी तरह से अवास्तविक हो सकता है, भले ही भौतिक संख्या ड्राइव के समान रहता है। (दूसरे शब्दों में, दस १०० एमबी ड्राइव्स बनाम दस ६ टीबी ड्राइव।)
यही कारण है कि आज आम तौर पर आम आकारों के सरणियों के लिए RAID 5 को पर्याप्त नहीं माना जाता है, और विशिष्ट आवश्यकताओं के आधार पर RAID 6 या 1 + 0 को आमतौर पर प्रोत्साहित किया जाता है।
और उस विस्तार पर भी नहीं छू रहा है RAID एक बैकअप नहीं है ।
देख डिस्क RAID और IOPS CALCULATOR तथा IOPS और विलंबता का स्पष्टीकरण
विफलता RAID की गणना के लिए, आप सूत्रों का उपयोग कर सकते हैं।
यह धारणा कि एचडीडी की विफलता की संभावना बराबर है।
स्पष्टता के लिए, 5 साल के काम में और उसके बाद तालिका में विभिन्न RAID की विफलता की संभावना।
RAID 6 की विफलता की संभावना RAID DP (Synology) विफलता है।
उपयोग p
- Google डेटासेंटर खोज से विश्वसनीयता।
क्षमता के आधार पर विफलता पुनर्प्राप्ति प्रक्रिया RAID 5 की संभावना।
आपके पहले सवाल का जवाब। URE। अपरिवर्तनीय पढ़ने में त्रुटि। डिस्क ठीक हो सकती है, लेकिन डेटा को पुनर्निर्माण को रोकने के लिए नहीं पढ़ा जा सकता है जो पुनर्निर्माण के संदर्भ में असफल डिस्क के रूप में अंत में समान है। मुझे लगा कि लेख ने बुनियादी स्तर पर उचित अंतर्दृष्टि दी है।
आपके दूसरे प्रश्न का उत्तर। RAID 6 के लिए समान है, लेकिन बड़े सरणियों के लिए। मुझे लगता है कि अगर आप 12TB सरणी के लिए URE के बारे में चिंतित थे, तो एक युक्ति कहती है कि आपके पास प्रत्येक 12TB के लिए 1 URE होगा, तो आपको URE के सभी अतिरिक्त हैंडल करने के लिए प्रत्येक अतिरिक्त 12TB के लिए एक अतिरिक्त अतिरेक की आवश्यकता होगी। मुठभेड़ करना।
वह है RAID 5 पुनर्निर्माण 12TB की विफलता का एक ही मौका है (प्रति 10 ^ 14 URE दर) एक RAID 6 2400B सरणी के रूप में। फिर, यह लेख पर एक्सट्रपलेशन कर रहा है।
कारण है रिकवरी का समय। अवग से शुरू। 2TB आकार की वसूली के लिए समय बहुत बड़ा हो सकता है और वसूली की अवधि में विफलता की संभावना बहुत बढ़ जाती है। RAID6 के साथ आप दो डिस्क्स की विफलता से उबर सकते हैं, लेकिन डिस्क्स 6 के आकार को बढ़ाने के साथ एक ही समस्या तक पहुंचते हैं।
अन्य उत्तरों में उल्लिखित यूबीई तर्क पर्याप्त रूप से ठीक है, लेकिन एक बड़ी चिंता पुनर्निर्माण के दौरान दूसरी ड्राइव विफलता का जोखिम है।
याद रखें कि जब सरणी को फिर से बनाया जा रहा है तो डिस्क 100% लोड पर काम कर रहे हैं, और आधुनिक डिस्क के आकार को देखते हुए दिन लग सकते हैं। जब तक डिस्क एंटरप्राइज ग्रेड नहीं होती, तब तक वे वास्तव में ऐसा करने वाले नहीं होते हैं। यह प्राथमिक कारण है RAID5 बड़े डिस्क आकार के लिए उपयुक्त नहीं है।
आपको यह भी विचार करना चाहिए कि जब लोग डिस्क सरणियों को इकट्ठा करते हैं, तो वे आमतौर पर एकल विक्रेता से डिस्क ऑर्डर करते हैं। इसका मतलब यह है कि सरणी के सभी डिस्क एक ही विनिर्माण बैच से होंगे। यदि यह एक खराब बैच है, तो इसका मतलब कम जीवनकाल, कम विश्वसनीयता, या यहां तक कि कई ड्राइव एक छोटी समय अवधि में विफल हो सकते हैं। यहां तक कि अगर यह एक बुरा बैच नहीं है, अगर ड्राइव उनके जीवनकाल के अंत तक पहुंचने लगते हैं, तो एक बढ़ी हुई संभावना है कि कई ड्राइव एक दूसरे के कम समय के भीतर विफल हो जाएंगे। कई विक्रेताओं पर आदेश को विभाजित करने के लिए एक सरणी का निर्माण करते समय, या यदि संभव हो तो आपको विभिन्न बैचों से डिस्क भेजने के लिए एक विक्रेता से पूछने के लिए एक अनुशंसित अभ्यास है। इस तरह से ड्राइव अलग-अलग समय पर मरने की संभावना है, और आपको खराब बैच से कई ड्राइव प्राप्त करने की संभावना नहीं है। स्मरण करते हैं।
RAIDZ में देखें। यह बहुत अच्छा है। विशेष रूप से, RAIDZ3 और नेस्टेड RAIDZ को देखें। Synology में SynologyHybrid Raid नाम की एक चीज़ है, जिसके कुछ बहुत अच्छे फायदे हैं। आप एक बार में एक ड्राइव को बदलकर और पुनर्वित्त के पूरा होने की प्रतीक्षा करके अपने सरणी में ड्राइव आकार को उन्नत कर सकते हैं, उदाहरण के लिए।