मैं उपभोक्ता (URE / bit = 1e-14) या एंटरप्राइज़ (URE / bit = 1e-15) ड्राइव के साथ विभिन्न RAID प्रणालियों की विश्वसनीयता की तुलना करना चाहता हूं। पुनर्निर्माण की सफलता की संभावना का सूत्र (यांत्रिक समस्याओं की अनदेखी, जिसे मैं बाद में ध्यान में रखूंगा) सरल है:
error_probability = 1 - (1-per_bit_error_rate) ^ bit_read
यह याद रखना महत्वपूर्ण है कि यह AT LEAST एक URE प्राप्त करने की संभावना है, केवल एक ही नहीं।
मान लीजिए कि हम 6 टीबी उपयोग करने योग्य स्थान चाहते हैं। हम इसे प्राप्त कर सकते हैं:
RAID1 प्रत्येक 6 टीबी के 1 + 1 डिस्क के साथ। पुनर्निर्माण के दौरान हमने 6TB की 1 डिस्क को पढ़ा और जोखिम यह है: 1- (1-1e-14) ^ (6e12 * 8) = उपभोक्ता के लिए 38% या एंटरप्राइज़ ड्राइव के लिए 4.7%।
RAID10 प्रत्येक 3 टीबी के 2 + 2 डिस्क के साथ। पुनर्निर्माण के दौरान हमने 3TB की केवल 1 डिस्क (विफल वाले के साथ जोड़ा गया एक) वापस पढ़ा और जोखिम कम है: 1- (1-1e-14) ^ (3e12 * 8) = उपभोक्ता के लिए 21% या 2.4% के लिए उद्यम ड्राइव।
3TB के 2 + 1 डिस्क के साथ RAID5 / RAID Z1। पुनर्निर्माण के दौरान हमने प्रत्येक 3TB के 2 डिस्क को पढ़ा और जोखिम यह है: 1- (1-1e-14) ^ (2 * 3e12 * 8) = 38% उपभोक्ता या 4.7% या एंटरप्राइज़ ड्राइव के लिए।
RAID5 / RAID Z1 2 टीबी के 3 + 1 डिस्क्स के साथ प्रत्येक (अक्सर एसओएचओ जैसे उपयोगकर्ताओं द्वारा उपयोग किया जाता है)। पुनर्निर्माण के दौरान हमने 2TB के 3 डिस्क वापस पढ़े हैं और प्रत्येक जोखिम है: 1- (1-1e-14) ^ (3 * 2e12 * 8) = 38% उपभोक्ता या 4.7% या एंटरप्राइज़ ड्राइव के लिए।
एकल डिस्क सहिष्णुता के लिए त्रुटि की गणना करना आसान है, अधिक मुश्किल कई डिस्क विफलताओं (RAID6 / Z2, RAIDZ3) के लिए सिस्टम सहिष्णु के साथ संभाव्यता की गणना करना है।
यदि केवल पहली डिस्क का उपयोग पुनर्निर्माण के लिए किया जाता है और दूसरे को मामले या यूआरई में शुरुआत से फिर से पढ़ा जाता है, तो त्रुटि संभावना एक है जो वर्गमूल से ऊपर की गणना की गई है (उपभोक्ता के लिए 14.5% RAID5 2 + 1, उपभोक्ता के लिए 4.5% RAID1 1 + 2)। हालाँकि, मुझे लगता है (कम से कम ZFS में पूर्ण चेकसम!) है कि दूसरी समता / उपलब्ध डिस्क को केवल जहाँ आवश्यक पढ़ा जाता है, जिसका अर्थ है कि केवल कुछ क्षेत्रों की आवश्यकता है: संभवत: पहली डिस्क में कितने URE हो सकते हैं? बहुत से नहीं, अन्यथा एकल-डिस्क सहिष्णुता प्रणालियों के लिए त्रुटि की संभावना मेरे द्वारा गणना की तुलना में अधिक आसमान छू जाएगी।
यदि मैं सही हूं, तो एक दूसरी समता डिस्क व्यावहारिक रूप से बेहद कम मूल्यों के लिए जोखिम कम करेगी।
एक तरफ सवाल, यह ध्यान रखना महत्वपूर्ण है कि निर्माता विपणन कारणों से उपभोक्ता-वर्ग ड्राइव के लिए यूआरई संभावना बढ़ाते हैं (अधिक उद्यम-श्रेणी ड्राइव बेचते हैं), इसलिए भी उपभोक्ता-श्रेणी के एचडीडी को 1E-15 URE / बिट पढ़ने की उम्मीद है ।
कुछ डेटा: http://www.high-rely.com/hr_66/blog/why-raid-5-stops-working-in-nic.in/
मैं कोष्ठक (उद्यम ड्राइव) में प्रदान किए गए मूल्य इसलिए उपभोक्ता ड्राइव पर भी वास्तविक रूप से लागू होते हैं। और असली उद्यम ड्राइव में एक उच्च विश्वसनीयता (URE / बिट = 1e-16) है।
यांत्रिक विफलताओं की संभावना के बारे में, वे डिस्क की संख्या के लिए आनुपातिक हैं और पुनर्निर्माण के लिए आवश्यक समय के आनुपातिक हैं।