'बड़े' छापे के रूप में गिना जाता है 5 सरणी?


11

हाल ही में मेरे कार्यालय में एक बफ़ेलो तेरापंथ एनएएस के साथ एक मुद्दा मुझे रेड 5 की जांच कर रहा है।

मैंने कुछ अलग-अलग लेख पाए हैं जो बड़े सरणियों, या बड़े डिस्क के साथ छापे 5 का उपयोग करने की असफलता के बारे में बात कर रहे हैं

यहां एक उदाहरण लेख है जो बड़े उपभोक्ता ड्राइव के साथ एक सरणी के पुनर्निर्माण के साथ समस्याओं के बारे में बात करता है।

मैं 'बड़े' के रूप में गिना जाता है क्या काम करने की कोशिश कर रहा हूँ?

हमारे यहां जो NAS है, वह 4 ड्राइव RAID 5 सेटअप है, प्रत्येक ड्राइव 1 टीबी है। एक ड्राइव विफल हो गया है और उसे बदल दिया गया है, वर्तमान में सरणी का पुनर्निर्माण हो रहा है।

क्या इस सेटअप का बड़े पैमाने पर निर्माण होता है, के संदर्भ में पुनर्निर्माण के दौरान समस्या होने की संभावना है?

यह सेटअप दिन-प्रतिदिन के उपयोग के लिए कितना विश्वसनीय है?


2
आपके सामान्य सिस्टम लोड को देखते हुए, नियंत्रक को कितनी बार पुनर्निर्माण की उम्मीद है? HDDs का MTBF क्या है? आपके पास उन दो संख्याओं में से एक है, आप एक दूसरे का मौका जानते हैं - और विनाशकारी - RAID पुनर्निर्माण के दौरान विफलता। इस बात को ध्यान में रखें कि पुनर्निर्माण के दौरान एचडीडी सबसे अधिक तनाव में हैं, इसलिए उपरोक्त परिणाम दोहरी विफलता की संभावना को कम करके आंका जाएगा।
मदहैटर

3
एक तरफ के रूप में, आप जानते हैं कि RAID बैकअप नहीं है, है ना?
ccc

5
@cjc, क्या आप एसएफ पर हर एक RAID प्रश्न के लिए ज्ञान के मोती जोड़ते हैं, या इस बारे में कुछ ऐसा करते हैं जो आपको लगता है कि ओपी सोचता है कि RAID एक बैकअप है?
ब्लू कॉमप्यूट

हां, मैं इससे अवगत हूं। यह सब बैकअप है, मैं बस यह सब ठीक करने की झंझट चाहता था क्योंकि छापे की सरणी ठीक से मरम्मत नहीं करती थी।
रोब

जवाबों:


18

डिस्क सरणी की विश्वसनीयता डिज़ाइन करना:

  1. अपनी ड्राइव की URE दर ज्ञात करें (निर्माता अपनी ड्राइव के विफल होने के बारे में बात करना पसंद नहीं करते हैं, इसलिए आपको इसे खोजने के लिए खुदाई करनी पड़ सकती है। यह 1/10 ^ X होना चाहिए जहां X लगभग 12-18 सामान्यतः है)।
  2. तय करें कि आपके भंडारण की जरूरतों के लिए स्वीकार्य जोखिम दर क्या है acceptable। आमतौर पर यह विफलता का 0.5% मौका है, लेकिन "खरोंच" भंडारण में कई प्रतिशत हो सकता है, और महत्वपूर्ण डेटा के लिए <0.1 हो सकता है।
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    मिरर में डिस्क की एक जोड़ी से अधिक समता या दर्पण की एक से अधिक डिस्क के साथ सरणियों के लिए, 1ड्राइव में आरे के बाद परिवर्तन में समता / दर्पण के साथ डिस्क की संख्या।

इसलिए मुझे एक सरणी में चार 1TB WD ग्रीन ड्राइव का एक सेट मिला है। उनके पास 1/10 ^ 14 की URE दर है। और मैं उन्हें खरोंच भंडारण के रूप में उपयोग करता हूं। 1 - (1 - 1TB x 1/10^14byte) ^ 3=> 3.3%एक ड्राइव के मरने के बाद सरणी के पुनर्निर्माण में विफलता का जोखिम। ये मेरे कबाड़ के भंडारण के लिए बहुत अच्छे हैं, लेकिन मैं वहाँ महत्वपूर्ण डेटा नहीं डाल रहा हूँ।

† स्वीकार्य विफलता का निर्धारण एक लंबी और जटिल प्रक्रिया है। इसे संक्षेप में कहा जा सकता है Budget = Risk * Cost। तो अगर एक विफलता $ 100 खर्च हो रही है, और 10% होने की संभावना है, तो आपको इसे रोकने के लिए $ 10 का बजट होना चाहिए । यह जोखिम, विभिन्न विफलताओं की लागत, और संभावित रोकथाम तकनीकों की प्रकृति को निर्धारित करने के कार्य को सरलता से सरल करता है - लेकिन आपको यह विचार मिलता है। [Data Drives] = [Total Drives] - [Parity Drives]। एक दो डिस्क दर्पण (RAID1) और RAID5 में 1 समता ड्राइव है। एक तीन डिस्क मिरर (RAID1) और RAID6 में 2 समता ड्राइव हैं। RAID1 और / या कस्टम योजनाओं के साथ अधिक समता ड्राइव करना संभव है, लेकिन atypical।


यह सांख्यिकीय समीकरण हालांकि इसके साथ आता है, लेकिन यह है:

  • वह URE दर विज्ञापित दर है और आमतौर पर असेंबली लाइन को बंद करने वाले अधिकांश ड्राइव में बेहतर है। आप भाग्यशाली हो सकते हैं और एक ड्राइव खरीद सकते हैं जो विज्ञापन की तुलना में बेहतर परिमाण का आदेश है। इसी तरह आप एक ऐसी ड्राइव प्राप्त कर सकते हैं जो शिशु मृत्यु दर को खत्म करती है।
  • कुछ विनिर्माण लाइनों में खराब रन होते हैं (जहां एक ही समय में रन में कई डिस्क विफल हो जाती हैं), इसलिए विभिन्न विनिर्माण बैचों से डिस्क प्राप्त करने से एक साथ विफलता की संभावना को वितरित करने में मदद मिलती है।
  • पुराने डिस्क के पुनर्निर्माण के तनाव के तहत मरने की संभावना अधिक है।
  • पर्यावरणीय कारक एक टोल लेते हैं:
    • हीट जो आमतौर पर साइकल की गई होती है, उनके मरने की संभावना अधिक होती है (जैसे उन्हें नियमित रूप से चालू / बंद करना)।
    • कंपन सभी प्रकार के मुद्दों का कारण बन सकता है - एक डिस्क सरणी पर आईटी चिल्लाते हुए YouTube पर वीडियो देखें ।
  • "तीन तरह के झूठ हैं: झूठ, शापित झूठ, और आँकड़े" - बेंजामिन डिसरायली

डिवाइस का मैंने जो ड्राइव किया / बाहर किया, वह सैमसंग HD103SI 1TB ड्राइव है। मेरा मानना ​​है कि अन्य तीन शेष ड्राइव समान हैं। प्रतिस्थापन ड्राइव एक अलग निर्माता से है, मेरे पास हाथ करने के लिए विवरण नहीं है।
रोब

ऐसा लगता है कि इस ड्राइव की दर इस हिसाब से 1/10
रोब '

1
मैंने सिर्फ समीकरणों को ठीक किया, उदाहरण सही था, अब वे दोनों हैं। आपकी सरणी 1-(1-1099511627776*0.000000000000001)^3=> 0.00329 होगी। आपके पास बाहर की तरफ एक ब्रैकेट है ^3जहां यह अंदर होना चाहिए; और उस 1/10 ^ 15 चीज़ में एक और शून्य होना चाहिए।
क्रिस एस

2
एक 1TB ड्राइव 1000000000000 बाइट्स होगी, इसलिए यह आपके URE दर के आधार पर 3% से थोड़ा कम काम करता है। 0.3%।
user9517

1
@IanRingrose यह सांख्यिकीय रूप से मान्य है। मैंने पहले से ही आपकी विशिष्ट चिंताओं को संबोधित किया है। क्या आपके पास जोड़ने के लिए कुछ भी प्रासंगिक है जो पहले ही कहा जा चुका है?
क्रिस एस

9

कारण यह है कि लेख मौजूद है HDDs पर अपरिवर्तनीय बिट त्रुटि दर पर ध्यान आकर्षित करने के लिए। विशेष रूप से, आपके सस्ते 'होम पीसी' डिस्क। उनके पास आमतौर पर 1/10 ^ 14 का एक कारखाना कल्पना है। यह लगभग 12.5TB डेटा है, जो यदि आप एक RAID-5 को 2TB डिस्क के साथ कर रहे हैं ... तो आप बहुत जल्दी हिट करते हैं।

इसका मतलब है कि आपको या तो:

  • छोटे RAID समूहों का उपयोग करें, और उच्च बर्बाद स्थान को स्वीकार करें।
  • RAID-6 का उपयोग करें और अतिरिक्त लिखने के दंड को स्वीकार करें। (RAID5 से 50% अधिक)
  • अधिक महंगी डिस्क खरीदें - 'सर्वर ग्रेड' में 1/10 ^ 16 का UBER युक्ति है, जिसका अर्थ है कि यह एक म्यूट पॉइंट है। (1.2PB 12.5TB से बेहतर है)

मैं आमतौर पर सुझाव दूंगा कि RAID-6 आम तौर पर आगे की तरफ है, लेकिन यह आपके प्रदर्शन पर खर्च करेगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.