क्या एक बड़ा RAID-Z सरणी एक बड़े RAID-5 सरणी के समान ही बुरा है?


11

लंबे समय से मैंने सुना है कि एक विचार कितना बुरा है (> 5TB?) RAID -5 सरणी बस इसलिए है क्योंकि किसी अन्य ड्राइव के विफल होने का उच्च जोखिम है।

क्या RAID-Z1 ने किसी भी आकार के सरणी के लिए यह उपाय किया है (यदि आपको बिल्कुल 4x2TB या 5x2TB पर विचार करने की आवश्यकता है)? हो सकता है कि सभी ड्राइव पर समान रूप से तीव्र डेटा को फिर से दोहराने के लिए एक सुरक्षित तरीका नहीं है?

जवाबों:


8

यहां तक ​​कि यहां दिए गए अन्य उत्तरों में से एक का क्या जवाब है, अर्थात् जेडएफएस केवल वास्तविक उपयोग किए गए ब्लॉकों के साथ काम करता है और खाली स्थान नहीं है, हां, एक बड़े RAIDZ1 vdev बनाना अभी भी खतरनाक है। अधिकांश पूल कम से कम 30-50% का उपयोग करते हैं, कई लोग अनुशंसित अधिकतम 80% तक जाते हैं (कुछ इसे अतीत में जाते हैं, मैं अत्यधिक अनुशंसा करता हूं कि आप ऐसा बिल्कुल भी नहीं करें, प्रदर्शन कारणों से), ताकि ZFS केवल सौदा करे इस्तेमाल किया ब्लॉक के साथ एक बड़ी जीत नहीं है। इसके अलावा, कुछ अन्य उत्तरों से यह लगता है कि यह एक खराब रीड है जो समस्या का कारण बनता है। ऐसा नहीं है। एक ब्लॉक के अंदर थोड़ा सड़ांध यह नहीं है कि आप यहां क्या करने जा रहे हैं, आमतौर पर, यह एक और डिस्क है, जो खराब हो रही है, जबकि पहली डिस्क से रेज़लवर खराब हो रही है, फिर भी यह चल रहा है कि आप को मार देंगे .. और 3 टीबी डिस्क पर एक बड़े raidz1 में यह दिन, सप्ताह भी लग सकते हैं एक नई डिस्क पर फिर से शुरू करने के लिए, ऐसा होने की आपकी संभावना नगण्य नहीं है।

ग्राहकों के लिए मेरी व्यक्तिगत अनुशंसा है कि कभी भी संभावित विरूपता से बचने के लिए 750 GB डिस्क के साथ कभी भी RAIDZ1 (RAID5 समतुल्य) का उपयोग न करें। मैं अन्य कारणों से इस नियम को तोड़ने के साथ ठीक रहा हूं (सिस्टम में कहीं और बैकअप है, डेटा उतना महत्वपूर्ण नहीं है, आदि), लेकिन आमतौर पर मैं बड़े पैमाने के साथ न्यूनतम विकल्प के रूप में RAIDZ2 के लिए पुश करने की पूरी कोशिश करता हूं डिस्क।

इसके अलावा, कई कारणों से, मैं आमतौर पर एक raidz2 पट्टी में 8-12 से अधिक डिस्क या एक raidz3 पट्टी में 11-15 डिस्क नहीं जाने की सलाह देता हूं। आपको 3 टीबी डिस्क के साथ उन सीमाओं के निचले-छोर पर होना चाहिए, और 1 टीबी डिस्क पर उन सीमाओं के उच्च-छोर पर शायद ठीक हो सकता है। यह आपको इस विचार से दूर रखने में मदद करेगा कि अधिक डिस्क विफल हो जाएगी जबकि एक रेज़लवर चल रहा है केवल उन कारणों में से एक है, लेकिन एक बड़ा।

यदि आप अंगूठे के कुछ समझदार नियमों की तलाश कर रहे हैं (04/10/15 संपादित करें) - मैंने इन नियमों को केवल मन में घूमती डिस्क के साथ लिखा है - क्योंकि वे भी तार्किक हैं [आप एक raidz1 में 3 से कम डिस्क क्यों करेंगे] वे SSD पूल के लिए भी कुछ समझ में आता है, लेकिन जब मैंने ये लिखा है, तो मेरे सिर में सभी-SSD पूल नहीं थे):

  • Raidz1 का उपयोग> 750 GB डिस्क पर बिल्कुल न करें।
  • एक raidz1 पर 3 से कम या 7 से अधिक डिस्क का उपयोग न करें।
  • अगर 3-डिस्क raidz1 vdevs का उपयोग करने की सोच रहे हैं, तो इसके बजाय गंभीरता से 3-वे दर्पण vdevs पर विचार करें।
  • एक raidz2 पर 6 से कम या 12 से अधिक डिस्क का उपयोग न करें।
  • एक raidz3 पर 7 से कम या 15 से अधिक डिस्क का उपयोग न करें।
  • हमेशा याद रखें कि पारंपरिक RAID सरणियों के विपरीत जहां # डिस्क में IOPS की वृद्धि होती है, ZFS में यह VDEVS का # होता है, इसलिए छोटी पट्टी वाले vdevs के साथ जाने से पूल IOPS क्षमता में सुधार होता है।

डिस्क आकार और प्रदर्शन में परिवर्तन के साथ, क्या आप अभी भी अंगूठे के एक ही नियम की सिफारिश करेंगे? (२०१४)
भगवान लोह।

अंगूठे के नियमों के लिए कोई स्रोत या प्रेरणा?
केनी एविट

यह स्रोत नेक्सा में 1000 और ZFS की तैनाती के दौरान अपने और सहकर्मियों के अनुभव का अनुभव है। अपडेट के लिए - नियम स्टैंड (04/10/15), कुछ भी नहीं बदला है जो मुझे बुलेट बिंदुओं को संपादित करना चाहता है, हालांकि मुझे लगता है कि मैंने एसएसडी के बिना उन नियमों को ध्यान में रखते हुए लिखा था। परिस्थितिजन्य कारकों के आधार पर, एसएसडी के लिए नियम समान रूप से समान नहीं हैं। उनके साथ, आपको कुछ अन्य विचार भी मिले, जैसे कि एचबीए अड़चन।
नेक्स 7

1
@ Nex7, आपके ब्लॉग लेख में इसके लिए क्या तर्क है? 8. "RAIDZ - सम / विषम डिस्क मायने रखता है: (और बहुत कठिन नहीं) एक raidz vdev में डेटा डिस्क की संख्या को एक समान संख्या में रखने के लिए प्रयास करें"
कॉस्टिन गुए

उपयोग के मामलों को याद रखना महत्वपूर्ण है। यहां सर्वरफॉल्ट पर हम पेशेवर / व्यावसायिक अनुप्रयोगों पर ध्यान केंद्रित करते हैं ताकि आपका उत्तर सही हो। कहा कि, जो उपभोक्ता प्रतिष्ठान कर रहे हैं (और शायद सीमित व्यावसायिक अनुप्रयोग भी?), इस बात पर विचार करें कि एक एकल फ़ाइल (शायद एक जोड़ी) से एक ब्लॉक को खोना कितना बुरा होगा यदि आपके पास असफलता के दौरान पुनर्निर्माण। कोई बड़ी बात नहीं? तब RAIDZ1 ठीक हो सकता है।
दान प्रिट्ट्स

11

क्या RAID-Z R5 जितना खराब है, नहीं। क्या यह आर 1 या आर 10 जितना अच्छा है, आमतौर पर नहीं।

RAID-Z को ड्राइव पर रिक्त स्थानों के बारे में पता है, जहां R5 नहीं है। इसलिए RAID-Z को केवल लापता डिस्क को पुनर्प्राप्त करने के लिए डेटा वाले क्षेत्रों को पढ़ना होगा। इसके अलावा, डेटा आवश्यक रूप से सभी डिस्क पर धारीदार नहीं है। एक बहुत छोटी फ़ाइल हो सकता है बस एक ही डिस्क पर रहते हैं, एक और डिस्क पर समता के साथ। इसकी वजह से RAID -5 को सरणी पर उपयोग किए जाने वाले स्थान के रूप में बिल्कुल डेटा के रूप में पढ़ना होगा (यदि 1mb का उपयोग 5TB सरणी पर किया जाता है, तो पुनर्निर्माण को केवल 1 एमबी पढ़ने की आवश्यकता है)।

दूसरे रास्ते पर जा रहे हैं, यदि अधिकांश बड़े सरणी भरे हुए हैं, तो अधिकांश डेटा को सभी डिस्क को पढ़ने की आवश्यकता होगी। R1 या R10 की तुलना में जहां डेटा को केवल एक डिस्क (प्रति विफल डिस्क; यदि एकाधिक डिस्क केवल उन स्थितियों में विफल होती है जहां सरणी अभी भी पुनर्प्राप्त करने योग्य है) को खींचने की आवश्यकता है।

आप जिस चीज के बारे में चिंता कर रहे हैं वह यह है कि हर सेक्टर रीड ऑपरेशन के साथ एक मौका आपको एक ऐसा सेक्टर मिलेगा जो सही ढंग से नहीं लिखा गया था या अब पढ़ने योग्य नहीं है। इन दिनों एक विशिष्ट ड्राइव के लिए जो कि लगभग 1x10 ^ -16 है (सभी ड्राइव्स समान नहीं हैं, इसलिए अपनी ड्राइव के स्पेक्स को उनकी रेटिंग का पता लगाने के लिए देखें)। यह अविश्वसनीय रूप से असुरक्षित है, लेकिन हर 1PB के बारे में एक बार सामने आता है; 10TB सरणी के लिए 1% संभावना है कि आपका सरणी टोस्ट है और आप इसे तब तक नहीं जानते जब तक आप इसे पुनर्प्राप्त करने का प्रयास नहीं करते।

ZFS भी इस मौके को कम करने में मदद करता है, क्योंकि अधिकांश अपठनीय क्षेत्र आपके सरणी को फिर से बनाने की कोशिश शुरू करने से पहले ध्यान देने योग्य हैं । यदि आप नियमित रूप से अपने ZFS सरणी को स्क्रब करते हैं, तो स्क्रब ऑपरेशन इन त्रुटि को पिक करेगा और उनके चारों ओर काम करेगा (या आपको सचेत करता है ताकि आप डिस्क को प्रतिस्थापित कर सकें यदि आप कैसे रोल करते हैं)। वे आपको एक महीने में एक से चार बार के बारे में एंटरप्राइज-ग्रेड डिस्क को रगड़ने की सलाह देते हैं; और उपभोक्ता-ग्रेड ड्राइव सप्ताह में कम से कम एक बार, या अधिक।


3

RAID-5 के कुछ फायदे पारंपरिक RAID -5 के बारे में यह है कि इसके लिए विशेष हार्डवेयर की आवश्यकता नहीं होती है और यह RAID-5 राइट होल से बचकर अधिक विश्वसनीय होता है।

हालाँकि, RAID-Z और RAID-5 दोनों एक से अधिक डिस्क विफलता को बनाए नहीं रखते हैं।

क्या आपको ZFS के साथ दो डिस्क विफलता से बचना चाहिए, आप RAIDZ2 , और तीन डिस्क विफलता RAIDZ3 का उपयोग कर सकते हैं ।


1
+1 इसके अलावा, पेरब्लॉक चेकसम ज़ेडएफएस को अनुमति देता है, क्या उसे एक सरणी में भ्रष्टाचार को प्रभावित फ़ाइलों को एकल करने के लिए खोजना चाहिए। अधिकांश R5 HBA केवल पूरी मात्रा को दूषित के रूप में चिह्नित करेंगे, या OS पर वापस रिपोर्ट करेंगे कि कोई सेक्टर दूषित है, या तो HBA के पास यह जानने का कोई तरीका नहीं है कि भ्रष्टाचार परिदृश्य में कौन सी डिस्क गलत है।
क्रिस एस

ZFS के 'रेसिलवर फेल हैंडलिंग' पर अधिक चर्चा: ZFS अंतहीन रिसिल्वरिंग
एक CVn
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.