मुझे लगता है कि पुराने धागे में यह गलतफहमी थी। मैं एक पंक्ति में दो डिस्क के लिए विफलता की संभावना की तुलना कर रहा था जब या तो Z1 समता छापे का उपयोग कर रहा था या कोई RAID (जैसा कि आपने अन्य धागे में टिप्पणियों में कहा गया है)। मेरी नजर में यह बुनियादी Vdevs के Z1 बनाम धारीदार पूल के बारे में कभी नहीं था, क्योंकि यह खेल अनिवार्य रूप से वैसे भी पहली गलती के बाद खत्म हो गया है, इसलिए Z1 निश्चित रूप से बेहतर है।
लेकिन अगर आप सिर्फ एक एकल जेड 1 वीदेव के साथ एक एकल पूल के खिलाफ कई स्वतंत्र पूलों की तुलना करते हैं, तो समता की जानकारी को पुन: शामिल करते हुए बढ़े हुए लोड की समस्या बनी रहती है।
Z1 बनाम Z2 की तुलना पर, जो माइकल द्वारा उत्तर के बारे में मुख्य रूप से था, अन्य दो बिंदु लागू होते हैं। मुझे टिप्पणियों में अधिक स्पष्ट रूप से होना चाहिए था, लेकिन वे दुर्भाग्य से अंतरिक्ष में सीमित हैं। मुझे उम्मीद है कि यह उत्तर इस में से कुछ को साफ करता है।
मैं एक ही बात सोचा था, लेकिन मुझे एहसास नहीं था कि एक URE बस थोड़ा सा फ्लिप नहीं है, यह पूरे पूल को खराब कर देता है।
अगर हम पूरी बात को सरल बनाते हैं, तो आपके पास नीचे की तरफ उसकी चिप के साथ आपकी डिस्क है और ऊपर की तरफ आपका हार्डवेयर (RAID कंट्रोलर) या सॉफ्टवेयर (e। G। ZFS) है।
यदि हार्डवेयर में कोई त्रुटि होती है और किसी सेक्टर को पढ़ा नहीं जा सकता है, तो चिप पहले संभव हो तो इसे सही करने की कोशिश करता है (उदाहरण के लिए समस्या क्षेत्र को कई बार पढ़कर)। यदि यह अभी भी इससे बाहर कुछ भी नहीं कर सकता है, तो यह छोड़ देता है (सामान्य डिस्क पर, यह मिनट लग सकता है और पूरी प्रणाली को रोक सकता है जो IO ऑपरेशन के लंबित "सफल" या "विफलता" संदेश की प्रतीक्षा करता है।
कुछ डिस्क में एक सुविधा है जिसे TLER (समय सीमित त्रुटि पुनर्प्राप्ति) कहा जाता है, जो एक हार्ड टाइमआउट है जो इस त्रुटि सुधार समय को 6-9 सेकंड तक सीमित करता है, क्योंकि परंपरागत रूप से, अधिकांश हार्डवेयर RAID नियंत्रक ने 9 सेकंड के बाद पूरी डिस्क को गिरा दिया, इसलिए एक बुरा सेक्टर को पूरी डिस्क अनुपलब्ध नहीं करनी चाहिए, लेकिन अन्य डिस्क पर "अच्छे" सेक्टर द्वारा ठीक किया जाना चाहिए (एक सुविधा जो डेस्कटॉप सिस्टम पर एक एकल डिस्क पर भरोसा नहीं कर सकती है, इसलिए एक लंबा समय बेहतर होगा)।
अब, सॉफ़्टवेयर पक्ष देखें: यदि आप अपने रेड कंट्रोलर या ZFS फाइल सिस्टम को अतिरेक के साथ कॉन्फ़िगर करते हैं, उदाहरण के लिए आपके पूल के आधार पर मिरर किए गए डिस्क या दर्पण vdev का उपयोग करके, तो आपके URE को सही किया जा सकता है। यदि आप अतिरेक का उपयोग नहीं करते हैं, तो इस क्षेत्र का डेटा चला जाएगा, जो कि आपके भाग्य के आधार पर आपके द्वारा रेंडम पुराने रैंडम डेटा या कुछ नहीं के बारे में आपकी देखभाल करने वाला डेटा हो सकता है। यही बात बिट फ्लिप्स पर भी लागू होती है, हालाँकि ऐसा होने की संभावना बाहरी प्रभावों (जैसे ब्रह्मांडीय विकिरण) पर अधिक निर्भर करती है।
चूंकि RAID0 UREs के अधीन नहीं है, इसलिए सवाल "क्या अधिक संभावना है, RAIDZ में एक URE या RAID0 में डिस्क विफलता?"
मैंने इस उत्तर को स्वीकार नहीं किया है क्योंकि मुझे नहीं लगता कि यह प्रासंगिक बिंदुओं को पर्याप्त रूप से समझाता है, लेकिन मैं अपना जवाब बनाने की योजना बना रहा था क्योंकि मुझे लगता है कि UREs पूरे पूल को नष्ट कर देते हैं, अगर कोई और इसे पहले नहीं लेता है।
मेरा सुझाव है कि आप ZFS पूल लेआउट की एक बुनियादी व्याख्या पढ़ें। सबसे महत्वपूर्ण बिट्स को संक्षेप में प्रस्तुत करने के लिए:
- आप डिस्क, विभाजन या फ़ाइलों से वर्चुअल डिवाइस (vdevs) बना सकते हैं। प्रत्येक vdev को अलग-अलग अतिरेक के साथ बनाया जा सकता है: मूल (कोई अतिरेक नहीं), प्रतिबिंबित (1 से N डिस्क विफल हो सकती है), समता Z1 / Z2 / Z3 (1/2/3 डिस्क विफल हो सकती है)। सभी अतिरेक vdev स्तर पर काम करते हैं।
- आप एक या अधिक vdevs से संग्रहण पूल बनाते हैं। वे हमेशा धारीदार होते हैं, इसलिए एक एकल vv की हानि का अर्थ है पूरे पूल का नुकसान।
- आपके पास पूलों की संख्या हो सकती है, जो स्वतंत्र हैं। यदि एक पूल खो जाता है, तो दूसरे पूल काम करना जारी रखते हैं।
इसलिए आप निम्नलिखित कारण कर सकते हैं:
- यदि संभव हो, तो बड़ी ड्राइव के पुनर्निर्माण के दौरान लोड (और नकारात्मक) अवसर की बड़ी खिड़की (नकारात्मक) के कारण Z1 पर Z2 को प्राथमिकता दें (लगभग 1 टीबी से अधिक कुछ भी)
- यदि Z1 और कई मूल vdevs के बीच चयन करना है, तो Z1 को बिट त्रुटि सुधार के कारण पसंद करें, जो मूल vdevs के साथ संभव नहीं है
- यदि आप आंशिक पूल हानि को स्वीकार कर सकते हैं, तो अपने पूल को कई छोटे पूलों में विभाजित करें, जो प्रत्येक vdev द्वारा समर्थित हो, ताकि आपको चेकसम जानकारी मिले और घातक दोषों पर तेजी से पुनर्निर्माण हो सके
उपरोक्त किसी भी मामले में, आपके पास बैकअप होना चाहिए। यदि आप किसी भी बैकअप को वहन नहीं कर सकते हैं या नहीं करना चाहते हैं, तो यह इस बारे में है कि आप खोने के लिए अधिक सहज हैं - उच्च संभावना वाले पूल के कुछ हिस्से या कम संभावना वाले सब कुछ। मैं व्यक्तिगत रूप से पहला विकल्प चुनूंगा, लेकिन आप अन्यथा निर्णय ले सकते हैं।