RAID 5 2 ड्राइव विफलता का वास्तविक अनुभव खोज रहे हैं? [बन्द है]


15

मैं सोच रहा हूँ अगर किसी को भी व्यक्तिगत अनुभव है RAID 5 2 ड्राइव बड़ी ड्राइव के साथ विफलता?

जैसा कि मैं इसे समझता हूं, सिद्धांत यह है कि बड़े 1-2TB ड्राइव के साथ, अगर एक ड्राइव छापे के सेट में विफल रहता है, तो उसे सब कुछ पुनर्निर्माण करने की आवश्यकता होती है, इसलिए इस तरह से सभी अन्य ड्राइव को बहुत मुश्किल से मारा जाता है, और दूसरी विफलता का मौका बढ़ जाता है, खासकर अगर ड्राइव एक ही विनिर्माण बैच से थे। और अगर आप एक और ड्राइव खो देते हैं, तो आप सभी डेटा खो देते हैं।

यह आमतौर पर "RAID बैकअप नहीं है" बयान के बाद समझाया गया है, जिससे मैं सहमत हूं।

इसका सिद्धांत समझ में आता है, और मैं इसे समझता हूं, लेकिन क्या वास्तव में ऐसा होता है?


अफसोस की बात है कि हमें इस के जीवंत अनुभव के साथ एक नया प्रश्न मिला। :( superuser.com/questions/516844/…
Hennes

जवाबों:


15

हां, मेरे साथ ऐसा हुआ है। 4 (उपभोक्ता ग्रेड) WD 500 ड्राइव का एक सेट लगभग एक सप्ताह के दौरान खराब हो गया। मैं पहले को बदलने के लिए धीमा था, और सरणी को ऑफ़लाइन नहीं लिया, और दूसरा विफल होने पर अपना सारा डेटा खो दिया। मैंने शेष दो अच्छे लोगों का फिर से उपयोग किया, और उनमें से एक अगले महीने में विफल हो गया। वे सभी ठीक से ठंडा थे और उनकी देखभाल की जाती थी। मैं केवल यह कह सकता हूं कि मुझे अब "खराब बैच" बयानबाजी पर विश्वास है।

एक अलग घटना में, मेरे पास अलग-अलग बनाने के 3 अलग-अलग ड्राइव थे और मॉडल एक-दूसरे के एक महीने के भीतर विफल हो गए, हालांकि मुझे पूरा यकीन है कि असफल होने का कारण अनुचित वेंटिलेशन था। अपने ड्राइव पकाना मत!


3
एक कोरोलरी के रूप में, जब एक ड्राइव खराब हो जाती है, तो उसके चारों ओर एक अतिरिक्त बैठा होता है। इसके अलावा, मूक भ्रष्टाचार से सावधान रहें ... यह एक ड्राइव पर डेटा खोना आसान है जो केवल काम करने का दिखावा कर रहा है।
पॉल मैकमिलन

यह एक और कारण है कि आपको उन ड्राइव्स को स्थापित नहीं करना चाहिए जो सभी एक ही बैच से RAID सरणी में हैं - उन्होंने सहसंबद्ध विफलता समय (y'know, जैसे कि ट्रांसक्रिप्टेड सबप्राइम संपार्श्विक बंधक प्रतिभूतियों की डिफ़ॉल्ट दरें) हैं।
एंड्रयू माओ

4

यह वास्तव में मेरे साथ हुआ है, हालांकि, यह वास्तव में सबसे आम तरीका नहीं था कि एक ड्राइव विफल हो जाएगी। मेरे पास छापे में ५०० जीबी ५०० बीजीबी बाहरी साटा ड्राइव थे। वे एक सस्ते पुराने आईबीएम रैक माउंटेड सर्वर से जुड़े थे। पूरे सेटअप को सीढ़ियों के नीचे और एक दिन चूहे या बन्नी के नीचे फेंक दिया गया था, लेकिन कुछ पावर केबल्स और 2 ड्राइव के माध्यम से चबाया गया था। सभी ड्राइव सस्ते बाहरी बाड़ों में थे इसलिए मुझे लगता है कि मुझे इतना आश्चर्य नहीं होना चाहिए था।


3

क्या आप पूछ रहे हैं कि क्या आप बैक टू बैक 2 ड्राइव खो सकते हैं? ज़रूर, कुछ भी हो सकता है। RAID 5 डेटा एक्सेस के लिए बहुत अधिक उपलब्धता और प्रदर्शन में वृद्धि की अनुमति देता है, लेकिन छापे 5 कुछ भी वापस नहीं करता है। यह बस एक एकल ड्राइव हार्डवेयर हानि के कारण आपके डेटा के उपयोग को रोकने में मदद करता है। यह आपके डेटा की कॉपी नहीं है। आप एक पुरानी प्रतिलिपि, एक पुराने संशोधन या बस अपने वर्तमान कार्य की एक प्रति पुनर्प्राप्त नहीं कर सकते। इसके अलावा, डेटा भ्रष्टाचार से रक्षा नहीं करता है। वहाँ और भी चीजें हैं जो गलत हो सकती हैं बस ड्राइव खो देने से। वायरस आपके सभी डेटा को दूषित कर सकता है, छोटी बहन को पसंद है कि आपके डेस्कटॉप पर कचरा कर सकते हैं पूर्ण और खाली हो जाता है क्योंकि वह इसमें फाइलें फेंकता है, बेवकूफ दोस्त आपकी मशीन पर सोडा गिराता है, आदि।

इसके अलावा, याद रखें, आप हार्ड ड्राइव रेड कंट्रोलर खो सकते हैं। और आप सिर्फ सरणी को किसी अन्य यादृच्छिक नियंत्रक में स्थानांतरित नहीं कर सकते। आपको सामान्य रूप से सटीक एक का उपयोग करना होगा और फिर भी, कुछ गलत हो सकता है। कुछ छापे नियंत्रक बोर्ड पर जानकारी संग्रहीत करते हैं और अन्य कॉन्फ़िगरेशन जानकारी संलग्न सरणी में भेजते हैं। यह स्थिति उत्पन्न होने पर यह एक जुआ है।

SF पर समान प्रश्न: https://serverfault.com/questions/2888/why-is-raid-not-a-up

और कारण चाहिए?

संपादित करें: आपका विचार सही है और किसी के साथ भी हो सकता है। मैंने व्यक्तिगत रूप से एक से अधिक ड्राइव को विफल नहीं देखा है, लेकिन मैंने कुछ लोगों को वास्तव में एक साथ करीब देखा है। उनमें से कोई भी पुनर्निर्माण की उस खिड़की में नहीं था, लेकिन यह तकनीकी रूप से एक जोखिम है। लेकिन, आपके पास बैकअप होता है अगर कुछ सही होता है? haha। कुछ लोग इस पर कठिन तरीका कभी-कभी सीखते हैं। छापे 6 दोहरी समता के साथ अगले स्तर पर ले जाता है और 2 ड्राइव तक खो सकता है। किसी भी छापे के सेटअप के साथ, विफलता की प्रवृत्ति आकार (# ड्राइव) और सरणी की जटिलता के साथ बढ़ती है। अधिक ड्राइव = संभावित विफलता के अधिक बिंदु


क्षमा करें, मैं यह सब समझता हूं, बस पूछ रहा हूं कि क्या यह किसी के साथ हुआ है और परिदृश्य क्या था?
ब्रायन

3

आप एक RAID-5 परिदृश्य में सही हैं, यदि आप एक डिस्क खो देते हैं और फिर पुनर्निर्माण करते हैं, तो सिस्टम को RAID सेट में सभी बचे हुए ड्राइव के हर क्षेत्र को सफलतापूर्वक पढ़ना चाहिए। NetApp का दावा है कि कुछ स्थितियों के लिए (वे कुछ प्रकार के 28 ड्राइव तक के RAID सेट कर सकते हैं) दूसरी विफलता को मारने की आपकी मुश्किलें दस में से एक तक हो सकती हैं। इस प्रकार वे "डुअल-पैरिटी" करते हैं जो मुझे लगता है कि RAID-6 से संबंधित है।

स्पष्ट रूप से आपके पास RAID सेट में अधिक ड्राइव हैं, और वे जितने बड़े हैं, उतनी ही अधिक संभावना है कि आप किसी समस्या से टकराएंगे। एक छोटे से RAID सेट (3-5 डिस्क) के लिए बाधाओं को शायद RAID-5 का उपयोग करने के खिलाफ बहुत दूर स्थानांतरित नहीं किया गया है।

लेकिन मैं हमेशा NetApps पर RAID-DP करता हूं जहां मैं कर सकता हूं।


+1 मैंने कभी नहीं सोचा था कि "सभी जीवित ड्राइव के हर क्षेत्र को सफलतापूर्वक पढ़ना चाहिए" तथ्य।
एरोनल्स

2

कोई व्यक्तिगत अनुभव नहीं है, लेकिन मैंने उन लोगों की चीखें सुनी हैं जिनके साथ ऐसा हुआ है। किसी भी भंडारण प्रणाली - यह एक एकल ड्राइव, एक USB कुंजी, टेप, एक विशाल RAID इंस्टॉलेशन या अमेज़ॅन S3 है - अंततः आपके लिए सबसे अधिक असुविधाजनक है। RAID 5 सेट का पुनर्निर्माण करते समय एक दूसरी विफलता यह होने के तरीकों में से एक है।

एक तरफ, ट्रिपल-पैरिटी RAID के लिए समर्थन को कुछ दिनों पहले ओपनसोलारिस में एकीकृत किया गया था - इसलिए कम से कम एक विक्रेता को लगता है कि समानता RAID पुनर्निर्माण के दौरान दो अतिरिक्त विफलताओं के लिए अनुमति देना इंजीनियरिंग प्रयास के लायक है।


1

यह वास्तव में वास्तव में होता है। यही कारण है कि नेटएप स्टोरेज सॉल्यूशंस में RAID 6 का कार्यान्वयन है। यह सिर्फ उस स्थिति में है जब आप पुनर्निर्माण के दौरान दूसरी ड्राइव खो देते हैं।

आप निम्न पृष्ठ लिंक पाठ पर सूचीबद्ध मानक फ़ार्मुलों का उपयोग करके विफलता की संभावना की गणना कर सकते हैं जैसा कि आप डेटा ड्राइव के बड़े और बड़े पैमाने पर करते हैं, बस ऐसी विफलता की संभावना बढ़ जाती है। यदि आपके पास पर्याप्त डिस्क हैं तो आप इस नंबर को चिंता क्षेत्र में धकेल सकते हैं यदि आप भारी संख्या में डेटा वॉल्यूम के साथ RAID 5 का उपयोग कर रहे हैं।

मैं आपको व्यक्तिगत अनुभव से बता सकता हूं कि आप निश्चित रूप से एक ही महत्वपूर्ण समय सीमा के भीतर एक ही सरणी में दो ड्राइव विफलताएं हो सकते हैं। RAID 6 ने मुझे बैकअप से पुनर्स्थापित करने से बचाया।

उम्मीद है की यह मदद करेगा


1

यहां एक परिदृश्य है: आपके RAID5 सरणी पर एक ड्राइव विफल हो जाती है, लेकिन आपका स्पेयर पहले से ही आसपास बैठा था, या नई हार्ड ड्राइव के लिए आदेश के माध्यम से आखिरकार। आप (या कुछ दूरस्थ मिनियन शायद) दोषपूर्ण एक को बदलने के लिए हाथ में ताजा ड्राइव के साथ जाते हैं। खराब लेबलिंग, थकावट या सिर्फ सादे मूर्खता के कारण, शेष अच्छी ड्राइवों में से एक को दोषपूर्ण एक के बजाय बाहर निकाल दिया जाता है ... और आपकी दूसरी विफलता है।


1

मैंने इसे कई बार देखा है क्योंकि मैं डेटा रिकवरी व्यवसाय में हूं। और हाँ वे अक्सर एक ही समय में असफल हो जाते हैं, लेकिन मुझे विश्वास नहीं होता कि इससे कोई लेना-देना है जब वे आवश्यक रूप से बनाए गए थे, जैसा कि मैंने भी देखा है कि यह बेमेल ड्राइव के साथ होता है। ज्यादातर बार इस तरह की विफलता आंधी तूफान, पावर सर्ज या पावर आउटेज के तुरंत बाद होती है।

आमतौर पर सर्ज ड्राइव या RAID नियंत्रक को नुकसान पहुंचाता है, और कुछ दिनों के भीतर वे विफल होने लगते हैं। मैं वास्तव में एक सरणी को पुनर्प्राप्त करने पर अभी काम कर रहा हूं जिसमें दो ड्राइव एक पावर आउटेज के बाद एक साथ विफल हो गए थे। (अभी निराशाजनक लग रहा है)

थोड़ा टिप: सर्ज रक्षक वास्तव में आपके उपकरणों की रक्षा नहीं करते हैं। हमेशा अपने छापे 5 को एक अच्छे यूपीएस से जोड़ें। मैंने ऐसा कभी नहीं देखा है जब सरणी यूपीएस पर थी।


1

अकस्मात एक एकल-समता सेट से दूसरी अच्छी ड्राइव को खींचकर एक अच्छा RAID कार्यान्वयन के साथ सरणी को नष्ट नहीं करना चाहिए। मुझे पता है कि ZFS RAID-Z सरणी पर किसी भी I / O को फ्रीज कर देगा जब तक आप इसे फिर से ऑनलाइन नहीं करते।


0

एक अन्य परिदृश्य: एक दूरस्थ मिनियन को टेपड्राइव से बैकअप टेप लाने का आदेश दिया गया है। वह रैक पर जाती है और टेप को टेपड्राइव से बाहर नहीं निकालती है ... लेकिन एक ही समय में 2 (दो) एचडीडी को ड्राइवबाय से बाहर निकाल दिया जाता है और 2: विफलता ड्राइव।

आपको लगता है कि यह बहुत दूर है? वैसे मैं अब एक ग्राहक पर हूं जिसने अभी किया है और अब एक सर्वर पुनर्निर्माण पर देख रहा है।

अच्छा पतला वह टेप जो वास्तव में टेपड्राइव या व्हाट्सएप में नहीं जला था ;-)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.