RAID-6: एक ही समय में दो मृत ड्राइव को बदलने के लिए बेहतर है, या एक समय में एक?


21

हमारे पास 16-ड्राइव RAID-6 है जिसमें तीन समस्या ड्राइव हैं। दो पहले से ही मृत हैं, और तीसरा स्मार्ट चेतावनी दे रहा है। (कोई बात नहीं कि यह इतनी बुरी स्थिति में कैसे पहुंच गया।)

स्पष्ट रूप से हम मृत ड्राइव को उस जगह से पहले बदलना चाहते हैं जो अभी भी काम कर रहा है, लेकिन क्या यह बेहतर है:

  1. एक मृत ड्राइव को बदलें, RAID पुनर्निर्माण करें, फिर दूसरे को बदलें, और इसे फिर से बनने दें; या

  2. एक बार में दोनों ड्राइव को बदलें और इसे दोनों को समानांतर में पुनर्निर्माण करें?

इसे दूसरे तरीके से रखने के लिए, क्या हम एक ड्राइव या दो को फिर से शुरू करके तेजी से अतिरेक की स्थिति में वापस आएंगे? क्या दो ड्राइव को समानांतर में पुनर्निर्माण करने से पुनर्निर्माण की प्रक्रिया धीमी हो जाती है?

यदि यह मायने रखता है, तो नियंत्रक 3ware 9650SE-16ML है।


10
आपके द्वारा प्राप्त की गई हर चीज को पार करें और अपने पसंदीदा $ देवता को एक बड़ा दान भेजें!
user9517

1
क्या मैं इस संबंध में केवल एक प्रश्न पूछ सकता हूं; क्या आप हमें इस सरणी में डिस्क के सटीक बनाने और मॉडल को बता सकते हैं - यदि मेरा संदेह सही है तो आप यह देख सकते हैं कि यह प्रश्न भविष्य के उपयोगकर्ताओं के लिए एक उपयोगी संदर्भ बिंदु बन गया है जो कुछ प्रश्न पूछ रहे हैं। धन्यवाद।
चॉपर 3

8
@Warren - AIEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE! उन्होंने इसे बंद कर दिया? बुरा जूजू मेरे दोस्त! इस बार बहुत देर हो चुकी है, लेकिन आम तौर पर ड्राइव को बंद करने की बात कर रहे हैं (विशेषकर यदि वे पुराने ड्राइव जो लंबे समय से चल रहे हैं और चल रहे हैं) उन्हें स्पिनअप पर त्रुटियों को फेंकने का मौका देता है (और नियंत्रक को "हाँ" कहने का कारण बनता है) वह ड्राइव अब भी तला हुआ है ")
voretaq7

2
@ voretaq7: मैंने एक बार MSA-20 बॉक्स से सभी डिस्क्स को ~ 3 साल के अपटाइम और निरंतर उपयोग के बाद बंद करके नरक में भेज दिया है। फिर कभी ऐसा नहीं करेंगे :-)
karatedog

1
सरणी अब ऊपर और पुनर्निर्माण हो रही है, इसलिए मुझे सटीक मॉडल मिल सकते हैं, जो किसी को परवाह है। मूल हार्ड ड्राइव ST31000340NS थे, जिसका अर्थ है कि वे चॉपर 3 के सर्वर-रेटेड संस्करण के बारे में पूछ रहे थे। तो ये असफल या कुछ और के लिए कुख्यात हैं? (नए लोग ST31000524NS हैं।)
वॉरेन यंग

जवाबों:


27

!!!!! एक !!!!!

एक समय में एक करो, गंभीरता से दोस्त, यह किसी भी अन्य तरह से ठीक करने के बारे में मत सोचो।

और कुछ भी आपके पूर्ण सिस्टम बहाली कौशल का परीक्षण करेगा।


3
दो आइटम मैं इस जवाब देने के लिए जोड़ना होगा (1) कर रहे हैं प्रार्थना (जो भी देवता आप की तरह करने के लिए) और (2) निगरानी एक बार आप एक सुरक्षित राज्य (के लिए सब कुछ वापस मिल तो आपको पता चल जाएगा ड्राइव भविष्य और कर सकते हैं पते में असफल समस्या आपके सामने ढाई विफल होने से पहले है। वैकल्पिक रूप से आप भविष्य के लिए सरणी में एक गर्म स्पेयर को भी कॉन्फ़िगर कर सकते हैं।
voretaq7

3
या RAID 10 </ स्टॉक शेयर>
चॉपर 3

1
पुन: प्रार्थना , कोई टिप्पणी नहीं। :) पुन: निगरानी , मैं वकालत कर रहा हूँ कि वर्षों के लिए; शायद यह किसी के नीचे आग जलाएगा। पुन :: RAID -10 , एक बोली बाजार में बहुत अधिक डेटा; जब 3 टीबी डिस्क सामने आईं, तो हमने ट्रिपल अतिरेक नहीं किया, हमने डिस्क की संख्या में 1/3 की कटौती की। आह। पुन: गर्म पुर्जों , हम करते हैं कि अब यह ड्राइव इसे अनुमति देने के लिए काफी बड़ा है, लेकिन यह विशेष सर्वर 16 ड्राइव के बाड़े में 16 ड्राइव था, जब 1 टीबी ड्राइव सबसे बड़ी थी जिसे आप प्राप्त कर सकते थे, और हमें वास्तव में सभी 14 उपलब्ध टीबी की आवश्यकता थी । 24-ड्राइव सिस्टम पर जाने से काम नहीं होगा; पिछला देखें। :)
वॉरेन यंग

2
यदि ड्राइव पहले से ही विफल हो गए हैं, तो उन्हें चारों ओर रखने का कोई कारण नहीं है - बल्कि, मैं उम्मीद करूंगा कि दो लगातार rebuilds एक एकल की तुलना में अन्य ड्राइव के लिए अधिक तनावपूर्ण हैं।
साइमन रिक्टर

1
+1, यह। जबकि दो लगातार पुनर्निर्माण में अधिक तनाव होता है और दोनों को समाप्त करने से पहले तीसरी ड्राइव के विफल होने की अधिक संभावना होती है, यह एक तेज़ पुनर्निर्माण भी है, और यदि 2 डिस्क का पुनर्निर्माण करते समय सीमांत ड्राइव विफल हो जाता है, तो आप अभी भी ऑनलाइन रहते हैं। एक दोष-सहिष्णु राज्य का सबसे तेज़, सबसे सुरक्षित तरीका एक समय में एक है।
जोएल कोल

14

क्या आपके पास अच्छा, हाल ही में बैकअप है? यदि आपको नहीं लगता कि आप उन्हें उचित समय में प्राप्त कर सकते हैं?

मैं ईमानदारी से खराब ड्राइव को किसी अन्य चीज़ के पुनर्निर्माण के दौरान ऑफ़लाइन करने के बारे में अधिक चिंतित हूं - यदि आप पहले से ही एसएमआरआर त्रुटियों को फेंक रहे हैं तो आप आधे रास्ते से अधिक हैं।

मेरा सुझाव आपके बैकअप की पुष्टि करना होगा, फिर एक समय में एक ड्राइव को फिर से बनाने के लिए एक राज्य को पुनर्प्राप्त करने का प्रयास करना होगा जहां आप एक फेंकने वाली स्मार्ट त्रुटियों (मृत ड्राइव पहले, नरम-त्रुटियों आखिरी) को बदल सकते हैं।

यदि आपके पास कोई बैकअप नहीं है तो यह एक बकवास शूट है: सीमांत ड्राइव को विफल करने के लिए बैकअप के रूप में चिह्नित करने के लिए पर्याप्त सॉफ्ट एरर बना सकते हैं, जैसा कि एक पुनर्निर्माण करने की कोशिश कर सकता है।


2
इस सरणी का अधिकांश या सभी डेटा एक प्रकार का कैश है, जिसमें धीमे लिंक के माध्यम से बार-बार डेटा के टेराबाइट्स खींचने की आवश्यकता होती है। यह कैशे डेटा सभी बदली करने योग्य है, या तो इसे महीनों में (एक बार) फिर से डाउनलोड करके या किसी अन्य सरणी से कॉपी करने वाली साइट पर शिपिंग करके। इसलिए, बैकअप समस्या नहीं हैं। हम सरणी को सहेजने से रोकने के लिए जो प्रयास कर रहे हैं, वह है डाउनटाइम के हफ्तों को सेवा डिपो में सर्वर को भेजना, सरणी को फिर से आबाद करना और इसे वापस शिपिंग करना।
वॉरेन यंग

उस स्थिति में, @ chopper3 ने जो कहा वह बहुत हद तक भूमि का कानून है: एक समय में एक ड्राइव का पुनर्निर्माण करें और वास्तव में वास्तव में हार्ड ड्राइव करें कि आप अतिरिक्त रीड लोड के साथ सीमांत ड्राइव को ऑफ़लाइन यात्रा नहीं करते हैं।
voretaq7

भांजा - यह सुनकर खुशी हुई।
चॉपर 3

0

मैं इसे "एक डिस्क एक बार" के रूप में बदलने का कोई मतलब नहीं देखता।

जाहिर है, अगर RAID एक साथ दोनों डिस्क को "फिर से बदलना" करने में सक्षम है ( जो कि वैसे भी विफल हैं ) तो आप केवल पूरे RAID को तेजी से 2 विफलताओं को बनाए रखने की क्षमता हासिल करने की अनुमति देकर जीत जाते हैं ।


-1

मेरी 0.02 $

चूंकि सर्वर पहले से ही ऑफ़लाइन है, ड्राइव पर ddresoscope चलाएं जो विफल होने के बारे में है, इसे दूसरे, क्लोन ड्राइव पर क्लोन करने के लिए।

फिर सरणी में नई, सियान ड्राइव लगाएं। यदि क्लोनिंग सफल होता है, तो आप 2 रीबिल्ड के दौरान उस ड्राइव को विफल होने के जोखिम से बचेंगे।


यह एक हार्डवेयर RAID नियंत्रक है, अलग-अलग डिस्क पता योग्य नहीं हैं।
चॉपर 3
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.