अरेका 1280ml RAID6 वॉल्यूम सेट विफल रहा

आज हम किसी भी प्रकार के सबसे खराब स्थिति में आते हैं और किसी भी तरह के अच्छे विचारों के लिए खुले हैं।

यहाँ हमारी समस्या है:

हम अपने वर्चुअल मशीन को होस्ट करने के लिए कई समर्पित स्टोरेज सर्वर का उपयोग कर रहे हैं। इससे पहले कि मैं जारी रखूं, यहाँ चश्मा हैं:

समर्पित सर्वर मशीन
आरईआरए 1280 एमएल RAID नियंत्रक, फर्मवेयर 1.49
12x सैमसंग 1TB HDDs

हमने एक RAID6-सेट को 10 डिस्क्स के साथ कॉन्फ़िगर किया है जिसमें एक लॉजिकल वॉल्यूम है। हमारे पास सिस्टम में दो हॉट स्पेर्स हैं।

आज एक एचडीडी विफल रहा। यह समय-समय पर होता है, इसलिए हमने इसे बदल दिया। पुनर्निर्माण पर एक दूसरी डिस्क विफल रही। आम तौर पर यह कोई मज़ा नहीं है। हमने एक स्थिर RAID पुनर्निर्माण सुनिश्चित करने के लिए भारी IO- संचालन को रोक दिया।

अफसोस की बात है कि पुनर्निर्माण के दौरान गर्म-स्पेयर डिस्क विफल हो गई और पूरी चीज बंद हो गई।

अब हमारे पास निम्न स्थिति है:

नियंत्रक का कहना है कि छापा सेट पुनर्निर्माण कर रहा है
नियंत्रक का कहना है कि वॉल्यूम विफल हो गया

यह एक RAID 6 प्रणाली है और दो डिस्क विफल हो गए हैं, इसलिए डेटा को बरकरार रखना है, लेकिन हम डेटा तक पहुंचने के लिए वॉल्यूम को फिर से ऑनलाइन नहीं ला सकते हैं।

खोज करते हुए हमें निम्नलिखित सुराग मिले। मुझे नहीं पता कि वे अच्छे हैं या बुरे:

ड्राइव के दूसरे सेट में सभी डिस्क को मिरर करना। इसलिए हमारे पास अलग-अलग चीजों की कोशिश करने की संभावना होगी, जो पहले से ही हमारे पास मौजूद हैं।
आर-स्टूडियो में सरणी को फिर से बनाने की कोशिश कर रहा है। लेकिन सॉफ्टवेयर के साथ हमारा कोई वास्तविक अनुभव नहीं है।
सभी ड्राइव को खींचना, सिस्टम को रिबूट करना, एरेका कंट्रोलर बायोस में बदलना, एचडीडी को एक-से-एक को पुन: स्थापित करना। कुछ लोग कह रहे हैं कि इसके द्वारा सिस्टम को ऑनलाइन लाया गया। कुछ कह रहे हैं कि प्रभाव शून्य है। कुछ कहते हैं, कि उन्होंने पूरी बात उड़ा दी।
"बचाव" या "LeVel2ReScUe" जैसे अनिर्दिष्ट एरेका कमांड का उपयोग करना।
कंप्यूटर फोरेंसिक सेवा से संपर्क करना। लेकिन जो ... फोन द्वारा प्राथमिक अनुमान 20.000 € से अधिक था। इसलिए हम विनम्रता से मदद मांगेंगे। शायद हम स्पष्ट याद कर रहे हैं?

और हां, हमारे पास बैकअप है। लेकिन कुछ प्रणालियों ने एक सप्ताह का डेटा खो दिया, यही कारण है कि हम सिस्टम को फिर से चालू करना चाहते हैं।

कोई भी मदद, सुझाव और सवाल स्वागत से अधिक हैं।

— रिचर्ड
स्रोत

मेरा तर्क है कि आप जो भी करते हैं, आपका पहला कदम ddसभी डिस्क का दर्पण होना चाहिए , बस अधिक नुकसान को रोकने के लिए और वास्तविक समाधान पर काम करते समय एक कमबैक योजना होनी चाहिए ।

— स्वेन

हम ऐसा करेंगे ...

— रिचर्ड

क्या hotspares के बारे में?

— Cawflands

क्या आप समर्थन के लिए विक्रेता से संपर्क कर सकते हैं? यह मानते हुए कि आप नहीं कर सकते हैं (और आपने @ SvenW के उत्कृष्ट सुझाव के अनुसार, सब कुछ करने के लिए dd का उपयोग किया है), असफल ड्राइव को क्यों नहीं बदला, रिबूट करें और देखें कि क्या होता है? मैं जरूरी सभी ड्राइव, केवल असफल लोगों को नहीं खींचूंगा। लेकिन वास्तव में, आपका पहला दांव विक्रेता है, वे अपने सॉफ़्टवेयर को समझते हैं।

— जेरेमी

क्या आपने कोई समाधान निकाला? यदि ऐसा है तो कृपया हमें बताएं कि यह भविष्य के संदर्भ के लिए क्या है!

— अनुदान

जवाबों:

मुझे लगता है कि विकल्प 1 आपका सबसे अच्छा है।

12x नए HDDs लें, 1x नए RAID नियंत्रक दर्पण (dd if = का) के लिए प्रयास करें कि नए डिस्क 1: 1 में किसी भी linux बॉक्स का उपयोग कर रहे हों। 1x नए RAID नियंत्रक और 12x नए HDDs का उपयोग करके एक नया सर्वर बनाएँ

नए सर्वर में सरणी को फिर से बनाने का प्रयास करें। सफलता? महान। रूक जा।
पुनर्निर्माण विफल? पुराने डिस्क को फिर से नए लोगों को दर्पण करें, विकल्प I + 1 आज़माएं

— cipy
स्रोत

यह दुर्भाग्य से एक बहुत ही सामान्य परिदृश्य है। इस साल पहले एक अच्छा Google अध्ययन हुआ था, और यह पता चला है कि RAID के साथ डेटा खोना सरणी के पुनर्निर्माण के दौरान हो सकता है। यह अलग-अलग RAID प्रणालियों को अलग-अलग गंभीरता के साथ प्रभावित कर सकता है। यहाँ RAID6 परिदृश्य है:

आपके सरणी में 3 डेटा और 2 समता डिस्क हैं।
यदि आप एक डिस्क खो देते हैं तो यह सुनिश्चित हो जाता है कि सभी डेटा पुनर्प्राप्त करने योग्य है।
यदि आप 2 खो डेटा खो दिया है

ऐसा क्यों है?

निम्नलिखित के बारे में सोचें: कुछ डेटा होने दें, मान लें कि आपके पास निम्न डेटा ब्लॉक में किसी फ़ाइल के पहले 3 ब्लॉक हैं: A1 + A2 + A3 और निम्न समता: Ap + Ap hdd1 ... hdd5 पर बैठे

यदि आप 1 और 3 के बीच किसी भी दो डिस्क को खो देते हैं तो आपने डेटा खो दिया है क्योंकि डेटा पुनर्प्राप्त करने योग्य नहीं है, आपके पास 2 समानता और 1 डेटा ब्लॉक है।

अब 10 डिस्क के साथ एक ही परिदृश्य भिन्न हो सकता है, लेकिन मुझे लगता है कि यह उसी तरह से संभाला है कि आप डेटा को 8 ब्लॉकों में विभाजित करते हैं और समता को 2 अन्य ड्राइवों में सहेजते हैं और 2 गर्म-पुर्जों को रखते हैं। क्या आप अपने RAID नियंत्रक विन्यास का विवरण जानते हैं?

मैं ऑफसाइट बैकअप से पुनर्प्राप्त करना शुरू कर दूंगा (मुझे लगता है कि आपके पास कुछ है), और सेवा वापस आ गई है जितना संभव हो उतना डेटा पुनर्प्राप्त करने के लिए, यूनिक्स का उपयोग करके और ड्राइव को छवियों के लिए और इसे उदाहरण के लिए लूप डिवाइस के रूप में उपयोग करके।

http://wiki.edseek.com/guide:mount_loopback

आपको यह जानने की जरूरत है कि RAID नियंत्रक किस प्रकार के मेटाडेटा का उपयोग करता है और यदि आप भाग्यशाली हैं तो यह डैम्रेड जैसे कुछ टूल में समर्थित है।

लेकिन इसका मतलब यह नहीं है कि आप डेटा को पूरी तरह से पुनर्प्राप्त कर सकते हैं, क्योंकि फाइलें कई-कई ब्लॉकों के बीच आमतौर पर वितरित की जाती हैं, पुनर्प्राप्ति आपके किसी भी डेटा को वापस लाने में विफल होने की संभावना है।

RAID के बारे में अधिक जानकारी:

https://raid.wiki.kernel.org/index.php/RAID_setup

— इस्तवान
स्रोत