RAID 5 कॉन्फ़िगरेशन में ड्राइव की विफलता से कैसे उबरें?


15

आज सुबह हमारे डेटाबेस सर्वर पर एक ड्राइव विफल रही। RAID 5 कॉन्फ़िगरेशन में ड्राइव ऐरे (3 डिस्क) सेटअप है।

जबकि हम एक ड्राइव रिप्लेसमेंट की प्रतीक्षा कर रहे हैं हम एक रिकवरी रणनीति की तैयारी कर रहे हैं। उपयोगकर्ता सिस्टम पर काम करना जारी रख रहे हैं, यद्यपि बहुत धीरे-धीरे (पता नहीं क्यों ??)।

कोई नया ड्राइव कैसे स्थापित करता है - क्या इस ड्राइव के डेटा को स्वचालित रूप से समता से फिर से बनाया जाएगा या कोई अन्य प्रक्रिया है जिसका हमें पालन करना चाहिए?

संपादित करें: यह एक हार्डवेयर RAID नियंत्रक है। (अब तक के जवाब के लिए धन्यवाद, सराहना)


4
वैसे, किसी महत्वपूर्ण सर्वर पर ड्राइव विफल होने से पहले यह तय करने का समय कि किसी महत्वपूर्ण सर्वर पर ड्राइव विफल रहता है।
डेविड श्वार्ट्ज

जवाबों:


15

सिस्टम बहुत धीमी गति से चल रहा है क्योंकि इसमें लापता डेटा को फिर से बनाना है जिसमें अतिरिक्त सीपीयू और आई / ओ शामिल हैं।

यदि आपके पास RAID-5 कॉन्फ़िगरेशन में एक लापता डिस्क है, तो आपके पास कोई पुनर्प्राप्ति रणनीति नहीं है । यदि कोई अन्य डिस्क नीचे जाती है तो आप अपना डेटा खो देंगे । भागो, चलना मत करो, निकटतम विक्रेता से जिसमें आप निर्माता के वारंटी द्वारा कवर किए गए एक संगत हिस्से को एक ही दिन के तत्काल कूरियर द्वारा भेज सकते हैं। यदि आपने जिस विक्रेता से सरणी खरीदी है, वह पहले से ही भाग लेने की प्रक्रिया में है, तो दोनों भाग प्राप्त करें और दूसरे को एक स्पेयर के रूप में हटा दें।

यदि आपके पास उत्पादन प्रणाली के लिए एक RAID-5 का उपयोग किया जा रहा है, तो आपको सरणी में एक स्पेयर डिस्क को गर्म स्पेयर के रूप में छोड़ने पर विचार करना चाहिए।

जोड़ा - यदि आपके लॉग एक अलग वॉल्यूम (शारीरिक रूप से अलग डिस्क) पर नहीं हैं, तो उन्हें डिस्क के एक अलग सेट पर ले जाएं, यहां तक ​​कि सिर्फ एक दर्पण वाली जोड़ी भी। यह एक प्रदर्शन जीत भी होगी यदि आपके डेटाबेस पर कोई महत्वपूर्ण भार है क्योंकि लॉग वॉल्यूम पर विवाद का प्रदर्शन पर प्रतिकूल प्रभाव पड़ता है।

यदि यह संभव है तो आप निम्न कार्य करके अपने डेटाबेस को और अधिक मजबूत बना सकते हैं:

  1. डेटाबेस को बंद करें।
  2. डेटाबेस बैकअप।
  3. लॉग को डिस्क के भौतिक रूप से अलग सेट पर ले जाएं (सुनिश्चित करें कि आप डेटाबेस को फिर से कॉन्फ़िगर करें ताकि यह पता चले कि लॉग को कहां स्थानांतरित किया गया है)।
  4. डेटाबेस और एप्लिकेशन को पुनरारंभ करें।

यदि आपके पास एक अलग वॉल्यूम पर लॉग हैं, तो आप बैकअप से आगे और रोल कर सकते हैं यदि और केवल अगर डिस्क विफलता लॉग से समझौता नहीं करती है। डेटाबेस लॉग निम्न कारणों से (अन्य के अलावा) के लिए एक अलग डिस्क वॉल्यूम पर होना चाहिए:

  • लॉग्स उपयोग पैटर्न मुख्य रूप से अनुक्रमिक होते हैं, फ़ाइल के अंत में लॉग एंट्रीज़ को जोड़ते हैं (फ़ाइल प्रभाव में एक रिंग बफर है)। इसका मतलब यह है कि बड़ी संख्या में लॉग प्रविष्टियों को जल्दी से बाहर लिखा जा सकता है क्योंकि इसमें डिस्क डिस्क की छोटी सी गतिविधि होती है।

  • अगर वे भारी डिस्क एक्सेस वर्कलोड (जैसे एक ट्रांसेक्शनल टेबल और इंडेक्स) के साथ भौतिक डिस्क साझा कर रहे हैं, तो वे अनुपातहीन रूप से धीमा हो जाएंगे क्योंकि सिर की तलाश गतिविधि अनुक्रमिक लेखन को बाधित करती है।

  • एक अलग वॉल्यूम पर लॉग्स होना लगभग हमेशा एक प्रदर्शन जीत है और केवल लॉग्स के लिए एकल मिरर किए गए जोड़े की आवश्यकता होती है जो काफी भारी कार्यभार का समर्थन करता है। इसका मतलब यह है कि यह करने के लिए हार्डवेयर काफी सस्ता है, इसलिए बड़े प्रदर्शन और विश्वसनीयता की जीत के लिए थोड़ी लागत है।

  • यदि आपका डेटा सरणी नीचे जाता है तो लॉग खो नहीं जाते हैं। यदि आपके पास एक उचित बैकअप रणनीति है, तो आप बैकअप से पुनर्स्थापित कर सकते हैं और लॉग से फ़ॉवर्ड को रोल कर सकते हैं। इसका मतलब यह है कि एक पूरे सरणी सर्वर पर विफलता के एक बिंदु के बिना नीचे जा सकते हैं। डेटा हानि के कारण लॉग और डेटा सरणियों को एक साथ विफल होना पड़ता है।


उत्तर के लिए धन्यवाद विशेष रूप से समझा रहा है कि सिस्टम धीरे-धीरे क्यों चल रहा है।
फिलिप फौरी

सटीक। मैं भी इसे तब तक बंद करने का सुझाव दूंगा जब तक आपको वह प्रतिस्थापन ड्राइव नहीं मिल जाती। जैसे निगेल कहते हैं, आपके पास कोई वसूली की रणनीति नहीं है। एक और ड्राइव खो दो, यह सब ढीला।
स्टु थॉम्पसन

हाय निगेल, समय निकालने और अपनी विशेषज्ञता साझा करने के लिए धन्यवाद। यह वास्तव में बहुत अच्छी सलाह है। मैं ठीक होने के परिणाम के बारे में बाद में रिपोर्ट करूंगा।
फिलिप फौरी

5

1) बैकअप।

अभी कोई डेटा नहीं खो गया है। यदि आपके बैकअप अब बैकअप नहीं हैं।

2) मैनुअल पढ़ें, विक्रेता को कॉल करें आदि।

अलग-अलग RAID सिस्टम में एक डिस्क को बदलने के लिए अलग-अलग चरण होते हैं, और गलत तरीके से आपने पूरे सरणी को नष्ट करने का जोखिम उठाया है। यह जानने के बिना कि आपके पास किस तरह का RAID हार्डवेयर / सॉफ्टवेयर है, हम केवल आवश्यक चरणों का अनुमान लगा सकते हैं।

इसके अलावा, धीमी गति से प्रदर्शन होता है क्योंकि नीचा स्थिति में RAID 5 (यानी: एक डिस्क डेड) में भयानक पठन प्रदर्शन होता है। कितना भयानक निर्भर करता है कि समता को कैसे संग्रहीत किया जाता है और कौन सी डिस्क मर गई, लेकिन "अच्छा" समाचार धीमा है एक डिस्क के साथ प्रदर्शन एक ज्ञात मुद्दा है और आतंक का कारण नहीं है।


4

पहले मैं उस हार्डवेयर / सॉफ्टवेयर के मैनुअल को पढ़ूंगा जो आप उपयोग कर रहे हैं - विफलता रिकवरी के लिए अनुभाग :)

डिस्क की जगह और फिर से सरणी के पुनर्निर्माण का एक साधारण मामला होना चाहिए।

ऐसे मामलों में सबसे महत्वपूर्ण बिंदु यह है कि डिस्क को जितनी जल्दी हो सके बदल दिया जाना चाहिए क्योंकि अगर एक और डिस्क विफल हो जाती है तो आप शायद डेटा खो देंगे। इसके अलावा, आपको विफलता का कारण पता होना चाहिए - क्या यह इसलिए था क्योंकि डिस्क पुरानी हो रही थी? क्या आपको दूसरे लोगों को भी बदलना चाहिए? या यह एक शक्ति वृद्धि, गर्मी या कंपन के कारण था?


1
शायद डेटा खो? सबसे निश्चित रूप से सरणी पर सभी डेटा खो देते हैं! जेल जाओ, पास मत जाओ। (एक तरफ बैकअप, निश्चित रूप से।)
स्टु थॉम्पसन

1

जहाँ तक मुझे समझ में आता है कि RAID5, जब आपका विफल ड्राइव को बदल देता है, तो यह स्वचालित रूप से अन्य दो पर संग्रहीत जानकारी से पुनर्निर्माण होता है। चाहे आप नई ड्राइव को 'हॉट-स्वैप' कर सकें, यह आपके सिस्टम पर निर्भर करता है - आपको पहले पावर डाउन करना पड़ सकता है। किसी भी तरह से, ड्राइव की अपेक्षाकृत कम लागत और आपके डेटा के महत्व को देखते हुए (पहली जगह में RAID5 का उपयोग करने के आपके निर्णय द्वारा दर्शाया गया है), आपको वास्तव में एक अतिरिक्त ड्राइव करनी चाहिए, एक दराज में बैठे, इस तरह की घटना के लिए तैयार ।

मैंने हाल ही में अपने लिए एक नया विकास पीसी बनाया है, और RAID5 के तहत मुख्य डेटा ड्राइव सेट करता है। मैंने एक से अधिक ड्राइव करने का आदेश दिया, ताकि मुझे उस आपातकालीन क्षण के लिए तैयार अतिरिक्त मिल जाए (मुझे उम्मीद है कि ऐसा नहीं होगा)

अब आपने सवाल पूछा है, मुझे लगता है कि मैं इस विषय पर कुछ और पढ़ना चाहूंगा।


छोटे डेटा संस्करणों के लिए एक प्रतिबिंबित जोड़ी बेहतर होती है क्योंकि इसमें आमतौर पर छोटे RAID -5 की तुलना में बेहतर अनुक्रमिक गति होती है। यदि आप हॉट-स्वैप चाहते हैं, तो कुछ हॉट-स्वैप बे सिस्टम को देखें जैसे कि scsi4me.com
ConcernedOfTunbridgeWells

0

पूरी तरह से प्रणाली-निर्भर। मैनुअल क्या कहते हैं? क्या आपका हार्डवेयर नियंत्रक से ड्राइव बे तक के हॉटप्लगिंग को पूरी तरह से सपोर्ट करता है? क्या आपके पास हाल ही में बैकअप है?


0

NXC की पोस्ट इसे अच्छी तरह से प्रस्तुत करती है। यदि आप दूसरी बार विफल होने से पहले दोषपूर्ण ड्राइव को प्रतिस्थापित नहीं करते हैं, तो अभी भी लगभग सभी चीजें (कभी-कभी सब कुछ) रिकवरी सेवा द्वारा पुनर्प्राप्त करने का एक अच्छा मौका है। डेटा अभी भी डिस्क पर है, और असफल डिस्क को आमतौर पर उचित उपकरण के साथ विशेष प्रयोगशाला में जीवन में वापस लाया जा सकता है। हालाँकि इस सेवा की कीमत काफी अधिक है। एक स्पेयर डिस्क और उचित बैकअप (एनएक्ससी के सुझाव के अनुसार) निश्चित रूप से भविष्य में जाने का रास्ता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.