RAID अपने आप पुनरुत्थान कर रहा है?


11

बल्कि मैंने अपने RAID सरणियों की स्थिति को यादृच्छिक रूप से जांचा cat/proc/mdstatऔर महसूस किया, कि मेरी एक सारणी पुनरुत्थान कर रही है:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

यह क्यों है और इसका क्या मतलब है? मुझे लगता है कि r/wअनुमतियों के साथ ठीक माउंट बिंदु तक पहुंच सकते हैं ।

EDIT 1 ( SLM के उत्तर के जवाब में )

मैं वास्तव में कुछ भी नहीं देख सकता अगर मैं इसके grepमाध्यम से dmesgऔर --detailस्विच मुझे या तो नहीं बताता, अर्थात यह प्रदर्शित करता है कि रेसक्युन प्रगति पर है ... लेकिन इस कारण के लिए कोई संकेत नहीं या यह सिंक से बाहर क्यों हो सकता है .. - मुझे लगता है इससे पहले कि मैं अपने हार्डवेयर को स्वैप करना शुरू करूँ, मुझे उस पर नज़र रखने की आवश्यकता हो सकती है।

जवाबों:


10

यह इंगित करता प्रतीत होगा कि RAID के 2 सदस्यों के बीच सिंक्रनाइज़ेशन एक दूसरे के साथ सिंक में नहीं रह रहे हैं।

1. लॉग की जांच करें

मैं आपके dmesgलॉग की जांच करूंगा और देखूंगा कि क्या कोई संदेश बता रहा है कि इस सरणी को बनाने वाले भौतिक HDD में से कोई भी हार्डवेयर विफलताएं हैं।

2. mdadm की जाँच करें

आप रेसक्यू के बारे में अधिक जानकारी प्राप्त करने के लिए स्विच mdadmका उपयोग करके भी परामर्श कर सकते हैं --detail:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

यदि दोनों डिवाइस ठीक लगते हैं और आप यह इंगित नहीं कर सकते कि किस डिवाइस में कोई समस्या है, तो आप उनके स्वास्थ्य की पुष्टि करने के लिए प्रत्येक HDD के खिलाफ HDAT2 या स्पिनराइट जैसे नैदानिक ​​उपकरण को अस्थायी रूप से चलाना चाहते हैं।

3. केबल लगाना

अगर एचडीडी चेक आउट करता है तो मैं केबल बिछाने की जांच शुरू कर दूंगा, मैं आमतौर पर इनकी अदला-बदली करूंगा।

4. नियंत्रक

मैं अगली बार नियंत्रक को स्वयं जाँच करूँगा, या तो प्रभावित सिस्टम से ड्राइव निकालकर एक द्वितीयक प्रणाली में उनका निदान करूँगा, या आगे की समस्या के निदान के लिए प्रभावित सिस्टम में एक 3 पार्टी कंट्रोलर कार्ड जोड़ूँगा।

5. बिजली की आपूर्ति

मानो या न मानो, मैं अतीत में मुद्दों के साथ था HDDs और RAID जहां एक असफलता स्वैपिंग, या विफल के बारे में, बिजली की आपूर्ति, मेरे RAID स्वास्थ्य मुद्दों को हल किया।


@cerr - हाँ, यदि resyncs सिर्फ वही होता है जो यादृच्छिक अंतराल प्रतीत होता है, तो संभावना है कि HDDs में से एक बाहर या 3,4, या 5 के रास्ते पर है। आप जिस अभिव्यक्ति का वर्णन कर रहे हैं, मैं एक था अपने आप में कुछ समय और यह उन स्थितियों में से है, जिन्होंने अतीत में मेरे लिए, इन विफलताओं को हल किया है।
slm

8

अपनी क्रोन फ़ाइलों की जाँच करें, कई डिस्ट्रोस एक सप्ताह में एक बार एक निर्धारित रेसक्यूक्स / री-चेक करते हैं।

CentOS 7.1 पर यह /etc/cron.d/raid-check में है

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

व्यवहार को संपादित करने के लिए / etc / sysconfig / raid-check


हालांकि आम तौर पर यह सिर्फ एक चेक होता है,
रिस्क्यूनिक

2
@frostschutz ... जब तक कि यह एक महीने का पहला रविवार न हो: serverfault.com/a/255549/299551 उस स्थिति में एक resync मजबूर है।
दान

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.