कैसे एक शक्ति falure के बाद CentOS 6 सर्वर वीएम होस्ट जाँच करने के लिए?

9

आज दोपहर, हमारे कार्यालय में किसी ने हमारे सर्वर से प्लग खींचने का फैसला किया क्योंकि यह बाहर तूफान था। वे इसे बंद नहीं हुआ था, वे तो बस प्लग बाहर निकाला, जबकि यह चल रहा था।

सर्वर में एक सॉफ्टवेयर RAID 10 कॉन्फ़िगरेशन में 4 SATA ड्राइव और RAID के शीर्ष पर LVM चल रहा है। सर्वर CentOS 6.2 Minimal चला रहा है और KVM का उपयोग करके एक वर्चुअल मशीन होस्ट है। जिस समय यह अनप्लग्ड था, उस समय कंप्यूटर पर कई गेस्ट मशीनें चल रही थीं। प्रत्येक अतिथि के पास एक या एक से अधिक LVM विभाजन होते हैं जो वह हार्ड ड्राइव के रूप में सीधे उपयोग करता है। अतिथि विभाजन ext3, ext4 और NTFS हैं। होस्ट OS एक EXT4 विभाजन पर है।

बाद में, जब शक्ति वापस आई, तो उस व्यक्ति ने इसे वापस प्लग किया और यह शुरू हुआ। चूँकि उन्होंने पहले मॉनिटर को अटैच किए बिना इसे प्लग इन किया, इसलिए स्क्रीन पर जो आया उसे देखने का कोई तरीका नहीं है। मैं अब एक मॉनिटर संलग्न करने की कोशिश की, लेकिन जब तक नजर रखने के बूट पर जुड़ा हुआ है यह काम नहीं करेगा। मैंने इसे छोड़ दिया है, ठीक वैसे ही, जब तक मुझे कुछ सलाह नहीं मिल सकती क्योंकि मैं कुछ और नहीं करना चाहता (आगे)।

मैं SSH के माध्यम से मेजबान में प्रवेश कर सकता हूं। मैंने इसे अभी तक रिबूट नहीं किया है, अगर लॉग में कुछ ऐसा है जो उपयोगी हो सकता है।

मैं क्या करने की जरूरत है सभी डिस्क और डेटा अखंडता के लिए विभाजन की जांच, कि यदि भी संभव है। मुझे लगता है कि RAID 10 किसी प्रकार के मेमोरी आधारित कैश का उपयोग करता है और मुझे ड्राइव के असंगत होने की चिंता है, या फाइलें भ्रष्ट होने की वजह से ड्राइव को लिखने के लिए क्यू में चीजें थीं जो अभी तक नहीं लिखी गई थीं।

[root@othello ~]# cat /proc/mdstat
Personalities : [raid10] [raid1] 
md2 : active raid1 sdc1[2] sda1[0] sdd1[3] sdb1[1]
      102388 blocks super 1.0 [4/4] [UUUU]

md0 : active raid10 sda3[0] sdc3[2] sdd3[3] sdb3[1]
      1952289792 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md1 : active raid10 sdc2[2] sda2[0] sdd2[3] sdb2[1]
      1022976 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]

unused devices: <none>

यह भी मुझे परेशान करता है कि यह मेरे सरणियों को बुला रहा है, "पास-प्रतियां"। क्या यह सामान्य है?

ड्राइव और डेटा के साथ सब कुछ ठीक है यह सुनिश्चित करने के लिए मुझे किस तरह की डिस्क जांच करनी चाहिए? क्या कोई अन्य चीजें हैं जो मुझे जांचनी चाहिए?

अपडेट करें

Mdadm का आउटपुट --detail

[root@othello ~]# mdadm --detail /dev/md0
/dev/md0:
        Version : 1.1
  Creation Time : Sat Feb 25 09:26:20 2012
     Raid Level : raid10
     Array Size : 1952289792 (1861.85 GiB 1999.14 GB)
  Used Dev Size : 976144896 (930.92 GiB 999.57 GB)
   Raid Devices : 4
  Total Devices : 4
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Sun Mar 11 12:59:30 2012
          State : active 
 Active Devices : 4
Working Devices : 4
 Failed Devices : 0
  Spare Devices : 0

         Layout : near=2
     Chunk Size : 512K

           Name : othello.myserver.com:0  (local to host othello.myserver.com)
           UUID : 58ba40ab:12516733:e3779362:68200fdd
         Events : 2208

    Number   Major   Minor   RaidDevice State
       0       8        3        0      active sync   /dev/sda3
       1       8       19        1      active sync   /dev/sdb3
       2       8       35        2      active sync   /dev/sdc3
       3       8       51        3      active sync   /dev/sdd3

— छेद
स्रोत

3

RAID ठीक है, सभी UUUU का अर्थ है कि सरणी में सभी डिस्क ऊपर हैं। मैं अब इसके बारे में भी चिंता नहीं करूँगा।

VM के लिए, यदि आप उन पर fscks चलाना चाहते हैं, तो VM को रोकें और चलाएँ

fsck.ext3 (ext4, etc) /path/to/lvm (आमतौर पर / देव / vg-name / lv-name)

यदि आप केवीएम का उपयोग कर रहे हैं, तो virshआपको वीएम की जरूरत के कुछ भी करने में सक्षम होना चाहिए । यहाँ पर वायरल मैन पेज http://linux.die.net/man/1/virsh का लिंक दिया गया है

यदि आप वास्तव में अपने छापे सरणियों पर डिस्क जांच चलाना चाहते हैं, तो आपको एक एकल उपयोगकर्ता मोड या एक लाइव सीडी से बूट करना होगा ताकि आप व्यक्तिगत / देव / mdX उपकरणों को fsck कर सकें। चूंकि प्राथमिक फाइलसिस्टम EXT4 है, मैं परेशान नहीं करूंगा, यह बिजली के आउटेज के साथ EXT3 से बहुत बेहतर है।

— jemmille
स्रोत

+1, कल कोशिश करेंगे।

— निक

1

Mdadm - detail / dev / md0 (md1 और md2 के लिए समान) आज़माएं।

फिर यहां दी गई सलाह की कोशिश करें: http://linas.org/linux/raid.html

— स्तोत्र
स्रोत

मैं के उत्पादन में पोस्ट किया है mdadm --detail /dev/md0इसके बाद के संस्करण। मैं आपके द्वारा लिंक किए गए गाइड के माध्यम से पढ़ता हूं, लेकिन इसमें EXT4 फाइल सिस्टम का उल्लेख नहीं है, या क्या, विशेष रूप से मैं अखंडता की जांच कर सकता हूं?

— निक

RAID अखंडता के संदर्भ में फाइलसिस्टम प्रकार मायने नहीं रखता। यदि आपके पास रखरखाव की अवधि है, तो आप प्रभावित फाइल सिस्टम और fsckउन्हें अनमाउंट कर सकते हैं। यदि आप स्वयं RAID उपकरणों की जांच करना चाहते हैं, तो आप कुछ ऐसा कर सकते हैं echo "check" > /sys/block/md0/md/sync_action। या किसी प्रकार की mdadm रिपेयर करने के लिए इसकी "रिपेयर" करें।

— ccc

मैं कल यह कोशिश करूँगा और वापस रिपोर्ट करूँगा।

— निक