मेरे पास VMware ESXi v4.1.0 348481 सर्वर चल रहा है। इसमें हार्डवेयर RAID10 और SATA बैकअप ड्राइव है। मेरे पास एक वीएम चल रहा है जिसमें यह RAID10 डेटास्टोर पर प्राथमिक बूट vmdk है, और SATA बैकअप ड्राइव के डेटास्टोर पर 600 जीबी vmdk है। वीएम फ्रीबीएसडी कर्नेल के साथ डेबियन लाइनक्स चलाता है, और बैकअप ड्राइव के लिए जेडएफएस का उपयोग करता है।
EDIT: ड्राइव सीधे VM से जुड़ी नहीं है । यह VMware डेटास्टोर के रूप में उपयोग किया जाता है, और VM SATA ड्राइव के डेटास्टोर पर एक vmdk है। डेटास्टोर पूर्ण नहीं है (केवल 65% पूर्ण)
मैं SSH का उपयोग कर सर्वर में लॉग इन किया और पाया कि कल रात बैकअप लटका हुआ था, और zfs list
या zpool list
दोनों लटका हुआ था। इसलिए मैंने ESXi में वर्चुअल कंसोल खोला और यह देखकर दुखी हुआ:
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
मैंने वीएम को रिबूट करने की कोशिश की और मुझे एक संदेश मिला कि सिस्टम रिबूट के लिए नीचे जा रहा है, और फिर वह लटका हुआ है। (^ C दिखाई देता है लेकिन मारता नहीं है shutdown
)। मैं बीच kill -9
में zpool list
zfs list
या rsync
प्रक्रियाओं को बाधित नहीं कर सकता - जब मैं कोशिश करता हूं तो कुछ भी नहीं होता है।
- क्या यह बैकअप SATA ड्राइव को विफल कर रहा है? या यह सिर्फ एक ESXi त्रुटि हो सकती है?
- VSphere क्लाइंट में मैं कैसे बता सकता हूं कि ड्राइव विफल हो रही है? मुझे कोई संकेत नहीं मिला, हार्डवेयर हेल्थ स्टेटस के तहत सब कुछ अच्छा लग रहा है, और मैंने स्टोरेज कॉन्फिगरेशन के तहत कुछ भी नहीं देखा।
- मुझे यहां से कैसे आगे बढ़ना चाहिए? क्या मुझे सिर्फ वीएम को हार्ड रिबूट करना चाहिए?
अद्यतन: मैं सिर्फ VM को रिबूट करता हूं। यह ऑनलाइन वापस आने के बाद, बैकअप ज़ूलू ऑनलाइन था, हालांकि:
root@timestandstill:/home/jnet# zpool status -v
pool: backup
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: none requested
config:
NAME STATE READ WRITE CKSUM
backup ONLINE 0 0 0
da1 ONLINE 0 0 0
errors: Permanent errors have been detected in the following files:
/backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics
मैं ड्राइव को बदलने की दिशा में बहुत अधिक झुक रहा हूं ...