CentOS 6 के साथ Dell PERC H710 RAID नियंत्रक के पीछे हार्ड डिस्क की स्थिति की निगरानी कैसे करें?


26

मेरे पास एक Dell सर्वर है जो RAID नियंत्रक कार्ड CentOS 6का उपयोग करके PERC H710RAID 5 सेटअप के साथ चल रहा है और मैं RAID नियंत्रक के पीछे हार्ड डिस्क विफलता / काम करने की स्थिति की निगरानी करना चाहता हूं।

तब मुझे हार्ड डिस्क की स्थिति की निगरानी करने और कुछ खराब होने पर अलर्ट ईमेल भेजने के लिए एक बैश स्क्रिप्ट का उपयोग करने में सक्षम होना चाहिए।

LSI MegaRAID SASआदेश उपकरण (के बारे में LSI MegaRAID SAS लिनक्स उपकरण) CentOS / रेड हैट / लिनक्स के लिए PERC H710 का समर्थन नहीं करता और smartctlया तो इसे समर्थन नहीं करता।

डेल वेबसाइट के आधार पर, CentOSआईएस ने इस सर्वर के लिए समर्थन नहीं किया है ( NX3200 PowerVault) और मैं हार्ड डिस्क की निगरानी के लिए कोई भी लिनक्स प्रोग्राम डाउनलोड नहीं कर सका।

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

किसी को पता है कि डेल पॉर्क H710 पर CentOS 6 के साथ हार्डवेयर छापे के पीछे हार्ड डिस्क की स्थिति की निगरानी कैसे करें?

जवाबों:


26

स्मार्ट है नहीं डिस्क या भंडारण की निगरानी में अंतिम शब्द !! यह एक घटक है, लेकिन आधुनिक RAID नियंत्रक ड्राइव और सरणी स्वास्थ्य को निर्धारित करने के लिए अन्य तरीकों के साथ इसका उपयोग करते हैं।

मैं मान रहा हूं कि यह डेल पॉवरएडज सर्वर में एक पीईआरसी नियंत्रक है।

डेल हार्डवेयर की स्वास्थ्य निगरानी के लिए सामान्य लिनक्स के अनुकूल दृष्टिकोण यम के माध्यम से लिनक्स के लिए डेल ओएमएसए एजेंटों को स्थापित करना है - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-allएजेंटों का पूरा सूट स्थापित करेगा। एक बार स्थापित होने के बाद, आप अपने सरणी के बारे में जानकारी प्राप्तomreport करने के लिए कमांड का उपयोग कर सकते हैं ।

उदाहरण:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1

7
यह मेरे लिनक्स मशीनों पर वेब सर्वर / एसएसएल जैसे अतिरिक्त घटक स्थापित करेगा लेकिन ऐसा लगता है कि मेरे पास कोई अन्य विकल्प नहीं है! मुझे अपने सर्वर में अनावश्यक पैकेज जोड़ने से नफरत है।
जियानलिन

2
उन OMSA कार्यक्रमों में से एक से संभावित मेमोरी लीक से सावधान रहें। यह 3-4 सप्ताह के दौरान धीरे-धीरे मेरे साथ हुआ, फिर उछाल, लिनक्स के लिए अधिक स्मृति नहीं।
bksunday

1
हां, रिसाव dsm_sa_snmpd में है (इसलिए मैं 'Killall -9 dsm_sa_snmpd', हल चलाता हूं)।
markusN

5
पीईआरसी 7 एक्सएक्सएक्स और 8 एक्सएक्सएक्स कंट्रोलर सिर्फ एलएसआई मेगरैड कंट्रोलर हैं और एलएसआई मेगासीएलआई टूल ठीक काम करेगा, यदि आप अपने सिस्टम को डेल लाइब्रेरी और जो भी अन्य सेवाओं और / या कर्नेल मॉड्यूल से छेड़छाड़ करना चाहते हैं, वे इन दिनों नहीं छोड़ रहे हैं। वहाँ LCL बाइनरी के लिए MegaCLI चीट शीट, नगिओस मॉनिटरिंग स्क्रिप्ट और परफॉर्मेंस ट्यूनिंग टिप्स बहुत हैं। यह सिर्फ मेरी व्यक्तिगत प्राथमिकता और पाठ्यक्रम की राय है। मैं एक न्यूनतावादी हूं।
हारून

@Xianlin, यह पूरी तरह सच नहीं है। हां, यह बहुत कचरा स्थापित करेगा लेकिन मेरा जवाब देखें। मैं अनावश्यक पैकेज नहीं जोड़ना चाहता था, इसलिए मुझे केवल उन लोगों के बारे में पता चला जो मुझे भंडारण के लिए आवश्यक थे।
माइक एस

25

आप स्मार्टक्ट्ल कमांड के साथ डिस्क की स्मार्ट स्थिति देख सकते हैं और यह -dतर्क है। उदाहरण के लिए, सरणी में पहली डिस्क देखने के लिए:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

यह स्मार्टमोनटूल 5.43-1.el6.x86_64 के साथ वैज्ञानिक लिनक्स 6 (एक और RHEL6 आधारित ओएस) पर है।


-d megaraid,0smartctl 6.6कमांड लाइन पर पर्याप्त था। इसमें DEVICESCANस्ट्रिंग की /etc/smartd.confआवश्यकता होती है-d removable
स्टुअर्ट कार्डॉल

9

स्वीकृत उत्तर दुस्साहस की सिफारिश करता है yum install srvadmin-all । Blecch। यहां बताया गया है कि इसे थोड़ा कम ब्लॅक-वाई कैसे बनाया जाए (लेकिन फिर भी ब्लॅक-वाई नॉन-वाईट; आप एचपी के प्लेटफ़ॉर्म पर बहुत अधिक दुबला हो सकते हैं। लेकिन मैं पचाता हूं ...) इसका मतलब है, केवल उन घटकों को स्थापित करें जो आपके मशीन पर स्टोरेज को प्रबंधित करने के लिए आवश्यक हैं। ।

BTW, उपयोगकर्ता के सवाल का सीधा जवाब नीचे दी गई सूची में "vdisk 0 पर भौतिक डिस्क दिखाएं" आइटम में है।

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Root की .bashrc में जोड़ें:

export PATH=$PATH:/opt/dell/srvadmin/bin

का आनंद लें:

RAID कमांड्स

  • नियंत्रक 0 पर सभी भौतिक डिस्क दिखाएं

    $ omreport storage pdisk controller=0
    
  • नियंत्रक 0 पर सभी तार्किक डिस्क दिखाएं

    $ omreport storage vdisk controller=0
    
  • Vdisk 0 पर सभी भौतिक डिस्क दिखाएं

    $ omreport storage pdisk controller=0 vdisk=0
    
  • RAID1 से RAID 1 होने के लिए एक vdisk को फिर से कॉन्फ़िगर करें ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • एक नई डिस्क पर एक vdisk बनाएँ:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

और जानकारी

BTW, क्योंकि यह एक डेल-ब्रांडेड LSI MegaCLI कार्ड से अधिक कुछ नहीं है, आपको हान सोलो का उत्तर और भी बेहतर लग सकता है! मैं अभी तक यह कोशिश करने के लिए है, हालांकि।

द स्वीटनेस

यहाँ omreport के आउटपुट का एक उदाहरण है, डेटा के एक स्वादिष्ट बंडल के लिए grep के माध्यम से पाइप किया गया है:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

@ एसएलएम अपने संपादन के बारे में- क्या यह वास्तव में रूट के बिना काम करता है? मेरे पास इन दिनों omreport / omconfig नहीं है, लेकिन मुझे यकीन नहीं है कि कोई भी उपयोगकर्ता सिर्फ एक vdisk बना सकता है। कमांड लाइन पर '$' का अर्थ है नियमित उपयोगकर्ता, रूट नहीं।
माइक एस

हाँ, मैंने ऐसा दूसरे दिन ही किया था जब मैं w / Dell 730 को डील कर रहा था, उन 2 को छोड़कर बाकी सभी जो "बनाते हैं" को रूट की आवश्यकता नहीं थी, मैं ठीक कर दूँगा।
SLM

6

मैं इसे CentOS में काम पाने के लिए भी संघर्ष कर रहा था और मुझे यहाँ एक वर्किंग पैकेज मिला http://mirror.ndchost.com/software/lsm/

जिसे " MegaCli-8.07.10-1.noarch.rpm " कहा जाता है "

आदेश संदर्भ http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

मुझे उम्मीद है यह मदद करेगा।


1
मैं बिल्कुल सहमत हूँ, उपयोग / ऑप्ट / मेगाकली / MegaCli64 -PDList -aALL | grep -i फर्मवेयर और यह आपको बताएगा कि शारीरिक डिस्क ठीक हैं या नहीं। (कमांड erikimh.com/megacli-cheatsheet से है - इसे देखें कि क्या मैंने गलत इस्तेमाल किया है)। मूल रूप से छापे की देखभाल डिस्क की निगरानी का एक बड़ा काम करती है, इसलिए बस डिस्क के संचालन की स्थिति के बारे में राय रखें।
कुछ लिनक्स नर्ड

3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

8
कृपया पढ़ने पर विचार करें कि मैं एक अच्छा उत्तर कैसे लिखूं? हमारे सहायता केंद्र में और फिर उत्तर को संशोधित करें। आपका आदेश तकनीकी रूप से एक समाधान हो सकता है, जिसका पहले से ही दूसरे, बहुत पुराने जवाबों और कुछ स्पष्टीकरण में भी उल्लेख किया गया है। अग्रिम में धन्यवाद।
HBruijn

1
दूसरे उत्तर में "sat + megaraid" का उपयोग किया गया था, जो मेरे लिए काम नहीं करता था। (ठीक है, मैं स्मार्टक्ट्ल कमांड को अच्छी तरह से नहीं जानता था और यह नहीं जानता था कि इसे बनाने के लिए कमांड को कैसे बदलना है।) इस जवाब ने मुझे सही रास्ते पर ले गया, और यह मेरे लिए काम करता है।
योंगवेई वू

1

perccliआदेश भी यदि आप इसे अच्छी तरह से पूछें कि आप ड्राइव जानकारी का एक बहुत कुछ दे सकता है:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

यह प्रत्येक बाड़े के स्लॉट के लिए दोहराया जाना चाहिए, या कम से कम मुझे एक बार एक perccliआदेश के साथ इसे प्रिंट करने का कोई तरीका नहीं मिला है ।

अन्य, अधिक व्यापक विकल्पों की तुलना में इसे स्थापित करना आसान है:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliहै नहीं Delll OMSA की तरह एक व्यापक निगरानी सूट, लेकिन यह लग रहा है कई लोगों को कुछ व्यापक नहीं करना चाहते हैं और इसके बजाय एक सभ्य, सरल उपकरण की जरूरत है की तरह।


-1

नमस्ते मेरे पास एक समान डेल पीईआरसी / एलएसआई कार्ड है और मुझे RAID स्थिति की जांच करने की आवश्यकता है। LSI की एक उपयोगिता है जिसे sas2ircu कहा जाता है जो मुझे काफी उपयोगी लगा, विंडोज और लिनक्स के लिए एक संस्करण भी है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.