आदर्श रूप में, सर्वर को रिबूट करने की आवश्यकता के बिना और स्थापित करने के सरल के साथ। ज्यादातर के लिए DL380 G5's
अगर यह मदद करता है।
आदर्श रूप में, सर्वर को रिबूट करने की आवश्यकता के बिना और स्थापित करने के सरल के साथ। ज्यादातर के लिए DL380 G5's
अगर यह मदद करता है।
जवाबों:
यह सर्वरों पर आपके द्वारा चलाए जा रहे ऑपरेटिंग सिस्टम पर निर्भर करता है, लेकिन सामान्य तौर पर, HP ProLiant सर्वर और स्मार्ट ऐरे RAID कंट्रोलर से अलर्ट प्राप्त करना संभव है।
आपके DL380 G5 सिस्टम के लिए पूर्ण ड्राइवर और सॉफ़्टवेयर समर्थन सूची यहां सूचीबद्ध है ।
एसएनएमपी और एक निगरानी समाधान सबसे अच्छा तरीका है ... लेकिन आप एचपी के कुछ उपकरणों के साथ इसे बढ़ा सकते हैं। एचपी एचपी सिस्टम इनसाइट मैनेजर प्रदान करता है , जो डाउनलोड के लिए उपलब्ध है और सर्वर के साथ भी आता है। यह सर्वरों के संग्रह के लिए आदर्श है। यदि आप एक प्रबंधन या निगरानी बुनियादी ढांचे के निर्माण के बिना एक-बंद अलर्ट की तलाश कर रहे हैं, तो आप बस एचपी प्रबंधन एजेंट (उर्फ प्रोलिएंट पैक ) स्थापित कर सकते हैं ।
स्टैंडअलोन लिनक्स सिस्टम के लिए, मेरे पास एजेंट्स को ईमेल के माध्यम से जाल भेजने होंगे। मैं आमतौर पर समर्थन पैक को डिफॉल्ट या कस्टम बंडल के साथ कॉन्फ़िगर करता हूं , फिर प्राप्तकर्ता पते को इंगित करने के /opt/hp/hp-snmp-agents/cma.conf
लिए trapemail
लाइन को संपादित और बदल सकता हूं :
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net
यदि आप लिनक्स चला रहे हैं और पूर्ण एचपी प्रबंधन सूट स्थापित नहीं करना चाहते हैं, तो आप नियंत्रक / डिस्क स्थिति क्वेरी करने के लिए cciss_vol_status उपयोगिता के आसपास एक स्क्रिप्ट विकसित कर सकते हैं । इसे भी देखें: OpenFiler पर HP एजेंट्स इंस्टॉल करना
ProLiant DL360 G7
सर्वर मिला है, और HP सिम की निगरानी के लिए।
एचपी इनसाइट मैनेजर देखें
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
मेरा मानना है कि इसे आपके सर्वर के साथ काम करना चाहिए।
मैंने उनके जवाब में @ewwite द्वारा उल्लेखित हल्के कार्यक्रम का उपयोग किया: cciss_vol_status
यदि आप INSTALL निर्देशों के साथ आते हैं, तो स्क्रिप्ट को रखा जाता है /usr/local/bin/cciss_vol_status
।
यहाँ एक आवरण स्क्रिप्ट है जिसका उपयोग मैं cciss_vol_status के आउटपुट को grep करने के लिए करता हूं, और यदि कोई सरणी FAILED की स्थिति है तो एक ईमेल भेजें।
#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers. Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`
# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root
# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}
if echo $status | grep -q FAILED
then
# make sure we haven't sent a notification in the last X minutes
if test `find ${lockfile} -mmin +${_notification_freq}`
then
echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}
# update lock file mod time
/bin/touch ${lockfile}
fi
fi
क्रोन में उपरोक्त स्क्रिप्ट को कॉल करें। मैं हर दो मिनट में चेक चलाता हूं:
*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh
हम एचपी सिस्टम इनसाइट प्रबंधक का उपयोग यह जांचने के लिए करते हैं कि क्या हमारे एचपी उठ रहे हैं और चल रहे हैं, लेकिन इससे आगे कुछ भी नहीं। मुझे लग रहा था कि लिनक्स एजेंट हमारे लिए ओवरकिल हो गया है, क्योंकि हमारे पास जगह में अन्य निगरानी समाधान हैं, इसलिए ऊपर दी गई यह स्क्रिप्ट अपने विशिष्ट उद्देश्य को अच्छी तरह से निभाती है।
अपडेट करें
यदि आप इसमें भाग लेते हैं तो बस एक समस्या निवारण टिप। यह स्क्रिप्ट आज सुबह तब मददगार साबित हुई जब मुझे एक असफल सरणी के बारे में एक ईमेल मिला:
कैश की गंदी हद हो गई
उपकरण केवल पढ़ने के लिए चला गया और अंदर दिखाई नहीं दे रहा था /proc/partitions
। मैंने सर्वर को रिबूट किया और इन संदेशों को बूट पर देखा:
लॉजिकल ड्राइव (ओं) को संभव डेटा हानि के कारण अक्षम किया गया। तार्किक ड्राइव के साथ जारी रखने के लिए "F1" का चयन करें। डेटा हानि को स्वीकार करने और तार्किक ड्राइव को फिर से सक्षम करने के लिए "F2" का चयन करें
मैंने F2 का चयन किया और RAID ठीक था और बूट पर मुहिम शुरू की।
स्मार्टमोंटोल स्थापित करें। आपको एक ड्राइव विफल होने पर मेल करता है।