एचपी सर्वरों का स्वचालित हार्डवेयर परीक्षण?


9

प्रोविजनिंग सर्वर के एक भाग के रूप में हम हार्डवेयर का परीक्षण करने के लिए HP के इनसाइट डायग्नोस्टिक्स को चलाते हैं। यह एक मैनुअल प्रक्रिया है। क्या इनसाइट डायग्नोस्टिक्स के चलने का एक तरीका है?

विकल्प के साथ hpdiags सॉफ़्टवेयर है "-rd:" "सभी निदान उपकरणों का निदान चलाएँ।" मेरे परीक्षण से यह बहुत कुछ नहीं करता है (यह सिर्फ डिस्क से स्मार्ट जानकारी पढ़ता है)। किसी को भी इसके साथ बेहतर भाग्य था?

हार्डवेयर: BladeCenter c7000 HP ProLiant BL460c ब्लेड, DL360s के साथ।

OS: ESXi और Ubuntu


2
संक्षिप्त उत्तर यह है कि मैं बड़े वातावरण में ऐसा करने की जहमत नहीं उठाता। निगरानी और जहाज पर निदान पर्याप्त हैं। लेकिन क्या आप अपने द्वारा उपयोग किए जा रहे सर्वर मॉडल के बारे में कुछ जानकारी प्रदान कर सकते हैं? और शायद ऑपरेटिंग सिस्टम शामिल थे।
18

मैंने अनुरोधित जानकारी के साथ टिकट को अपडेट किया।
मार्क वैगनर

क्या आप ESXi के HP- विशिष्ट संस्करण स्थापित कर रहे हैं? क्या आप उबंटू सिस्टम पर HP प्रबंधन एजेंट स्थापित करते हैं? कौन सी पीढ़ी (सर्वर) सर्वर हैं? G6? जी 7? Gen8?
ewwhite

एचपी प्रबंधन एजेंट ईएसएक्सआई और उबंटू दोनों पर स्थापित हैं। सर्वर Gen8 हैं और Gen9 होंगे।
मार्क वैगनर

8
I updated the ticket with the requested info- जिससे मुझे हंसी आए। यह हेल्पडेस्क नहीं है।
जोकेवेटी

जवाबों:


8

तो, मैं एक और सवाल उठाऊंगा:

प्रोविजन करने से पहले सर्वरों पर HP इनसाइट हार्डवेयर डायग्नोस्टिक्स चलाना क्यों आवश्यक है?

ऊपर मेरी टिप्पणी में, मैंने संकेत दिया कि बड़े एचपी प्रोलिएंट वातावरण में इस पूर्वगामी तरीके से करने के लिए बहुत कम है। मुझे उस पर अपने विचार स्पष्ट करने चाहिए ...

अवरोही आवृत्ति के क्रम में, आइए हम उन प्रकार के मुद्दों पर ध्यान दें जो आप आमतौर पर सामना करेंगे:

  • भंडारण सरणी और डिस्क : RAID नियंत्रक स्वास्थ्य को इंगित करने के लिए ओएस, लॉग, एसएनएमपी, ईमेल, आईएलओ और लाइट लाइट्स को रिपोर्ट करेगा ।

  • RAM : POST प्रक्रिया में RAM की स्थिति, साथ ही साथ OS, लॉग्स, SNMP, ईमेल, ILO को रिपोर्ट करने वाली प्रणाली और फ्रंट पैनल सिस्टम इनसाइट डिस्प्ले (SID) पर एक एलईडी इंडिकेटर को रोशन करने का पता चलेगा । इसके अलावा, मैं रैम बर्न-इन प्रक्रियाओं का प्रशंसक नहीं हूं क्योंकि इन प्रणालियों की त्रुटि का पता लगाना पहले से ही मजबूत है।

  • थर्मल और पंखे : ILO द्वारा सर्वर तापमान और पंखे की गति को नियंत्रित किया जाता है। इन प्रणालियों पर 30+ तापमान सेंसर हैं , इसलिए शीतलन प्रणाली बेहद कुशल है। यह अभी भी OS, लॉग, SNMP, ईमेल और SID पर रिपोर्ट करता है।

  • बिजली की आपूर्ति : पीएसयू स्थिति ओएस, लॉग, एसएनएमपी, ईमेल और एसआईडी पर और साथ ही वास्तविक बिजली आपूर्ति इकाई पर एक वास्तविक संकेतक प्रकाश के बारे में बताया गया है।

  • समग्र स्वास्थ्य : यह आंतरिक स्वास्थ्य और बाहरी स्वास्थ्य एलईडी के अलावा, SID डिस्प्ले के साथ एक नज़र से आकलन करना आसान है। यह सर्वर के लॉग, एसएनएमपी, ईमेल और आईएलओ को भी सूचित करता है।

यहां छवि विवरण दर्ज करें

मैं किसी भी स्थिति के बारे में नहीं सोच सकता हूँ जो कि पूर्व-परिनियोजन पाया जाएगा जो रनटाइम या पोस्ट ओएस इंस्टॉल के दौरान रिपोर्ट नहीं किया जा सकता है।

डायग्नोस्टिक्स लूप आमतौर पर कुछ भी नहीं मिलेगा जब सिस्टम पर कोई स्पष्ट पूर्व मुद्दों के साथ चलता है। यह मुख्य रूप से है क्योंकि सर्वर को उपयोगिता को चलाने के लिए उपयोगिता या इंटेलिजेंट प्रोविज़निंग फर्मवेयर में POST और बूट की आवश्यकता होती है।

एक और तरीका रखो, किसी भी आइटम जो सर्वर के लिए एक गंभीर "SPOF" होगा, संभवतः सिस्टम को अपने स्वयं के निदान को चलाने से रोक देगा।

सबसे आम विफलता आइटम अभी भी काफी मजबूत हैं; डिस्क RAID में होनी चाहिए और हॉट-स्वैपेबल हैं। पंखे और बिजली की आपूर्ति भी गर्म-बदली है। आपकी RAM में ECC थ्रेसहोल्ड हैं और अधिकांश ProLiant प्लेटफार्मों के लिए ऑनलाइन स्पेयर विकल्प हैं। निदान चलाकर इन घटकों में विफलता को प्रेरित करने के लिए आप कुछ नहीं कर पाएंगे। इस तथ्य को जोड़ें कि आप HP C7000 ब्लेड एनक्लोजर का उपयोग कर रहे हैं , जिसमें आंतरिक अतिरेक हैं , और आपकी विफलता की घटना बहुत कम होनी चाहिए।


समस्या यह है कि (ए) गलती का पता लगाया जाता है पोस्ट ओएस स्थापित (यानी सर्वर उत्पादन में है), (बी) मरम्मत ऑनलाइन नहीं किया जा सकता है या विफल घटक सर्वर के लिए एक SPOF है, और (सी) सर्वर एक SPOF है, तो आप डाउनटाइम का अनुभव करेंगे (या तो तुरंत या जब सिस्टम को मरम्मत के लिए ले जाया जाता है)। निष्कर्ष को रोकने के लिए आपको शर्तों में से एक को रोकने की आवश्यकता है। मैं उत्पादन से पहले दोष का पता लगाकर (ए) के लिए जा रहा था। मैं रिपोर्टिंग क्षमताओं का विस्तार करने में आपकी संपूर्णता की सराहना करता हूं, लेकिन मैं उन्हें पहली जगह में रिपोर्ट करने की आवश्यकता को रोकने के लिए देख रहा हूं क्योंकि वे ऐसा नहीं करते हैं।
मार्क वैगनर

एक एचपी डायग्नोस्टिक्स लूप को कुछ भी नहीं मिलेगा, डायग्नोस्टिक्स को चलाने के लिए सर्वर को उपयोगिता या इंटेलिजेंट प्रोविजनिंग में पोस्ट और बूट करने की आवश्यकता है । सबसे आम विफलता आइटम बहुत मजबूत हैं; डिस्क, पंखे और बिजली की आपूर्ति हॉट-स्वैपेबल है, रैम में ईसीसी थ्रेसहोल्ड हैं। इन घटकों में विफलता को प्रेरित करने के लिए आप कुछ नहीं कर पाएंगे।
1
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.