यह आपके सर्वर हार्डवेयर पर निर्भर करता है। एक व्हाइटबॉक्स या सुपरमाइक्रो सिस्टम इसे डेल, एचपी या आईबीएम की तुलना में अलग तरह से हैंडल करेगा ...
उच्च-अंत सर्वरों के मूल्य-जोड़ सुविधाओं में से एक यह है कि हार्डवेयर / ओएस एकीकरण का एक स्तर है। अच्छे सर्वर रिपोर्ट करेंगे कि आप प्रबंधन एजेंटों और / या आउट-ऑफ-बैंड प्रबंधन समाधान (ILO, DRAC, IPMI) के हिस्से के रूप में क्या देख रहे हैं।
आपको अपने हार्डवेयर प्लेटफ़ॉर्म पर मूल उपकरण का उपयोग करना चाहिए।
Linux और HP प्रबंधन एजेंटों को चलाने वाले HP ProLiant सर्वर के अंश:
Trap-ID=6056
ECC Memory Correctable Errors detected.
तथा
Trap-ID=6052
Advanced ECC Memory Engaged
या अधिक गंभीर
Trap-ID=6029
A correctable memory log entry indicates a memory module needs to be
replaced.
या सबसे खराब ... 6 दिनों के लिए एक त्रुटि को अनदेखा करना जब तक कि सर्वर खराब रैम के कारण क्रैश न हो जाए
0004 Repaired 22:21 12/01/2008 22:21 12/01/2008 0001
LOG: Corrected Memory Error threshold exceeded (Slot 1, Memory Module 1)
0007 Repaired 02:58 12/07/2008 02:58 12/07/2008 0001
LOG: POST Error: 201-Memory Error Single-bit error occured during
memory initialization,
Board 1, DIMM 1. Bank containing DIMM(s) has been disabled.
0008 Repaired 19:31 12/08/2009 19:31 12/08/2009 0001
LOG: ASR Detected by System ROM
ये लॉग इन थे, साथ ही एसएनएमपी जाल और ईमेल भेजे गए थे।
आम तौर पर, आप कर्नेल रिंग बफर में मशीन जांच अपवाद देखेंगे, ताकि आप mcelog को चेक dmesg
या चला सकें । IPMI के बिना सुपरमाइक्रो गियर के साथ मेरे अनुभवों में, वह सब कुछ नहीं पकड़ पाया, और मुझे अभी भी रैम की त्रुटियां दरारें और कारण के माध्यम से फिसल गई थीं। दुर्भाग्य से, इससे सिस्टम परिनियोजन से पहले पुरातन बर्न-इन नीतियों का सामना करना पड़ा ।