"Mce: [हार्डवेयर त्रुटि]: मशीन चेक ईवेंट लॉग किया गया" syslog में दिखाई देता है। मुझे क्या करना चाहिए?


19

मैंने OSSEC (2.8.1) का नवीनतम संस्करण स्थापित किया है और मैंने ईमेल सूचनाओं को भी सक्षम किया है। और मुझे इस तरह के नोटिफिकेशन का भार मिल रहा है, जिसमें कहा गया है कि एक हार्डवेयर एरर है और कुछ mce के बारे में है:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

तो वास्तव में इसका क्या मतलब है? क्या mce के लिए खड़ा है? और क्या यह स्पष्ट हार्डवेयर त्रुटि है जो मुझे चिंता करनी चाहिए?


OS सूचना:

Description:    Ubuntu 14.10
Release:    14.10

आपको ossec पर थोड़ा सा पढ़ने की आवश्यकता होगी, नियम देखें - ossec-docs.readthedocs.org/en/latest/manual/rules-decoders । वेब इंटरफ़ेस मदद करता है क्योंकि इसमें कई स्पष्टीकरण हैं - ossec.net/wiki/index.php/OSSECWUI:Install
पैंथर


ossec शायद खराब समर्थन या विषय से दूर है क्योंकि यह ubuntu रिपॉजिटरी में नहीं है
पैंथर

1
यह ओएसएसईसी के बारे में बिल्कुल नहीं है। आपको यह सूचना इसलिए मिली क्योंकि ओएसएसईसी ने "त्रुटि" शब्द को syslog में पाया। हालाँकि मुझे नहीं लगता कि यह विषय से बाहर है, लेकिन आपको शायद यूनिक्स और लिनक्स या सर्वर फॉल्ट के बारे में अधिक मदद मिलेगी ।
एरिक कारवाल्हो

4
@ bodhi.zazen उबंटू पर चलाया जाता है। अब इसका मतलब यह नहीं है कि आपको पाठ्यक्रम का जवाब मिल जाएगा।
सेठ

जवाबों:


23

मशीन की जाँच अपवाद :

एक मशीन चेक अपवाद (एम) कंप्यूटर हार्डवेयर त्रुटि का एक प्रकार होता है कि जब एक कंप्यूटर की सेंट्रल प्रोसेसिंग यूनिट एक हार्डवेयर की समस्या का पता लगाता है।

आपके कंप्यूटर ने एक हार्डवेयर त्रुटि का अनुभव किया और कर्नेल ने एक बफर में एक घटना को लॉग इन किया। आप mcelogमशीन जांच घटनाओं को लॉग इन करने और देखने के लिए उपयोग कर सकते हैं । से mcelogमैनपेज :

X86 सीपीयू रिपोर्ट त्रुटियों को सीपीयू द्वारा मशीन चेक इवेंट (MCEs) के रूप में पाया गया। सीपीयू कैश में पता लगाए गए डेटा भ्रष्टाचार हो सकते हैं, एक एकीकृत मेमोरी कंट्रोलर द्वारा मुख्य मेमोरी में, फ्रंट साइड बस या सीपीयू इंटरकनेक्ट या अन्य आंतरिक त्रुटियों पर डेटा ट्रांसफर त्रुटियों। संभावित कारण कॉस्मिक विकिरण, अस्थिर बिजली की आपूर्ति, शीतलन समस्याओं, टूटे हुए हार्डवेयर, विनिर्देश से बाहर चल रहे सिस्टम या बुरी किस्मत हो सकते हैं।

सीपीयू द्वारा आंतरिक त्रुटि सुधार तंत्र द्वारा अधिकांश त्रुटियों को ठीक किया जा सकता है। गलत त्रुटियां मशीन जांच अपवादों का कारण बनती हैं जो प्रक्रियाओं को मार सकती हैं या मशीन को आतंकित कर सकती हैं। सही त्रुटियों की एक छोटी संख्या आमतौर पर चिंता का कारण नहीं होती है, लेकिन बड़ी संख्या भविष्य की विफलता का संकेत दे सकती है।

जब एक सही या पुनर्प्राप्त त्रुटि होती है, तो x86 कर्नेल MCE को आंतरिक रिंग बफ़र / dev / mcelog डिवाइस के माध्यम से उपलब्ध रिकॉर्ड का वर्णन करता है। mcelog / dev / mcelog से त्रुटियों को प्राप्त करता है, उन्हें एक मानव पठनीय प्रारूप में डिकोड करता है और उन्हें मानक आउटपुट पर या वैकल्पिक रूप से सिस्टम लॉग में प्रिंट करता है।

यदि आपको कोई दुर्घटना नहीं हुई, तो संभवतः त्रुटि को ठीक कर लिया गया था। फिर भी, मैं आपको mcelogऐसी घटनाओं पर नज़र रखने के लिए स्थापित करने की सलाह देता हूं :

sudo apt-get install mcelog

घटनाओं को लॉग इन किया जाएगा /var/log/mcelog। आप भी चला सकते हैं:

sudo mcelog --client

mcelogत्रुटियों के लिए डेमन को क्वेरी करना ।


2
मुझे आश्चर्य है कि MCE त्रुटियों को सिर्फ सिस्टम लॉग में सीधे क्यों नहीं लिखा गया है ... शायद कुछ अच्छे कारण, शायद
Xen2050

2
@ Xen2050 क्योंकि संदेश की डिकोडिंग वास्तुकला पर निर्भर है और यह हमेशा हार्डवेयर निर्माताओं द्वारा प्रलेखित नहीं किया जाता है। PCIe बस द्वारा भी त्रुटि उत्पन्न की जा सकती है।
मिरिकया वुटकोविसी

4
@ Xen2050: मेरे फेडोरा 25 मशीन पर, MCE संदेश पत्रिका को लिखे जाते हैं, मैं उनके साथ देख सकता हूं journalctl -b
मार्टिन उडिंग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.