क्या मुझे उच्च SMART Hardware_ECC_Recovered मान के बारे में चिंतित होना चाहिए?


16

मुझे इस तरह का संदेश मिला /var/log/messages:


Jun 25 06:29:27 server.ru smartd[4477]: Device: /dev/sda, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 46 to 47

#smartctl -a /dev/sda:


smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   110   088   006    Pre-fail  Always       -       28526210
  3 Spin_Up_Time            0x0003   093   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       24
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   087   060   030    Pre-fail  Always       -       471723621
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       2520
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       41
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   068   052   045    Old_age   Always       -       32 (Lifetime Min/Max 31/35)
194 Temperature_Celsius     0x0022   032   048   000    Old_age   Always       -       32 (0 27 0 0)
195 Hardware_ECC_Recovered  0x001a   047   045   000    Old_age   Always       -       105036390
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

क्या इसका मतलब है कि डिस्क विफल हो रही है और मुझे इसे बदलना होगा? मैं स्मार्ट परीक्षण परिणामों की व्याख्या के बारे में कहां पढ़ सकता हूं?

जवाबों:


13

स्पिनराइट प्रसिद्धि के स्टीव गिब्सन के अनुसार , एसएमएआरटी मूल्यों को समय के साथ लिया जाना चाहिए, तात्कालिक रीडिंग के रूप में नहीं। इसका मतलब यह है कि 47 का मान जरूरी नहीं है अगर मूल्य महीनों के लिए 47 हो गया है। हालाँकि यदि मूल्य एक घंटे पहले 42 था, और इसका तेजी से चढ़ना, तो इसका मतलब है कि ड्राइव को डेटा के भाग तक पहुंचने में कठिनाई हो रही है और जल्द ही इस क्षेत्र को पढ़ने में असमर्थ हो सकता है। उस ड्राइव पर डेटा के मूल्य के आधार पर आप इसे बदलना चाह सकते हैं।


महान जवाब के लिए, और इसे जोड़ने के लिए +1। यदि आप वास्तव में लेक्सिस से चिंतित हैं, तो मैं स्पिनराइट की एक प्रति खरीदूंगा और उसे चलाऊंगा। सीडी से बूट करने में सक्षम होने के लिए आपको अपने सिस्टम की आवश्यकता होगी, लेकिन ओएस बेमतलब है। (बूट सीडी बनाने के लिए आपको विंडोज, या विंडोज क्लोन की आवश्यकता होगी)
मैट

स्पिरिट एक बूटेबल (फ्रीडोस) के साथ आता है। एक ऐसी छवि जिसे आप किसी भी चालू ओएस के साथ जला सकते हैं
डेव चेनी

grc.com/sr/spinrite.htm लिंक करने के लिए एक बेहतर जगह होगी
ब्रैड गिल्बर्ट

2
उदाहरण गलत है! @ सीज़रबी का उत्तर देखें - अधिकांश मूल्यों के लिए, वृद्धि अच्छी है! तो अगर यह एक घंटे पहले 42 था, और अब यह 47 - महान है। लेकिन दूसरे तरीके से नहीं।
वोल्कर सिएगल

6

इस विशेषता के लिए एक उच्च मूल्य वास्तव में बहुत अच्छा है:

हार्डवेयर ECC पुनर्प्राप्त SMART पैरामीटर ECC-corrected त्रुटियों के बीच का समय दर्शाता है।

https://kb.acronis.com/content/9131


2
मैंने जो कहा वह केंद्रीय उद्धरण माना।
रॉबर्ट क्लेमे

यह समझ में आता है कि भले ही जुड़ा हुआ संसाधन चला जाए। धन्यवाद रॉबर्ट
चूजों

4

सबसे पहले, कम मान SMART के लिए बदतर हैं, उच्च मान नहीं (ध्यान दें कि थ्रेसहोल्ड कॉलम हमेशा वर्तमान मान से कम है)। तो, मूल्य वृद्धि चिंता का कोई कारण नहीं है। (यह नियम हालांकि कच्चे मूल्यों पर लागू नहीं होता है।)

स्मार्ट मान थोड़े से दोलन करते हैं (उदाहरण के लिए, आपका किनारा 46 और 47 के बीच हो सकता है, इसलिए छोटे परिवर्तन भी इसे दूसरे मान पर फ़्लिप कर सकते हैं)।

आपका smartctl -aआउटपुट सबसे खराब दिखाता है कि यह मान 45 है, इसलिए यह सामान्य से थोड़ा ऊपर दोलन करता है।

अधिक जानकारी के लिए, विकिपीडिया: एटीए स्मार्ट विशेषताओं पर एक नज़र डालें ।


3

ध्यान रखें कि Google द्वारा किए गए व्यापक अध्ययन में भी पाया गया कि बड़ी संख्या में ड्राइव विफलताओं का पूर्वानुमान SMART त्रुटियों से नहीं था। यह संभव है कि आप जो देख रहे हैं वह पूरी तरह से सामान्य है, लेकिन जैसा कि प्रत्येक निर्माता के कच्चे मूल्यों को रिपोर्ट किए गए मूल्यों में परिवर्तित करने के लिए अलग-अलग मीट्रिक हैं, यह सुनिश्चित करना कठिन है कि आपका ड्राइव बहुत त्रुटियों का अनुभव कर रहा है या नहीं। हालाँकि, एक कच्ची संख्या जो बड़ी होती है, मुझे उतनी ही अजीब लगती है।

मैं सभी ड्राइव (dd या rsync'ing को एक नई ड्राइव) में पढ़ने की सलाह दूंगा और SMART मानों की जाँच करता हूँ क्योंकि यह साथ जाता है। यदि आप उस कच्चे नंबर, या रिपोर्ट किए गए मानों को देखते हैं, तो ड्राइव को बदलने के लिए मैं बहुत कुछ देखना शुरू करूँगा।


हुह। अपने स्वयं के उपयोग पैटर्न के खिलाफ ZFS ट्रैक SMART विशेषताओं का होना बहुत अच्छा होगा।
०३६__

1

इसमें कुछ भी गलत नहीं है।

आप हमेशा दौड़ सकते हैं

smartctl -t long /dev/yourdrive

फिर कुछ घंटों के बाद इसके परिणाम की क्वेरी करें

smartctl -a /dev/yourdrive

बस तसल्ली के लिए।


1

IIRC हार्डवेयर ECC बरामद डिस्क रीड पर त्रुटि सुधार है, जो डिस्क के लिए असामान्य नहीं है, और वे इस कारण त्रुटि सुधार तंत्र के साथ डेटा को एन्कोड करते हैं। कुछ नियंत्रक डिस्क क्षेत्रों में अनावश्यक जानकारी का समर्थन करते हैं और त्रुटि सुधार की एक और परत जोड़ते हैं।

जैसा कि डेव चेनी कहते हैं कि समय के साथ आंकड़ों पर नजर रखी जानी चाहिए। इन आंकड़ों में कट्टरपंथी परिवर्तन एक असफल ड्राइव का संकेत हैं। इसके अलावा, बढ़ी हुई दोष सूचियों पर नज़र रखें - यदि बढ़ी हुई दोष सूची बढ़ने लगती है या स्मार्ट आंकड़े काफी बदलना शुरू हो जाते हैं, तो आपको प्रोफिलैक्टिक रूप से ड्राइव को बदलना चाहिए।


1
lol, प्रोफिलैक्टिक रूप से
डेव चेनी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.