शारीरिक रूप से विफल हार्ड ड्राइव को पहचानें


25

तो, मान लीजिए कि आपके सर्वर में 6 स्वस्थ हार्ड ड्राइव थे। एक ड्राइव विफल रहता है (माउंट / पता नहीं लगाएगा, त्रुटियों के साथ छापे से बाहर निकलता है) या विफल हो रहा है (स्मार्ट खराब हो रहा है, आदि)। आपको खराब ड्राइव को स्वैप करने की आवश्यकता है। जब आप मामले को खोलते हैं तो आप देखते हैं .. छह समान हार्ड ड्राइव।

आप यह कैसे बता सकते हैं कि कौन सा व्यक्ति स्वस्थ / बढ़ते / कार्यशील नहीं है?

सिस्टम सबसे सरल सॉफ्टवेयर RAID का उपयोग करके लिनक्स, सबसे अधिक संभावना ubuntu सर्वर होगा। हार्ड ड्राइव SATA होगा और सीधे मदरबोर्ड से जुड़ा होगा। (कोई छापा नहीं नियंत्रक)

जब तक मैं सही को नहीं उठाता, मैं बेतरतीब ढंग से डिस्कनेक्ट नहीं करना चाहता। ड्राइव सभी मेरे लिए समान दिखाई देते हैं; मैं कल्पना करता हूं कि किस ड्राइव को पहचानने का कोई सामान्य तरीका है जिससे मैं अनजान हूं। क्या किसी के पास कोई संकेत / सुझाव / सर्वोत्तम प्रथाएं हैं? धन्यवाद!

संपादित करें: मैं चाहता था कि यह एक तरह से हाथ से लहराए जाने में 'सामान्यीकृत' हो, लेकिन यह 'अधूरा' और 'भयानक' के रूप में सामने आया। मेरी गलती!


4
यदि आपको मशीन को बंद करना है और यह पता लगाना है कि हार्ड ड्राइव क्या है, तो आपको प्रत्येक हार्डड्राइव की पहचान करने के लिए मशीन को डाउन करने के लिए समय लेना चाहिए और इसे किसी तरीके से लेबल करना चाहिए ताकि जब यह दोबारा हो, तो आपके पास यह न हो मुद्दा।
1853 में रॉय रिको

2
एक "RAID (या जो कुछ भी)"? मशीन के कमरे के अंदर एक उपयोगकर्ता की तरह लगता है।
रोमांसदास

1
एक उचित सर्वर आपको बताएगा कि कौन सा ड्राइव खराब ड्राइव के ड्राइव त्रुटि संकेतक को चालू करता है।
जॉन गार्डनियर्स

8
आदमी हर किसी को इस पर कूदने के लिए इतनी जल्दी है ... निस्संदेह मुझे लगता है कि यह एक अच्छा सवाल है, एक जिसे मुझे खुद से निपटना है!
मार्क हेंडरसन

2
मैं उत्सुक हूँ अगर वहाँ, शौक के प्रयोजनों के लिए, किसी भी तरह से निर्माण करना संभव है (हाथ में लोहे को टांका लगाने के साथ और इतने पर) ड्राइव सिग्नलिंग एल ई डी उन्हें एक यादृच्छिक ओएस के भीतर से भौतिक रूप से पहचानने के लिए (जब कोई सभ्य सर्वर-ग्रेड डिस्क / छापे नियंत्रक नहीं है) उनका जादू करने के लिए मौजूद है) ...
ऑस्कर डुवॉर्न 18

जवाबों:


26

आपको (टॉवर) सर्वर पर यह सटीक समस्या थी जैसे आप समझाते हैं, और यह आसान था:

smartctl ड्राइव के सीरियल नंबर को आउटपुट करेगा

विक्रेता कभी-कभी एचडीपीआर की तरह अपने स्वयं के विशिष्ट उपकरणों को जहाज करते हैं, जो ऐसा ही करेंगे।

इसलिए खराब ड्राइव के सीरियल का उत्पादन करें, और फिर ड्राइव को खोजने के लिए एक दंत चिकित्सक के दर्पण और एक टॉर्च का उपयोग करें।

एक रैकमाउंट पर आपके पास आमतौर पर संकेतक रोशनी होगी जैसे अन्य लोगों ने कहा है, लेकिन मुझे यकीन है कि वही लागू होगा।


वूप्स ... होशियार, नहीं hdparm एक मैं सोच रहा था। मुझे यह दर्शाने के लिए अपने उत्तर को संपादित करने की आवश्यकता है।
बार्ट सिल्वरस्ट्रिम

मुझे सही आदेश की याद दिलाने के लिए बनाया गया :-)
बार्ट सिल्वरस्ट्रिम

1
hdparm -i मुझे अपनी ड्राइव के सीरियल नंबर दिखाता है - यह एक विक्रेता-विशिष्ट प्रतिक्रिया हो सकती है, हालांकि
इयान क्लेलैंड

1
अति उत्कृष्ट! मैं इसे अभी कोशिश नहीं कर सकता, लेकिन ऐसा लगता है कि यह उत्तर है! अब मैं अपने हार्ड ड्राइव को उनके सीरियल नंबर के अंतिम एन अंकों के साथ लेबल करूँगा (यह मानते हुए कि यह अद्वितीय है, सर्वर के अनुसार) एक जगह पर है जो माउंटेड होते समय उजागर होता है। इसके अलावा गुग्लिंग से कमांड "smartctl -i" प्रतीत होता है
Privatehuff

15

ड्राइव पर स्टिकर लगाना (ट्रे के डिज़ाइन के आधार पर) संभव नहीं है। जब तक ड्राइव मर जाती है, तब तक स्टिकर सूख सकते हैं और गिर सकते हैं।

ledctl (पैकेज लीडमन से) वास्तव में इसके साथ जाने का तरीका है।

ledctl locate=/dev/disk/by-id/[drive-id]

या

ledctl locate=/dev/sda

निर्दिष्ट ड्राइव के लिए आपके चेसिस पर ड्राइव फेल प्रकाश को रोशन करेगा। मैंने उदाहरण के लिए दो उदाहरण दिए हैं कि इससे कोई फर्क नहीं पड़ता कि आप ड्राइव की पहचान कैसे करते हैं। आप सीरियल, नाम आदि का उपयोग कर सकते हैं ... आपके पास जो भी जानकारी उपलब्ध है उसका उपयोग किया जा सकता है। ड्राइव को / dev / और / dev / डिस्क / पथ के तहत कई तरीकों से संदर्भित किया जाता है।

प्रकाश को वापस बंद करने के लिए, बस इसे फिर से निष्पादित करें, जैसे find_off को बदलकर बदल दें:

ledctl locate_off=/dev/sda

6

आमतौर पर आपको यह आशा करनी होगी कि कनेक्शन कुछ फैशन में लेबल किए गए हैं फिर असफल डिवाइस की पहचान से काम करते हैं। उदाहरण के लिए ... और किसी को मुझे सही करने के लिए टिप्पणी करनी होगी ... यदि आपके पास दो आईडीई चैनल हैं, तो आपके पास प्रत्येक पर 2 ड्राइव हैं, आप sda, sdb, sdc और sdd कर सकते हैं। यदि sdd विफल हुआ तो यह दूसरे IDE चैनल के केबल पर दूसरा ड्राइव होगा।

यदि यह SATA है और सिस्टम की तरह मैं बैक रूम में है, तो पोर्ट प्रत्येक sata ड्राइव के लिए लेबल किए गए हैं। फिर से, ड्राइव लेटरिंग SATA कनेक्टर्स के पोर्ट 0 पर शुरू होने और ऊपर जाने से जो भी ड्राइव ऊपर जाती है, उसके माध्यम से जाती है।

यदि कोई निर्माण अंतर है, तो dmesg | grep sd या dmesg | grep hd को कुछ सुराग देने चाहिए।

यदि आपके पास सीरियल नंबर उपलब्ध है तो मुझे लगता है कि hdparm कमांड आपको सॉफ्टवेयर में दे सकती है ताकि आप इसे इस तरह से ट्रेस कर सकें। आप ड्राइव को कहीं लेबल करना चाहते हैं अगर ऐसा है तो आपको इस बारे में चिंता करने की ज़रूरत नहीं है जब आपको कोई समस्या होती है।

... मुझे पता था कि एक और कारण है जो मैंने हार्डवेयर RAID को सॉफ़्टवेयर RAID ... ब्लिंक लाइट से अधिक पसंद किया। वास्तव में ब्लिंक लाइट्स की तरह।

EDIT: smartctl, hdparm नहीं, सीरियल नंबर देता है। मेरी गलती।



3

कुछ ड्राइव एक "फाइल" का पता लगाते हैं, /sysजिसमें आप एक संकेतक को लाइट ऑन करने के लिए या 0 बंद करने के लिए 1 गूंज सकते हैं।

$ for light in $( find /sys -name "locate" ) ; do echo 1 > $light ; sleep 10 ; echo 0 > $light; done

मुझे इस बारे में कोई पता नहीं था! यह भी खूब रही!
१५:१६

2

छह आंतरिक HDDS? यदि वे बाहरी, हॉट स्वैप ड्राइव हैं, तो हॉट स्वैप कैरियर की संभावना खराब ड्राइव को पहचानने में आपकी मदद करने के लिए एक त्रुटि प्रकाश है। इसके अलावा कई RAID प्रबंधन कार्यक्रमों में एक विशेष ड्राइव पर प्रकाश को फ्लैश करने का विकल्प होता है जो यह निर्धारित करता है कि कौन सा है। यदि वे सभी बिना रोशनी वाले आंतरिक हैं, तो आप अपने RAID सॉफ़्टवेयर के लिए नीचे हैं जो आपको बता रहे हैं कि कौन सी आईडी अच्छी हैं, और यह पता लगाने के लिए एससीएसआई आईडी आदि देख रहे हैं। यदि वे ऑटो पर सेट हैं, तो आपके RAID नियंत्रक डॉक्टर को यह बताना चाहिए कि आईडीएससी को एससीएसआई श्रृंखला में क्या ऑर्डर दिया गया है। शुभ लाभ। अभी बैकअप लें जबकि चीजें अभी भी चल रही हैं!


2

बहुत कम से कम RAID सॉफ़्टवेयर / नियंत्रक जो आपको विफल ड्राइव के बारे में बताते हैं, आपको यह बताना चाहिए कि कौन सा ड्राइव विफल (आईडी नंबर) था। 0 आमतौर पर ऊपर बाईं ओर एक है, नीचे जा रहा है, फिर दाईं ओर (यदि दो या अधिक कॉलम में है)। पोर्ट शायद लेबल हैं।


2

संक्षिप्त उत्तर के लिए - "lsscsi" विस्तृत उत्तर के लिए - "lshw -c डिस्क" आपको HDD और SATA पोर्ट दिखाएगा जिसमें वे जुड़े थे।


2

यदि आपके पास कोई प्रकाश नहीं है और आसानी से ड्राइव के बाहर सीरियल नंबर नहीं पा सकते हैं, तो कभी-कभी यह पनीर तकनीक मदद कर सकती है: उस विशिष्ट ड्राइव पर बहुत सारी गतिविधि बनाएं और फिर ड्राइव को ठोस पर एलईडी गतिविधि के साथ देखें। । सीरियल नंबर की अधिक विस्तृत जांच के साथ पालन करना सबसे अच्छा है, लेकिन यह खोज को संकीर्ण करने में मदद कर सकता है।

उदाहरण के लिए:

# while true; do dd if=/dev/disk/by-id/scsi-drive-that-is-dying of=/dev/null; sleep 1; done

(जबकि लूप को तकनीकी रूप से आवश्यक नहीं है, लेकिन यह डेटा सेंटर में जाने के दौरान चीजों को चालू रखेगा। "स्लीप 1" तेज लूप द्वारा बनाए गए उच्च CPU उपयोग से बचने में मदद करता है यदि "dd" कहने के कारण विफल हो जाता है .. ड्राइव को डिस्कनेक्ट किया जा रहा है।)


1

जब बाकी सभी विफल हो जाते हैं, तो आप बिना असफल ड्राइव की पहचान कर सकते हैं और पीछे की ओर काम कर सकते हैं।

find / -type f -exec cat {} \; >> /dev/null

जो भी ड्राइव गतिविधि रोशनी पर नहीं आते हैं, वे खराब होने की संभावना है (और उम्मीद है कि यह सिर्फ एक है।) ध्यान दें कि यदि आपके पास गर्म-पुर्जों को कॉन्फ़िगर किया गया है, तो वे भी प्रकाश नहीं करेंगे।


0

उन्हें चेसिस पर लेबल किया जाना चाहिए और RAID सॉफ़्टवेयर के साथ मेल खाना चाहिए।

हमारे Dells पर, वैसा नहीं है जैसा आप सोचते हैं। हमारे ०: ० पर नीचे बाईं ओर है, ०: १ में सबसे ऊपर बाईं ओर है, ०: २ नीचे के मध्य में है, आदि सभी सर्वरों में जो मैंने उपयोग किए हैं (घर के कामों को छोड़कर), RAID सॉफ्टवेयर पोर्ट को इंगित करेगा, और यह होगा लेबल।


0

scsirastools में उपकरणों का एक सेट है जो आपको SCSI डिस्क पर विभिन्न नैदानिक ​​परीक्षण करने देता है। आप सॉफ़्टवेयर नियंत्रण के तहत डिस्क को डाउन करने के लिए sgmon का भी उपयोग कर सकते हैं। यह कम से कम आपको निदान की भौतिक डिस्क की पहचान करने देता है।

यदि आपके पास एक हार्डवेयर RAID नियंत्रक है, तो नियंत्रक के BIOS या प्रबंधन सॉफ़्टवेयर में एक सुविधा होनी चाहिए जो आपको खराब डिस्क की पहचान करने देती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.