बड़ी ड्राइव की उच्च विफलता दर?


24

मैंने हाल ही में 5x 1TB ड्राइव के साथ एक सर्वर तैनात किया है (मैं उनके ब्रांड का उल्लेख नहीं करूंगा, लेकिन यह बड़े दो में से एक था)। मुझे शुरू में बड़ी क्षमता वाली ड्राइव मिलने के खिलाफ चेतावनी दी गई थी, क्योंकि एक दोस्त ने मुझे सलाह दी थी कि उनके पास बहुत कम एमटीबीएफ है, और मैं बेहतर हो सकता हूं कि छोटी क्षमता की ड्राइव अधिक हो, क्योंकि वे किस सीमा तक 'सीमा पर धकेले नहीं जा रहे हैं?' प्रौद्योगिकी संभाल सकते हैं।

तब से, पाँच डिस्क में से तीन विफल हो गए हैं। शुक्र है कि मैं अगली डिस्क के विफल होने से पहले सरणी को बदलने और पुनर्निर्माण करने में सक्षम था, लेकिन इससे मुझे बहुत चिंता हुई।

आपके क्या विचार हैं? क्या मैं उन्हें एक बुरे बैच में मिला? या नए / उच्च क्षमता डिस्क की कोशिश की और परीक्षण किए गए डिस्क की तुलना में असफल होने की अधिक संभावना है?


2
आप ब्रांड का उल्लेख क्यों नहीं करते? मुझे लगता है कि आपका बैच 7200.11 का था, जो एक शुरुआती मौत की प्रवृत्ति के लिए जाना जाता है।
दानी

वास्तव में, वे पश्चिमी डिजिटल थे ...
मार्क हेंडरसन

बस रिकॉर्ड के लिए, मैंने उन सभी को वापस ले लिया और सभी नए प्राप्त किए, और वे दो महीने से बिना किसी मुद्दे के चल रहे हैं।
मार्क हेंडरसन

मुझे एक ऐसा ही अनुभव हुआ था। 16 1.5TB ड्राइव। पहले 4 महीनों में, 4 कठिन असफल रहे। अगले तीन वर्षों में, एक नरम विफल रहा।
डेविड श्वार्ट्ज

जवाबों:


19

आपको शायद एक खराब बैच मिला है। मैं उसी कारण से एक ही बैच से डिस्क से निर्मित सरणियों को तैनात करने से घबरा रहा हूं - उनके समान जीवन-काल होने की संभावना है, जो एक असफल होने पर प्रतिस्थापन को बहुत रोमांचक बना देता है।

यह असंभव नहीं है कि ड्राइव के साथ कुछ डिज़ाइन दोष है, यह निश्चित रूप से पहले हुआ है; हालाँकि आमतौर पर इंटरनेट ड्राइव के बारे में शिकायतों से भरा होता है अगर वास्तव में इसमें कुछ गड़बड़ है, जैसा कि सामान्य पृष्ठभूमि के शोर के विपरीत है जो आपको कुछ भी मिलेगा।


6
+1 अपनी खरीदारी को अलग करने का प्रयास करें, विभिन्न व्यापारियों से स्रोत या इस को कम करने के लिए ब्रांडों को मिलाएं।
राब एलन

या आप एक ही समय में एक ही स्थान से खट्टा होने वाले ड्राइव में "जलने" से इसे कम कर सकते हैं। कई घंटों / दिनों के लिए उनके खिलाफ एक लेखन-गहन कार्यक्रम चलाएं; डगमगाते उम्र बढ़ने के अनुकरण के लिए अवधि। मैंने ड्राइवटेस्ट नाम का एक साधारण प्रोग्राम बनाया, जो कि पीडिडो-रैंडम डेटा को लिखता है और फिर उसे वापस पढ़ता है और "बर्न इन" करने के लिए सत्यापित करता है और साथ में एक साधारण टेस्ट डेस्क करता है। यह टिप एसएसडी के लिए अनुशंसित नहीं है।
rkagerer

13

जब तक आपके पास एक बड़े संगठन के संसाधन न हों, यह जवाब देना एक कठिन प्रश्न है। हार्ड डिस्क विफलताओं में Google का शोध देखें ।

डिस्क की एक महत्वपूर्ण खरीद करते समय, मैं प्रति डिस्क सबसे कम लागत के साथ किसी न किसी डिस्क का आकार निर्धारित करूंगा, जो आम तौर पर नवीनतम की तुलना में एक पीढ़ी पुरानी है। इससे समझ में आता है कि वे उस पीढ़ी की विश्वसनीयता में सुधार करेंगे।


1
1.5 से 2TB अभी खून बह रहा है, तो 1TB आपके मानदंडों को पूरा नहीं करेगा? वे बहुत सस्ते हैं।
मार्क रैनसम

बहुत अच्छी बात है।
नॉक्स

10

अधिक प्लैटर + अधिक सिर विफलता के उच्च अवसर के बराबर होते हैं।

दो सामान्य WD हार्ड ड्राइव लें

640GB = दो प्लैटर्स
1TB = तीन प्लैटर्स

    WD Black 640GB vs 1TB comparison

Drive Ready Time 11 sec  13
R/W Power watts  8.3     8.4
Idle Power watts 7.7     7.8
Standby watts    1       1
Max shock        300g    250g
Performance seek 29      33
Quiet seek       26      29

वह अतिरिक्त चापलूसी = अधिक शोर, अधिक बिजली का उपयोग, अधिक गर्मी, धीमी गति से तैयार समय, सदमे की क्षति के लिए अतिसंवेदनशील, और अधिक कंपन।

यदि वे एक ही ड्राइव डिजाइन केवल एक थाली के साथ बनाते हैं तो यह और भी बेहतर चश्मा होगा। इस मामले में ये उपभोक्ता ग्रेड ड्राइव हैं, लेकिन ये उच्च श्रेणी के उपभोक्ता ग्रेड ड्राइव हैं, जिनमें डबल कैश और 5 साल की वारंटी है। यदि आप किसी भी ब्रांड या पारंपरिक हार्ड ड्राइव (कताई थाली) की शैली पर प्रलेखन का बारीकी से निरीक्षण करते हैं, तो आप इसी तरह का गणित देखेंगे। यह विशुद्ध रूप से भौतिकी की बात है कि अधिक प्लैटर ड्राइव को कम विश्वसनीय बनाते हैं।

जेफ हेंगसेबक भी सही थे जब उन्होंने कहा

'बिग' ड्राइव के साथ प्राथमिक चिंता एक विफलता होने पर पुनर्निर्माण का समय है। ड्राइव जितनी बड़ी होगी, पुनर्निर्माण उतना ही लंबा होगा, अतिरिक्त ड्राइव की विफलता और सरणी के संभावित नुकसान के लिए बड़ी विंडो। "बिग" ड्राइव के साथ उपलब्धता के व्यावसायिक मूल्य को स्वीकार्य जोखिम (सरणी हानि) का स्तर निर्धारित करना चाहिए जो आपके RAID स्तर चयन और ड्राइव काउंट को ड्राइव करेगा (अधिक ड्राइव = ड्राइव की विफलता की अधिक संभावना)।

ग्रीम पेरो की कुछ छोटी खुराक में जोड़ें

पचास मिलियन सेक्टर्स वाली ड्राइव में पांच मिलियन सेक्टर्स वाले ड्राइव के मुकाबले खराब सेक्टर होने की संभावना दस गुना होती है। मैं बड़ी ड्राइव और छोटी ड्राइव के बीच की विफलता की दर को यहाँ मान रहा हूँ, जो शायद एक अच्छी धारणा नहीं है

अधिक पट्टिका = खराब
अधिक संग्रहण स्थान मिश्रित बैग है। पेशेवरों और विपक्ष कई हैं।
अधिक सेक्टर वास्तव में त्रुटियों के लिए अधिक संभावना है। जरूरी नहीं कि पैमाने में रैखिक हो लेकिन निश्चित रूप से एक कारक है।

जब तक आपको विश्वसनीयता से अधिक स्थान की आवश्यकता नहीं होती है, मैं सुझाव दूंगा कि सिंगल प्लैटर या ड्यूल प्लैटर ड्राइव से चिपके रहना। अनुसंधान और कुछ मामलों में यह जानने के लिए कि आपको क्या मिलेगा जब ड्राइव को ऑर्डर करने के लिए कुछ निर्माताओं को न केवल उन प्लैटर की संख्या को प्रकाशित करने से बचना चाहिए जो वे वास्तव में एक ही भाग संख्या के तहत एक से अधिक ड्राइव बेच सकते हैं।

उदाहरण के लिए WD3200AAKS ले लो वहाँ एक एकल थाली 320GB संस्करण और एक दोहरी थाली 320GB संस्करण (160GB) 2 है। उसके ऊपर कई लैब्स और ड्राइव हाउसिंग का उपयोग किया जा रहा है ताकि आप आसानी से ड्राइव को न देख सकें और यह जान सकें कि कौन सा प्लैटर अंदर है। पता करने का एकमात्र तरीका यह है कि ऑनलाइन पता करने के लिए पता करें कि WD3200AAKS-00B3A0 और WD3200AAKS-75VYA0 आपको बताते हैं कि कौन सा एकल वादक है लेकिन कोई भी खुदरा विक्रेता आपको यह नहीं बताएगा कि आपको क्या मिलेगा।


1
वाह। यह कुछ इन-डेप्थ स्टफ है! धन्यवाद! मैंने अब से पहले मूविंग पार्ट्स (प्लेटर्स) की संख्या पर भी विचार नहीं किया था।
मार्क हेंडरसन

3

मेरा मानना ​​है कि सामान्य विफलता दर से अधिक किसी भी नई तकनीक का संकेत है। मुझे हमेशा कहा गया है कि कार का पहला मॉडल वर्ष कभी न खरीदें, जब तक वे बग्स को काम नहीं करते तब तक प्रतीक्षा करें। मैं एक ही बात शायद हार्ड ड्राइव सहित कई अन्य चीजों के लिए सच है, कहूँगा।


1
मैं पूरी कार सादृश्य (कार उपमाएँ कभी नहीं भटकती, वे कर सकते हैं?) पर जा सकते हैं। मैं मानता हूँ कि मैं एक भीड़ में था और यह ठीक से शोध नहीं किया था, और मैं अब कीमत चुका रहा हूँ!
मार्क हेंडरसन

3

मुझे यकीन नहीं है कि यह कहना उचित है कि 'बड़े' डिस्क में MTBF अधिक है या नहीं। मेरे पास 750GB ड्राइव के साथ एक बड़ा नाम प्रणाली है और पिछले 2+ वर्षों में कोई भी विफल नहीं हुआ है (2 साल पहले 750 "बड़ा" था)। लेकिन मुझे यह भी पता है कि 250GB बड़ा होने पर एक बड़ा नाम सिस्टम बनाया गया था और यह सरणी कुछ ही समय में गिर गई थी। एमटीबीएफ की बहस एक पवित्र युद्ध है।

'बिग' ड्राइव के साथ प्राथमिक चिंता एक विफलता होने पर पुनर्निर्माण का समय है। ड्राइव जितनी बड़ी होगी, पुनर्निर्माण उतना ही लंबा होगा, अतिरिक्त ड्राइव की विफलता और सरणी के संभावित नुकसान के लिए बड़ी विंडो। "बिग" ड्राइव के साथ उपलब्धता के व्यावसायिक मूल्य को स्वीकार्य जोखिम (सरणी हानि) का स्तर निर्धारित करना चाहिए जो आपके RAID स्तर चयन और ड्राइव काउंट को ड्राइव करेगा (अधिक ड्राइव = ड्राइव की विफलता की अधिक संभावना)।

पिछले कुछ वर्षों में बिजनेस SATA / RAID एक साथ आया है। मुझे नहीं लगता कि बड़े नाम इसे पेश करेंगे अगर उन्हें पता था कि यह एक प्रमुख समर्थन मुद्दा होगा या ग्राहक का स्रोत कम हो जाएगा। मुझे आपकी विश्वसनीयता को जानने की उत्सुकता होगी कि अब आपने मूल बैच में से कुछ को बदल दिया है।


1

क्या वे सभी एक ही कंप्यूटर या डिस्क कंट्रोलर पर हैं? आपने कहा था कि आपको सरणी को फिर से बनाना होगा। यदि यह मामला है, तो शायद नियंत्रक, बिजली की आपूर्ति, या स्मृति के साथ कुछ गड़बड़ है । यदि नहीं, तो मुझे ड्राइव के दोषपूर्ण बैच का भी अनुमान होगा। इसके अलावा, उस विशेष नियंत्रक के साथ आप जो भी विशेष ड्राइव का उपयोग कर रहे हैं उसके साथ एक संगतता समस्या हो सकती है।

इसके अलावा, मुझे आश्चर्य है कि जब लोग कहते हैं कि बड़े डिस्क में एक उच्च एमटीबीएफ होता है जिसकी गणना कैसे की जाती है। कहते हैं कि आपके पास 2x250 जीबी और 1x500 जीबी डिस्क हैं। हो सकता है कि यह अनुभवहीन हो, लेकिन उस ड्राइव को दोगुना नहीं रखा जाएगा जिसके पास अधिक डेटा हो, जिसके साथ यह विफल हो सकता है? मुझे लगता है कि मुझे नहीं पता कि एमटीबीएफ में कोई गलत या गलत लिखा हुआ है, या इसका मतलब है कि डिस्क यांत्रिक रूप से टूट गई है। क्या किसी को पता है कि हार्ड डिस्क के लिए एमटीबीएफ का एक सख्त उद्योग मानक और परिभाषा है?


1

यहाँ कुछ चीजें हैं जो मैं देखूंगा: 1) क्या ड्राइव पर सीरियल नंबर बहुत करीब हैं? यदि ऐसा है तो आपके पास एक दोषपूर्ण बैच 2 हो सकता है) आपके सर्वर में रहने वाला वातावरण कैसा है? क्या आपके पास हाल ही में अन्य हार्डवेयर विफल होने के मुद्दे हैं? 3) क्या ड्राइव सीगेट बाराकुडा ड्राइव होना है? उन ड्राइव के साथ समस्याएँ हैं। इस पर इस कंप्यूटरवर्ल्ड लेख को देखें । 4) क्या ये ड्राइव सिस्टम के हिस्से के रूप में आए थे? या क्या आपने उन्हें खुद खरीदा है? यदि आपने ओईएम ड्राइव खरीदा है, तो यह सुनिश्चित करने का कोई तरीका नहीं है कि आप उन्हें खरीदने से पहले ड्राइव को सावधानी से संभालें।

मुझे व्यक्तिगत रूप से हार्ड ड्राइव के साथ अविश्वसनीय भाग्य मिला है। मैं केवल दो ड्राइव मुझ पर विफल रहा है। उन विफलताओं में से केवल एक ड्राइव पर था जिसे मैं वास्तव में उपयोग कर रहा था। हालाँकि, मेरे चारों ओर मैंने देखा है कि बहुत से लोग हार्ड ड्राइव पर डेटा खो देते हैं।


हम्म, हाँ वे सब बहुत करीब हैं, लेकिन वे WD की, नहीं Seagates, थे और हाँ वे OEM ड्राइव ... कुछ चीजें मैं वहाँ में नहीं माना जाता था ... थे
मार्क हेंडरसन

1

बड़ी ड्राइव की उच्च विफलता दर सिर्फ ड्राइव के आकार का एक कार्य हो सकती है। पचास मिलियन सेक्टर्स वाली ड्राइव में पांच मिलियन सेक्टर्स वाले ड्राइव के मुकाबले खराब सेक्टर होने की संभावना दस गुना होती है। मैं बड़ी ड्राइव्स और छोटी ड्राइव्स के बीच विफलता की दर को समान मान रहा हूं, जो शायद एक अच्छी धारणा नहीं है - जैसा कि किसी और ने कहा, तथ्य यह है कि टेराबाइट ड्राइव अभी भी अपेक्षाकृत नए हैं, उनके पास संभवतः उच्च विफलता दर है से शुरू।

आपके मामले में, यह सिर्फ ड्राइव के खराब बैच जैसा लगता है।


1

यदि आप एक ही समय में एक ही समय में सभी ड्राइव खरीदते हैं तो संभव है कि वे सभी एक ही iffy बैच से आते हैं।

जब एक RAID सरणी को एक साथ रखा जाता है, तो मैं आमतौर पर ड्राइव को थोड़ा मिश्रण करने की सलाह देता हूं, अर्थात निर्माताओं का मिश्रण या अलग-अलग आपूर्तिकर्ताओं से कम से कम ड्राइव (एक खराब बैच से सभी ड्राइव के जोखिम को कम करने के लिए)।

एक और सिफारिश मैं कर सकता हूं कि यदि संभव हो तो छोटी ड्राइव का उपयोग करें (यानी आपके पास ड्राइव और कंट्रोलर पोर्ट के लिए भौतिक स्थान उन्हें बंद करने के लिए है), इसलिए एक RAID 1 वॉल्यूम के बजाय या दो 1Tb ड्राइव में चार 500Gb इकाइयों की RAID 10 है। इस तरह से जब कोई ड्राइव खराब होती है तो आप केवल एक छोटे से सरणी का पुनर्निर्माण कर रहे होते हैं, जो पूरे सरणी के पुनर्निर्माण के बजाय एक बड़े सरणी का हिस्सा होता है (समय की लंबाई को कम करता है जिसके दौरान सरणी पूर्ण नहीं होती है), और यह थोड़ा अधिक अतिरेक भी प्रदान करता है ("दो ड्राइव एक बार में विफल हो जाते हैं" के छह में से चार में एक 4 ड्राइव RAID10 सरणी लाइव होगी)। यदि आप अपने RAID नियंत्रक / सॉफ़्टवेयर द्वारा समर्थित हैं, तो R50 सरणी में छोटे R5 सरणियों को संयोजित करने के साथ भी आप ऐसा कर सकते हैं।

शायद मैं बहुत अधिक पागल हो गया हूँ, लेकिन मैं 1Tb डेटा को एक सिंगल ड्राइव पर भरोसा करने से सावधान रहूंगा, भले ही वह ड्राइव एक अनावश्यक सरणी का हिस्सा हो।

जाहिर है कि खेलने में शारीरिक अड़चनें हैं, जो तकनीक को आपके लिए अव्यवहारिक बना सकती हैं, पावर ड्रास्ट्रेन भी, इसलिए YMMV। एक "उदाहरण के लिए" के रूप में जब एक सरणी या सरणियाँ व्यावहारिक नहीं होती हैं : मैं R10 के रूप में हमारे एक सर्वर में एक आर 1 सरणी में बड़ी ड्राइव के स्थान पर चार ड्राइव करना चाहूंगा, लेकिन इसमें शारीरिक रूप से स्थान नहीं है। , एक बाहरी एरे को खरीदना / निर्माण करना बजट से बाहर था, और हम किसी मौजूदा एरे पर जगह का उपयोग नहीं कर सकते थे क्योंकि डेटा सुरक्षा आवश्यकताओं के कारण डेटा को अन्य सभी डेटा से भौतिक रूप से अलग रखा जाना था।


1

बड़ी ड्राइव की इस समस्या पर किसी ने बहुत विस्तृत अध्ययन किया। यह ड्राइव आकार में वृद्धि के बावजूद शेष त्रुटि दर के साथ स्थिर रहने के लिए करना है, और बड़े ड्राइव के पुनर्निर्माण में अधिक समय लगता है। वास्तविकता के दायरे में बहुत अधिक पुनर्निर्माण के दौरान दो विफलता को जोड़ने के लिए दो गठबंधन। मैं RAID सरणियों पर 500 जीबी या छोटे ड्राइव के साथ जाऊंगा।


1

उत्पादन के उपयोग के लिए हमेशा छोटी क्षमता की हार्ड ड्राइव का उपयोग करें। इसके पीछे कभी भौतिकी की जाँच नहीं की, लेकिन छोटे डिस्क बस कम बार टूट जाते हैं। वही सब मुझे हमेशा बताते थे।


0

क्या आपने एक ही बैच से सभी डिस्क के साथ एक सरणी बनाई और सभी एक ही आपूर्तिकर्ता से भेज दी गई? मुझे बताया गया कि बुरा काम है ...


0

RAID-6 पर विचार करें। RAID -5 के पुनर्निर्माण के दौरान एक कठिन पढ़ने की त्रुटि का मौका इसे बहुत वास्तविक बनाता है। या ZFS के साथ RAID-Z।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.