क्या दोष होने से पहले सर्वर की हार्ड ड्राइव को बदलना एक कारण है?

11

बस एक त्वरित प्रश्न: क्या दोष होने से पहले एक्स के वर्षों के बाद सर्वर की हार्ड ड्राइव को बदलने का एक कारण है (यह अंततः किसी बिंदु पर होगा) या क्या मुझे इसे दोष होने तक छोड़ देना चाहिए? मुझे वास्तविक सर्वर प्रशासन के साथ बहुत कम अनुभव है इसलिए मुझे आश्चर्य है ...

hard-drive hardware

— Spiros
स्रोत

मुझे इतने सारे उत्तर मिलने की उम्मीद नहीं थी, वाह :) उन सभी की समीक्षा करने के बाद, और यह ध्यान में रखते हुए कि क) सर्वर की हार्डड्राइव इसके लिए पर्याप्त हैं b) बैकअप बिल्कुल गारंटी है (RAID + प्रतिकृति दास + दैनिक बैकअप का उपयोग करने की) एक बाहरी स्रोत) मुझे ड्राइव परिवर्तन का सुझाव देने का कोई कारण नहीं मिला। सबको शुक्रीया!

— स्पिरोस

8

इसे बदलने का एक बड़ा कारण यह है कि अगर आप कुछ गलत होने की संभावना को बढ़ाते हुए अपनी चीजों की सूची में एक और काम जोड़ना चाहते हैं।

सभी मजाक करते हुए, वास्तव में कोई कारण नहीं है कि मैंने समय से पहले ड्राइव को बदलने के बारे में सुना है। यदि आपके पास RAID जगह है, तो आपके पास पहले से ही सुरक्षा है (यह मानते हुए कि आपके पास अच्छे बैकअप हैं), और आप निपटान करने के लिए डेड ड्राइव के रूप में बेकार सामग्री नहीं पैदा कर रहे हैं और आपको इसे समाप्त करने पर अनावश्यक रूप से काम करने की आवश्यकता नहीं है संवेदनशील डेटा ड्राइव से। आप नई ड्राइव पर अतिरिक्त पैसा खर्च नहीं करेंगे और आप अभी भी उन चीज़ों से सुरक्षित रूप से रक्षा नहीं करेंगे जो अभी भी किसी भी तरह से गलत हो सकते हैं, जैसे कि एक दोषपूर्ण ड्राइव नियंत्रक, जो कि ड्राइव फॉल्ट स्रोत के रूप में आम नहीं है, लेकिन हो सकता है।

दूसरी ओर यह आपको बिना पहचाने जाने योग्य ड्राइव त्रुटियों को खोजने में मदद कर सकता है जो RAID यूनिट पर अलार्म को ट्रिगर नहीं कर रहे हैं, जैसा कि हम RAID 5 के साथ हुआ था। हमें इससे काट लिया गया था और बैकअप से नंगे धातु से पुनर्निर्माण की आवश्यकता थी (इसलिए उस स्थिति में, एक उचित बैकअप आपको पुनर्प्राप्त करने में मदद करेगा।) एक RAID स्तर जो आज की बड़ी ड्राइव क्षमताओं और अपरिवर्तनीय त्रुटि सहिष्णुता को ध्यान में रखता है, अगर हमें मदद मिलती, तो बैकअप दिन को नहीं बचाते।

अधिकांश व्यवस्थापकों के पास एक सभ्य RAID और बैकअप योजना होती है, इसलिए अनावश्यक रूप से ड्राइव को बदलकर अतिरिक्त अपशिष्ट उत्पन्न करने की कोई वास्तविक आवश्यकता नहीं होती है।

— बार्ट सिल्वरस्ट्रिम
स्रोत

6

केवल एक बार मैं इस पर विचार कर सकता हूं यदि मेरे पास एक ही बैच से डिस्क का एक गुच्छा था, और बैच के अन्य लोग असफल होने लगे थे, तो मैं इस पर विचार कर सकता हूं।

अगर मैं अंतरिक्ष पर तंग था, तो यकीन है, मैं यह करूँगा - लेकिन सिर्फ पुराने होने के अलावा और किसी कारण से नहीं? नहीं, क्योंकि पहले वर्ष में औसतन विफलता दर किसी अन्य वर्ष की विफलता दर के समान है । (ध्यान दें कि ग्राफ़ पहले वर्ष को 3 महीने, 6 महीने, 1 वर्ष से अधिक समय के लिए तोड़ता है, लेकिन आपको 1 वर्ष में विफलता की संभावना प्राप्त करने के लिए उन सभी को एक साथ जोड़ना होगा)। और जब उच्च डिस्क उपयोग को देखते हैं, तो यह अगले तीन वर्षों में संयुक्त रूप से पहले वर्ष में विफल होने की अधिक संभावना है।

लेट ड्राइव विफलता का एकमात्र संबंध गर्म कमरों में था, और हम अपने सर्वर रूम को ठंडा रखते हैं।

— जो एच।
स्रोत

5

मैं सक्रिय होने के लिए सभी हूं, लेकिन मैंने कभी ऐसा नहीं किया है और कभी किसी को ऐसा करते हुए नहीं सुना है। संभवत: आपके पास कुछ प्रकार के RAID सेटअप हैं और नियमित रूप से होने वाले हैं, सिस्टम में सवाल के लिए वैध बैकअप।

— joeqwerty
स्रोत

5

+1, इसे कभी नहीं माना। डिस्क को बदलना, बस-केस, और जानबूझकर एक सरणी पुनर्निर्माण को ट्रिगर करना शेष उत्पादन डिस्क को "व्यायाम" करने का सबसे अच्छा तरीका नहीं लगता है। बॉस को समझाने के लिए सख्त रहें कि पुनर्निर्माण विफल होने पर सिस्टम नीचे क्यों है।

— jscott

3

मैं उन डिस्क को प्रतिस्थापित करता हूं जिनमें SMART त्रुटियां हैं, लेकिन मैं उन्हें विफल मानूंगा, भले ही वे अभी भी तकनीकी रूप से काम करें।

— क्रिस एस

4

हां, प्रदर्शन और क्षमता। यदि पुरानी हार्ड ड्राइव 70 एमबी / सेकंड निरंतर रीड और 100 आईओपीएस करती है और संभावित प्रतिस्थापन 200 एमबी / सेकंड निरंतर रीड और 175 आईओपीएस करता है और आपके पास नई ड्राइव खरीदने और नए के लिए पुराने स्वैप करने के लिए 3 गुना क्षमता है। प्रदर्शन / क्षमता कारण। (और उन संख्याओं को पूरी तरह से बनाया गया है, बिंदु नया है काफी तेज हो सकता है)।

अब आप पुराने ड्राइव के साथ क्या करते हैं। आप उन्हें एक परीक्षण सर्वर में उपयोग कर सकते हैं, या उन्हें डिस्क सरणी में एक बैकअप में जोड़ सकते हैं, या आपातकालीन पुर्जों के रूप में उन पर पकड़ बना सकते हैं। या आप बस उन्हें मिटा सकते हैं और उन्हें निपटान के लिए भेज सकते हैं।

आपका औसत सर्वर अब दिन है IO अधिक से अधिक है यह प्रोसेसर बाध्य है (या कम से कम सभी मेरे हैं)। इसलिए यदि आपके पास वास्तव में पुराना सर्वर है जिसमें सीपीयू समय या मेमोरी की कोई समस्या नहीं है, तो आपके पास संभावना है कि हार्ड ड्राइव को बदलकर प्रदर्शन को बेहतर बनाया जा सकता है जो कि कई पीढ़ियों के पीछे हैं जिन्हें आप आसानी से खरीद सकते हैं ताकि आप उन्हें बदल सकें।

— pplrppl
स्रोत

3

यह हार्ड ड्राइव की खराबी के कारण प्रभाव पर निर्भर करता है।

यदि आपके पास RAID नहीं है, तो
आप सर्वर उपलब्धता के बारे में परवाह नहीं करते हैं क्योंकि सेवा को रोका जा सकता है या क्योंकि यह उच्च उपलब्धता में है और यदि आपके पास डेटा का बैकअप है। मैं कहूंगा कि ओके, ड्राइव को मरने दें और इसे बदल दें और जब यह विफल हो जाएगा तो डेटा को पुनर्स्थापित करें।
यदि आप उपलब्धता की परवाह करते हैं, तो मैं कहूंगा कि RAID का उपयोग करें;)

यदि आपके पास एक RAID (1, 5, 6, ...)
मैं कहूंगा, तो गलती से पहले हार्ड ड्राइव को क्यों बदलना? RAID (और बैकअप) उसके लिए यहाँ है। केवल एक हार्ड ड्राइव को बदलने के मामले में यह विफल हो सकता है कुछ को तोड़ने का जोखिम है (छापे पुनर्निर्माण हमेशा जोखिम भरा होता है)

लेकिन यह केवल मेरी बात है! यदि आपको लगता है कि आपकी ड्राइव बहुत पुरानी हो सकती है, तो आप अपना सर्वर भी बदलना चाह सकते हैं।

— त्रिज्या
स्रोत

2

कुछ डिस्क 1 घंटे में मर जाते हैं, अन्य पिछले 2 दशकों में।

यदि यह विफल या विफल नहीं है (कुछ आप आमतौर पर स्मार्ट मॉनिटरिंग या प्रदर्शन समस्याओं के माध्यम से स्थापित कर सकते हैं) तो इसे बाहर फेंकने का एकमात्र कारण यह है कि यदि यह आपके उद्देश्यों के लिए पर्याप्त या तेज़ नहीं है।

— क्रिस थोरपे
स्रोत

1

बस स्मार्ट के साथ ड्राइव की निगरानी करें और यह आमतौर पर विफलता के संकेत दिखाएगा इससे पहले कि बहुत देर हो जाए।

— प्रो। मोरियार्टी

@Prof Google के मास डिस्क अध्ययन से पता चला कि स्मार्ट "आम तौर पर" विश्वसनीय 44% -72% समय था। static.googleusercontent.com/external_content/untrusted_dlcp/…

— jscott

2

डिस्क के साथ, सवाल यह नहीं है कि क्या वे असफल होंगे, लेकिन कब । वे यांत्रिक उपकरण हैं (जब तक SSDs का उपयोग नहीं करते हैं, लेकिन उनके पास अपने स्वयं के कैविटीज़ हैं), इसलिए वे जल्दी या बाद में विफल हो जाएंगे।

डिस्क विक्रेता अपनी विनिर्माण प्रक्रियाओं को जितना संभव हो उतना सस्ता करने की प्रवृत्ति रखते हैं, क्योंकि प्रति डिस्क पर सहेजे गए एक प्रतिशत भी काफी महत्वपूर्ण हो सकते हैं जब आप उनमें से हजारों का उत्पादन और बिक्री कर रहे हों; लेकिन वे निश्चित रूप से नहीं चाहते हैं कि वारंटी अवधि समाप्त होने से पहले उनके डिस्क विफल हो जाएं, या वे उन्हें हर समय मुफ्त में बदल देंगे; इसलिए, जब तक वारंटी उन्हें कवर करती है, तब तक वे खुशी-खुशी बिताएंगे।

अंतिम परिणाम है: वारंटी अवधि समाप्त होने के बाद अधिकांश डिस्क जल्द ही विफल हो जाती हैं। यह निश्चित रूप से एक सामान्य नियम नहीं है, यह केवल आँकड़े हैं, और आपकी डिस्क अब या अंतिम तक विफल हो सकती है जब तक आपको इसकी आवश्यकता नहीं होगी ... लेकिन, सांख्यिकीय रूप से, बहुत सारे डिस्क हैं जो उनके कुछ दिनों या महीनों के बाद विफल हो जाते हैं वारंटी समाप्त हो गई।

बेशक, नए खरीदना जब आपको अभी भी ज़रूरत नहीं है तो महंगा हो सकता है ... लेकिन वारंटी समाप्त होने के बाद उन्हें बदलना और वे विफल हो गए हैं वैसे भी महंगा होगा।

अब, अगर आप अभी भी वारंट करते समय उन्हें विफल करने का एक तरीका ढूंढ सकते हैं (और इस प्रक्रिया में डेटा नहीं खो रहे हैं, अर्थात अच्छा RAID और बैकअप), ठीक है, जो कि इष्टतम होगा ;-)

— मास्सिमो
स्रोत

2

मैं किसी भी कार्यशील बिजली की आपूर्ति को बदलने की तुलना में किसी भी कार्यशील ड्राइव को प्रतिस्थापित नहीं करूंगा। दोनों अंततः विफल हो जाएंगे, लेकिन यह कोई मतलब नहीं है, या तो तकनीकी रूप से या आर्थिक रूप से, उन्हें अच्छे कारण के बिना बदलने के लिए। जब वे परेशानी के लक्षण दिखाना शुरू करें तो उन्हें बदल दें।

हार्ड ड्राइव के मामले में प्रवृत्ति यह है कि यदि कोई ड्राइव जल्दी विफल होने वाला है तो यह पहले वर्ष में ऐसा करने की संभावना से अधिक होगा। 6 साल तक परेशानी से मुक्त रहने वाली ड्राइव को आम तौर पर कम से कम कुछ और वर्षों तक काम करना जारी रखने के लिए भरोसा किया जा सकता है। जाहिर है कि इसके बहुत सारे अपवाद हैं लेकिन यह सामान्य प्रवृत्ति है।

— जॉन गार्डनियर्स
स्रोत

1

जब बिजली की आपूर्ति विफल हो जाती है तो आप (आमतौर पर) डेटा नहीं खोते ...

— मास्सिमो

1

@ मैसिमो - सच है, लेकिन एक सर्वर पर आप एक ड्राइव विफल होने पर आमतौर पर डेटा नहीं खोते हैं। मेरी राय में, अगर कोई अतिरेक नहीं है, तो यह केवल एक महिमा कार्य केंद्र है, वास्तविक सर्वर नहीं।

— जॉन गार्डनियर्स

1

इसके अलावा, यह ध्यान रखें कि अधिकांश सर्वर क्लास ड्राइव में अधिक सख्त कारख़ाना आवश्यकताएं होती हैं और आमतौर पर कम लागत / बजट डेस्कटॉप ड्राइव की तुलना में अधिक विश्वसनीय होती हैं। इसलिए, इसके संभावित रूप से विफल होने की स्थिति में 'अच्छा' ड्राइव को बदलने के खतरों के अलावा, एक बड़े सरणी के लिए ऐसा करने से बड़ी राशि का योग हो सकता है।

इसके अलावा, RAID का उपयोग करते समय, यही कारण है कि सर्वर में कम से कम एक गर्म स्पेयर होने का एक अच्छा विचार है, इसलिए यह जल्दी से पुनर्निर्माण करना शुरू कर सकता है और तब तक स्वस्थ रह सकता है जब तक आप एक आवश्यक आधार पर प्रतिस्थापन नहीं खरीदते।

— user2626
स्रोत

1

मैंने इसे "शून्य-डाउनटाइम" सिस्टम पर किया है। हालांकि वास्तव में, आप के रूप में एक अलग ड्राइव खो जाने की संभावना है जब RAID का पुनर्निर्माण होता है ... मैंने एक बार स्वैप किया था, फिर इसे वापस स्वैप करना शुरू किया जब एक और ड्राइव ने पुनर्निर्माण के दौरान त्रुटियों को फेंकना शुरू कर दिया।

यह वास्तव में एक दर्शन प्रश्न है: यदि आप समर्थक-सक्रिय तनाव परीक्षण (दोनों सरणी और आपके हृदय प्रणाली के) में विश्वास करते हैं, तो आपको अपनी ड्राइव स्वैप करना चाहिए। लेकिन वास्तव में, आप कभी भी यह नहीं जान पाएंगे कि आगे कौन सी ड्राइव खराब होने वाली है। यह बिल्कुल भी संभव नहीं है कि आप किसी पुराने, सिद्ध ड्राइव को खोने से पहले नई बदली हुई ड्राइव को खो सकते हैं।

कहा जा रहा है कि, मैं अपना बैकअप समाधान तनाव-परीक्षण पर अपना समय बर्बाद करूँगा, और शांति से ड्राइव को छोड़ दूंगा जब तक कि वे वास्तव में त्रुटियों को फेंकना शुरू न करें।

— SatanicPuppy
स्रोत