मेरे ग्राहक की साइटों में से एक को पिछले हफ्ते एक सीधा बिजली का झटका मिला (संयोग से शुक्रवार को 13 वां! )।
मैं साइट के लिए दूरस्थ था, लेकिन किसी ऑनसाइट के साथ काम करने पर, मैंने नुकसान के एक अजीब पैटर्न की खोज की। दोनों इंटरनेट लिंक डाउन थे, अधिकांश सर्वर अप्राप्य थे। एमडीएफ में बहुत नुकसान हुआ , लेकिन एक फाइबर से जुड़े आईडीएफ ने स्विच स्टैक सदस्य पर 90% पोर्ट खो दिया। पर्याप्त स्पेयर स्विच पोर्ट्स अन्य जगहों और रिप्रोग्रामिंग को पुनर्वितरित करने के लिए उपलब्ध थे, लेकिन जब हमने इसे प्रभावित किया था तब डाउनटाइम था।
यह एक नई बिल्डिंग / वेयरहाउसिंग सुविधा थी और बहुत सारी प्लानिंग सर्वर रूम के डिजाइन में चली गई। मुख्य सर्वर रूम एक APC SmartUPS RT 8000VA डबल-रूपांतरण ऑनलाइन यूपीएस से चलाया जाता है , जो एक जनरेटर द्वारा समर्थित है। सभी जुड़े उपकरणों के लिए उचित बिजली वितरण था। ऑफसाइट डेटा प्रतिकृति और सिस्टम बैकअप जगह में थे।
सभी में, क्षति (जो मुझे पता है) थी:
- सिस्को 4507R-E चेसिस स्विच पर 48-पोर्ट लाइन कार्ड विफल ।
4 सदस्यीय स्टैक में सिस्को 2960 स्विच विफल।(उफ़ ... ढीली स्टैकिंग केबल)- सिस्को 2960 स्विच पर कई परतदार बंदरगाह।
- HP ProLiant DL360 G7 मदरबोर्ड और बिजली की आपूर्ति।
- Elfiq WAN लिंक बैलेंसर।
- एक मल्टीटेक फैक्स मॉडेम।
- वाईमैक्स / फिक्स्ड-वायरलेस इंटरनेट एंटीना और पावर-इंजेक्टर।
- कई पीओई कनेक्टेड डिवाइस (वीओआईपी फोन, सिस्को ऐरोनेट एक्सेस प्वाइंट, आईपी सिक्योरिटी कैमरा)
अधिकांश मुद्दों को सिस्को 4507R-E में एक संपूर्ण स्विच ब्लेड खोने के लिए बांधा गया था। इसमें कुछ VMware NFS नेटवर्किंग और साइट के फ़ायरवॉल तक अपलिंक शामिल था। VMWare होस्ट विफल हो गया, लेकिन HA ने VM के स्टोरेज नेटवर्किंग कनेक्टिविटी को बहाल करने का ध्यान रखा। मुझे फंकी पावर स्टेट्स को साफ़ करने के लिए कई उपकरणों को रीबूट / पावर करने के लिए मजबूर किया गया था। इसलिए रिकवरी का समय कम था, लेकिन मैं उत्सुक हूं कि क्या सबक सीखा जाना चाहिए ...
- भविष्य में उपकरणों की सुरक्षा के लिए क्या अतिरिक्त सुरक्षा लागू की जानी चाहिए?
- मुझे वारंटी और प्रतिस्थापन से कैसे संपर्क करना चाहिए? सिस्को और एचपी अनुबंध के तहत वस्तुओं की जगह ले रहे हैं। महंगे एलफिक वान लिंक बैलेंसर का उनकी वेबसाइट पर एक दोष है जिसने मूल रूप से कहा "बहुत बुरा, एक नेटवर्क सर्ज रक्षक का उपयोग करें "। (ऐसा लगता है कि वे इस प्रकार की विफलता की उम्मीद करते हैं)
- मैं पिछले लंबे समय से आईटी में रहा हूं, अतीत में बिजली के तूफान से नुकसान हुआ है, लेकिन बहुत सीमित प्रभाव के साथ; जैसे सस्ते पीसी का नेटवर्क इंटरफेस या मिनी स्विच का नष्ट होना।
- क्या कुछ और है जो मैं संभावित परतदार उपकरणों का पता लगाने के लिए कर सकता हूं, या क्या मुझे बस सतह पर विषम व्यवहार की प्रतीक्षा करनी है?
- क्या यह सब सिर्फ दुर्भाग्य था, या कुछ ऐसा जो वास्तव में आपदा वसूली में होना चाहिए?
पर्याप्त $ $ $ के साथ, पर्यावरण में सभी प्रकार की अतिरेक का निर्माण करना संभव है, लेकिन निवारक / विचारशील डिजाइन और यहां संसाधनों के प्रभावी उपयोग का एक उचित संतुलन क्या है?