एक छोटे से व्यवसाय के लिए उच्च सर्वर उपलब्ध है

11

एक सर्वर के साथ थोड़ा डराने के बाद, जो एक सुबह तक नहीं आएगा, उच्च अप ने निर्णय लिया है कि व्यवसाय को सेटअप के लिए एक उच्च उपलब्धता / असफलता की आवश्यकता है।

हमारे पास 5 मुख्य सर्वर (4x लिनक्स, 1x ओपनबीएसडी) हैं, जिनमें से सभी को संचालित करने के लिए कंपनी को चलाने की आवश्यकता है। तीन सर्वर काफी मानक (फाइल / वेब / डेटाबेस) हैं, चौथा अधिकांश नेटवर्क रूटिंग और वेब प्रॉक्सी को संभालता है, जबकि पांचवां हमारे फोन सिस्टम का समर्थन करता है और इसमें गैर-मानक हार्डवेयर है।

मेरे बॉस ने कहा है कि सर्वर फेल होने का समय 30 मिनट से कम होना चाहिए।

इस क्षेत्र में मेरा अनुभव गैर-मौजूद है (मैं सिर्फ एक प्रोग्रामर हूं जिसे 'पदोन्नत' किया गया था), इसलिए मुझे लगता है कि मेरा प्रश्न वास्तव में नीचे उबलता है:

क्या यह कुछ ऐसा है जिसे औसत सर्वर-व्यवस्थापक कौशल वाले किसी व्यक्ति द्वारा भी प्रयास किया जाना चाहिए। यदि हां, तो मुझे क्या पढ़ना चाहिए, और मुझे किससे बात करनी चाहिए?

धन्यवाद।

high-availability disaster-recovery small-business

— मैथ्यू
स्रोत

उच्च उपलब्धता तैनाती वास्तुकला

— तकनीकी विशेषज्ञ

5

मुझे लगता है कि आपको यह देखने के लिए कि "बजट" भी आता है, यह देखने के लिए कि "आवश्यकता" को पूरा करने से जुड़ी लागत का वर्णन करने के लिए एक साथ संख्या प्राप्त करके शुरू करना चाहिए। यदि आप उन सभी "सामान्य" विधियों के साथ सहज नहीं हैं जिनका उपयोग आवश्यकता को पूरा करने के लिए किया जाएगा (विफलता क्लस्टरिंग, "हॉट माइग्रेशन" क्षमता, आदि के साथ हाइपरविजर), तो आप शायद एक सलाहकार खोजने के लिए अच्छा करेंगे जो कर सकते हैं मदद करना।

व्यवहार्यता अध्ययन से जुड़ी कुछ लागत होने जा रही है, लेकिन यह पता लगाने के लिए बहुत कम खर्च होने वाला है कि एक अच्छा समाधान बताई गई आवश्यकता के भीतर फिट नहीं होगा (इसका मतलब है कि प्रबंधन द्वारा अपेक्षाओं को अधिक वास्तविक रूप से निर्धारित किया जाना चाहिए - या वे जरूरत से ज्यादा पैसा टटोलने) की तुलना में इसे कुछ आधा करने का खर्च आएगा, जो इस आवश्यकता को पूरा नहीं करता है और इस प्रक्रिया में एक टन पैसा उड़ा देता है।

ऐसा लगता है कि आपके बॉस ने बस उस नंबर को हवा से बाहर निकाला। शायद उसने कुछ विश्लेषण किया है और जानता है कि विभिन्न प्रणालियों के डाउनटाइम से जुड़ा प्रति-घंटे क्या है, लेकिन मुझे इसमें संदेह है। यह कुछ पाई-इन-द-स्काई संख्या की तरह लगता है जो वास्तविकता से बंधा नहीं है। अगर आपके सभी सिस्टम को उस तरह की उपलब्धता की आवश्यकता है, तो मुझे सर्पोट होगा। यह व्यवसाय का अध्ययन करने के दौरान हो सकता है कि आपको पता चलता है कि कार्यक्षमता के केवल एक सबसेट के लिए इस तरह की अपटाइम और गलती-सहिष्णुता की डिग्री होनी चाहिए (और, इस तरह, इस तरह के समाधान को अंततः कम लागत आएगी)। मुझे यकीन है कि फोन और लाइन-ऑफ-बिजनेस एप्लिकेशन ऊपर हैं, लेकिन आपको कुछ अन्य प्रणालियों पर डाउनटाइम के लिए कुछ सहिष्णुता हो सकती है।

मेरे कण्ठ का कहना है कि आप शायद निरर्थक हार्डवेयर के बीच आभासी मशीनों के प्रवास के आधार पर एक विफलता प्रणाली बनाने के लिए वर्चुअलाइजेशन तकनीकों का उपयोग करने में एक जीत खोजने जा रहे हैं। यह आपके बजट में फिट होगा या नहीं यह आपके व्यवसाय पर निर्भर करेगा, क्योंकि आपको उस काम को प्रभावी ढंग से करने के लिए निश्चित रूप से किसी प्रकार के SAN की आवश्यकता होगी।

हालांकि "पारंपरिक" फेलओवर क्लस्टरिंग को छूट न दें। वहाँ निश्चित रूप से "जीत" भी हैं, अगर आपके आवेदन ऐसे कॉन्फ़िगरेशन के लिए अच्छी तरह से अनुकूल हैं।

मुझे आश्चर्य है कि अगर आपके बॉस ने भयावह विफलता परिदृश्यों के बारे में सोचा है (इमारत जलती है, बाढ़, बवंडर, चोरी, आदि)। यदि यह पहले से ही नियोजित नहीं है, तो यह कुछ सामान्य व्यापार निरंतरता योजना और आपदा वसूली आकस्मिकता में काम करने का एक सुनहरा अवसर होगा।

किसी ऐसे व्यक्ति की मदद लें जो आपके व्यवसाय में आकर अध्ययन कर सकता है और सिफारिशें कर सकता है। आप इसे पछतावा नहीं करेंगे।

— इवान एंडरसन
स्रोत

शानदार प्रतिक्रिया के लिए धन्यवाद। मुझे यकीन है कि 30min समय सीमा मौके पर भी बनाई गई थी।

— मैथ्यू

वास्तव में, मुझे संदेह है कि "30 मिनट" ग्राहक की शिकायतों की संख्या से सीधे जुड़ा हुआ है जो उसे 30 मिनट में मिलती है। विशुद्ध रूप से टीसीपी / आईपी अनुप्रयोगों के लिए विफलता सिस्टम इतना कठिन नहीं है। टेलिफोन सिस्टम या वीओआईपी के लिए फेलओवर सिस्टम जिसमें दूसरी ओर पीएसटीएन के लिए किसी प्रकार का टाई-इन होता है, उदाहरण के लिए महंगे हैं।

— एर्नी

2

"यह सड़क बहुत दर्द और चोट पहुँचाती है ..."

तो, आपके व्यवसाय की निरंतरता योजना क्या है? आप आपदा वसूली योजना?

क्या आपने इसकी चर्चा की है? इसे लिख दिया? परीक्षण किया?

आपको "उच्चतर" के साथ एक उचित बातचीत करने की आवश्यकता है और वास्तव में उच्च उपलब्धता के लिए आवश्यकताओं की तह तक जाना है क्योंकि यह विभिन्न सेवाओं के लिए अलग है।

तो क्या वास्तव में "दर्द बिंदु" था कि उन्होंने उस सुबह महसूस किया था?

यह था?

टेलीफोन ने काम करना बंद कर दिया? काफी प्रमुख (और दृश्यमान) समस्या। और हां - इसके लिए "समाधान" की आवश्यकता होगी लेकिन उम्मीद है कि यह एक समर्थन समझौते के तहत है?
वेब साइट विफल? ठीक है - काफी हद तक दृश्यमान लेकिन अप्रत्याशित नहीं, और जब तक आपके पास एक बड़ी वेब उपस्थिति नहीं है, तब तक यह महत्वपूर्ण नहीं है। इस सर्वर को कुछ घंटों के लिए ठीक रखें।
डेटाबेस सर्वर नीचे? डरावना ... आशा है कि आपको अच्छा बैकअप मिला है! डेटा खोना नहीं तो वह व्यापार विफल हो जाएगा। लेकिन, जब तक डेटा सुरक्षित है तब तक यह एक सर्वर है जो महत्वपूर्ण है और इसमें एक रिकवरी प्लान होना चाहिए।
फ़ाइल और प्रिंट (और आंतरिक एप्लिकेशन आदि)। यह ज्यादातर लोगों के लिए PITA है क्योंकि वे एक सुबह के लिए बैठेंगे और इसे ठीक करने के लिए कुछ भी नहीं करेंगे।

मुझे लगता है कि आपने अपने मुख्य सिस्टम के लिए उच्च गुणवत्ता वाला हार्डवेयर खरीदा है? अच्छा है, 'हार्डवेयर के सस्ते होने का कारण एक झूठी अर्थव्यवस्था है क्योंकि ये सर्वर बॉक्स में सब कुछ "दोहरे" के साथ आते हैं।

मैं यह भी मानूंगा कि आप एक सर्वर के पुनर्निर्माण, प्रशंसकों को स्वैप करने, बिजली की आपूर्ति, एक सर्वर को रैक करने, दोहरे पथ नेटवर्क को अनावश्यक स्विच में कॉन्फ़िगर करने के लिए कैसे जानते हैं? आपने यह समझने के लिए पर्याप्त समय दिया है कि क्या काम करता है और क्या नहीं, क्या सामान्य है और क्या है? यदि नहीं तो सहायता और प्रशिक्षण प्राप्त करें (या कम से कम अभ्यास और अनुभव)।

शायद बहुत सारी समस्या FEAR की थी। उनके पास ऐसा कोई सुराग नहीं था कि ऐसी समस्या हो सकती है (और सर्वर उनके व्यवसाय के लिए कितने महत्वपूर्ण थे) और आपको वास्तव में पता नहीं था कि आप क्या कर रहे थे (?) एक आत्मविश्वास का मुद्दा?

आपको उपरोक्त सभी अधिकार प्राप्त करने की आवश्यकता है जो कि महंगे HA मार्ग से नीचे जा रहे हैं। क्या व्यवसाय इस महंगे उपकरण को वहन कर सकता है (और इसका अधिकांश हिस्सा, परिभाषा के अनुसार, केवल कभी विफलता में इस्तेमाल किया जाएगा और कभी इस्तेमाल नहीं किया जाएगा!)

— लड़का
स्रोत

इसे लगाने का एक अच्छा तरीका क्या है; कंपनियों के बुनियादी ढांचे में वृद्धि हुई है। कोई डिजास्टर रिकवरी प्लान नहीं है (सिवाय इसके बहुत सारे संकेत और चिल्लाते हुए) और हमारे बैकअप बहुत बुनियादी हैं। सुबह की समस्या सर्वर के साथ बिजली की समस्या थी जो हमारे अधिकांश नेटवर्क के लिए रूटिंग को संभालती है। वास्तव में, हमारे सीआरएम, ईमेल और फोन सभी 30-40 मिनट के लिए नीचे थे। कॉल सेंटर होने के नाते, उस दौरान बहुत काम नहीं किया गया था।

— मैथ्यू

1

डिजास्टर रिकवरी प्लान को बैकअप प्रक्रियाओं के साथ सर्वर पर रखा गया है ... उफ़ ... यह एक है जो दुर्घटनाग्रस्त हो गया है ...

— बार्ट सिल्वरस्ट्रिम

@ मैथ्यू - यदि आपका कॉल सेंटर और आपका नेटवर्क डाउन है तो जाहिर है कि आपका पूरा लाइन ऑफ बिजनेस रुक जाता है। इसलिए, आपको भविष्य में इसे कम करने के लिए वरिष्ठ प्रबंधन के साथ योजनाओं और परियोजनाओं की श्रृंखला में संलग्न होने की आवश्यकता है। प्रबंधन को आप फबने मत दो और बस इसे ठीक करने के लिए अपने केवल अपने काम की उम्मीद करो - पूरे कारोबार बंद! आभारी रहें आपके पास एक हल्की वेक अप कॉल थी, किसी भी महत्वपूर्ण डेटा या सर्वर (या ग्राहकों को उम्मीद से) नहीं खोना था। पहली बात ... यूपीएस पर आपका कोई सर्वर है?

— गाइ

1

इवान ने कुछ अच्छे बिंदुओं पर प्रहार किया, लेकिन यहां कुछ विशिष्ट लागत प्रभावी तरीके हैं जो विफलताओं का सामना करने के लिए उप 1 घंटे की वसूली का समय प्राप्त करते हैं।

लघु व्यवसाय की संभावना छोटे हार्डवेयर का मतलब है, इसलिए यह कुछ सरल काम करने के लिए लागत का एक बहुत कुछ नहीं हो सकता है जो वास्तव में समस्याओं का सामना करने में एक महत्वपूर्ण राशि को जोड़ते हैं। मुख्य विचार बस जाने के लिए तैयार अतिरिक्त हार्डवेयर है।

सबसे पहले, एक आभासी आईपी के विचार के साथ सहज हो जाओ। यह वह IP पता है, जिससे उपयोगकर्ता बात करेंगे, लेकिन आपके द्वारा दिए गए किसी भी सर्वर पर निवास कर सकते हैं। यह वह IP पता है जो आप उपयोगकर्ता हैं, और अनुप्रयोग आपसे बात करना चाहेंगे। और यह आपके लिए जाने वाले किसी भी समाधान के लिए सबसे उपयोगी होगा। VIP होने का मतलब है कि आपको असफल होने पर किसी भी प्रकार के अनुप्रयोगों को पुन: कॉन्फ़िगर नहीं करना चाहिए। इसके अलावा, यह भी ध्यान रखें कि निरर्थक हार्डवेयर होने से प्रशासन के ऊपरी हिस्से पर प्रभाव बढ़ता है, 1 के बजाय दो कॉन्फ़िगरेशन अपडेट करते हैं।

अगर हम आपके साथ रूटिंग / वेब प्रॉक्सी सर्वर शुरू करते हैं, तो यह शायद सबसे आसान है क्योंकि उनकी कोई वास्तविक स्थिति नहीं होगी जिसे बॉक्स पर ही संग्रहीत किया जाना चाहिए। तो बस एक ही बॉक्स का डुप्लिकेट प्राप्त करें, और इसे एक ही कॉन्फ़िगर करें। मैं दोनों को लैन सेगमेंट में प्लग-इन करता रहूंगा, और यह मानकर कि आप इंटरनेट पर एक अन्य इंटरफेस पर हैं, यदि उनकी विफलता है तो केबल स्वैप करें। रूटिंग के नजरिए से, आप अपने डिफ़ॉल्ट मार्ग के लिए .1 पते (वीआईपी) को लक्षित करने के लिए सभी लैन ग्राहकों को सेट करते हैं और प्रॉक्सी सर्वर सर्वर को .2 पता और सर्वर बी को .3 पता देते हैं। इस तरह वे दोनों को कॉन्फ़िगर अपडेट (दोनों पर लागू होता है) के लिए प्रबंधित किया जा सकता है। और आप सभी को फेलओवर करने के लिए .2 आईपी असाइनमेंट को .2 से हटा दें और इसे .3 पर ले जाएं, और इंटरनेट कनेक्शन को अन्य इंटरफ़ेस पर ले जाएं। यह बहुत जटिल नहीं है, करना और समझना आसान है, और एक दूसरे बॉक्स के अतिरिक्त हार्डवेयर का खर्च आता है। यदि आप इंटरनेट पर अतिरेक प्राप्त कर सकते हैं, तो आप कुछ जटिलता जोड़ सकते हैं, और वीआरआरपी जैसी किसी चीज़ का उपयोग करके स्वचालित विफलता प्राप्त कर सकते हैं।

बारीकियों के बिना, यह कहना मुश्किल है, लेकिन आप वेब सर्वर के रूप में सरल हो सकते हैं। आइडेंटिकल कॉन्फ़िगरेशन के साथ दूसरा सर्वर जोड़ें, दोनों के बीच एक वीआईपी बनाएं और विफलता की स्थिति में वीआईपी को बैकअप में ले जाएं। आम तौर पर मुझे कोई आपत्ति नहीं है अगर सत्र राज्य एक विफलता पर खो जाता है (यह एक विफलता का कारण बनने के लिए एक महत्वपूर्ण समस्या है)। इसलिए यदि उपयोगकर्ताओं को फिर से लॉग इन करना है, तो कोई बड़ी बात नहीं है। फिर से, वीआरआरपी का उपयोग स्वचालित विफलता के लिए किया जा सकता है।

आप DB पर जा रहे हैं, यह काफी अधिक जटिल है। अधिकांश DB के पास कुछ प्रकार के प्राथमिक / माध्यमिक मॉडल होते हैं, जहां आप मूल DB को माध्यमिक में बैकअप करते हैं, और फिर सभी लेनदेन लॉग या DB परिवर्तनों को माध्यमिक में कॉपी करते हैं। फिर, आप इसे VIP के साथ उन अनुप्रयोगों / उपयोगकर्ताओं के लिए जोड़ सकते हैं जो वास्तव में DB तक पहुंच रहे हैं। हालांकि, फेलओवर की अधिक शिकायत है। प्राथमिक की विफलता के आधार पर, आपको लेन-देन और लेन-देन लॉग को चलाने के लिए वास्तव में ड्राइव को ऊपर लाने और चलाने की आवश्यकता हो सकती है। फिर सेकेंडरी को सक्रिय करें। यदि आप कुछ खोए हुए डेटा को सहन कर सकते हैं, तो आप तुरंत द्वितीयक सक्रिय ला सकते हैं। विफलता के बाद, सर्वर बी अब आप प्राथमिक हैं, और आप काम करेंगे सर्वर ए को पुनर्स्थापित करें, और इसे नए बैकअप में बदल दें ताकि जब सर्वर बी अंततः समस्या हो, तो यह विफल हो जाए।

फ़ाइल सर्वर हमेशा सबसे कठिन हिस्सा होते हैं, क्योंकि DB के विपरीत, फ़ाइल सिस्टम की एक अंतर्निहित सुविधा प्राप्त करना बहुत कठिन होता है। हालाँकि, दूसरे सर्वर के होने से कुछ स्तर की वैमनस्यता को प्राप्त किया जा सकता है, और सरल एक स्क्रिप्ट लिखता है जो परिवर्तनों के लिए फाइल सिस्टम को स्कैन करता है, और आपके द्वारा गौण होने के लिए किसी भी नई फाइल को कॉपी करता है। आप मूल रूप से ऐसा करने के लिए एक क्रोन I बाइलिव पर rsync चला सकते हैं। फिर, आप एक वीआईपी का उपयोग करते हैं जो आप उपयोगकर्ताओं को देते हैं, कि यदि आप एक विफलता करते हैं तो आप आगे बढ़ते हैं। आप स्क्रिप्ट में हैं, मैं अत्यधिक अनुशंसा करता हूं कि आप फ़ाइलों को स्थानांतरित करने से पहले सुनिश्चित करें कि सिस्टम वीआईपी का मालिक है या नहीं। आप वास्तव में वास्तव में नहीं चाहते कि rsync गलत दिशा में निष्पादित हो और आपके द्वारा किए जा रहे किसी भी परिवर्तन को अधिलेखित कर दे। यह कुछ फ़ाइलों को खो सकता है यदि उनकी विफलता है,

मुझे नहीं पता कि आप फोन सिस्टम के बारे में क्या कर सकते हैं ... यह वास्तव में विक्रेता पर निर्भर करता है और यह कैसे सेटअप है। विक्रेता के पास समाधान के लिए शेल्फ समाधान से कुछ हो सकता है।

चेतावनी के कुछ अंतिम शब्द। सुनिश्चित करें कि आप जिस भी सेटअप के साथ जाने जा रहे हैं, उसका अच्छी तरह से परीक्षण करें। सुनिश्चित करें कि आप जानते हैं कि उस महत्वपूर्ण जानकारी को खोए बिना इसे कैसे विफल किया जाए। परीक्षण परीक्षण परीक्षण यह सुनिश्चित करने के लिए कि जब आपको इसकी आवश्यकता होगी, तो यह काम करेगा। सुनिश्चित करें कि आपके पास ऐसी प्रक्रियाएँ हैं जिनमें कॉन्फ़िगरेशन परिवर्तन, सॉफ़्टवेयर अपडेट आदि प्राथमिक और बैकअप दोनों के लिए ठीक से लागू होते हैं। अच्छी खबर यह है कि, आप संभवत: नियंत्रित विफलता का सामना कर सकते हैं जब आप किसी सर्वर को अपग्रेड करने के लिए नीचे लाना चाहते हैं, आदि। यह एक सक्रिय-सक्रिय सेटअप नहीं है, इसलिए आपको यह पता नहीं है कि द्वितीयक काम करेगा जब आपको इसकी आवश्यकता होगी।

मैं दूरसंचार में काम करता हूं, और हमारे उपकरण बहुत अधिक निरर्थक हैं, ज्यादातर मामलों में भू-ग्राफिक अतिरेक शामिल है। हमारी संख्या 1 विफलता का कारण परिवर्तनों के बाद परीक्षण नहीं किया गया है, और उपयोगकर्ता परिवर्तन कर रहे हैं जो यह नहीं जानते कि अतिरेक मॉडल कैसे काम करता है। हालाँकि, हमारे पास अतिरिक्त समस्या है कि हमारे सभी उपकरणों को कई सेकंड से अधिक समय में स्वचालित विफलता का समर्थन करने की आवश्यकता है। आप फेलओवर में मैनुअल हस्तक्षेप को सहन कर सकते हैं यदि आपको केवल 30 - 60 मिनट के भीतर उठने और चलने की आवश्यकता है। आपको बस तैयार रहने की जरूरत है। सौभाग्य।

— केविन निस्बेट
स्रोत

जब आप DNS का उपयोग कर सकते हैं तो "वर्चुअल आईपी" का उपयोग क्यों करें? बस यही बात है। यदि दी गई सेवा भिन्न IP के साथ किसी भिन्न सर्वर पर जाती है तो आप DNS में A रिकॉर्ड को मिलान के लिए अद्यतन करते हैं। अंत-उपयोगकर्ताओं को आईपी पते को जानने या याद रखने की आवश्यकता नहीं होनी चाहिए।

— कैस

इस तथ्य का लाभ उठाना भी एक अच्छा विचार है कि एक आईपी पते के कई नाम हो सकते हैं जो इस ओर इशारा करते हैं ताकि आप विशेष सेवाओं के लिए A या CNAME रिकॉर्ड स्थापित कर सकें - जैसे "ntp", "file", "www", "ftp" "," एमएक्स ", और इसी तरह। इस तरह आप मशीनों के बीच सेवाओं को स्थानांतरित कर सकते हैं (या बाद में अधिक मशीनें जोड़ सकते हैं) और बस उस सेवा के लिए डीएनएस प्रविष्टि को अपडेट करें।

— कैस

DNS एक विकल्प है जिसका उपयोग किया जा सकता है। वाहक स्थान में हम वास्तव में किसी भी महत्वपूर्ण चीज के लिए इसका उपयोग नहीं करते हैं, यह आमतौर पर जोड़ा जटिलता के लायक नहीं है। मैं असफलता को नियंत्रित करने के लिए सबसे निश्चित रूप से अभी भी VIP का उपयोग करता हूं, लेकिन आप जो भी VIP उपयोग कर रहे थे उसका DNS एड्रेस पॉइंट हो सकता है। मैत्रीपूर्ण नाम अच्छे हैं, लेकिन हाल ही में सुरक्षा कमजोरियों के साथ ... और कुल 5 सर्वरों के लिए, आपको इसकी आवश्यकता क्यों है? यदि आप DNS के साथ जाते हैं, तो सुनिश्चित करें कि आप कैश एक्सपायरी सेट करते हैं।

— केविन निस्बेट

1

सभी ने कहा कि अंक बहुत अच्छे हैं इसलिए सिर्फ टिप्पणियों के एक जोड़े।

30 मिनट की गारंटी देना असंभव है, खासकर हर चीज के लिए। आप इसे एक लक्ष्य कह सकते हैं, लेकिन कोई तरीका नहीं है कि यह एक गारंटी हो सकती है, क्योंकि हमेशा एक्स फैक्टर होता है। आपके पास 2 आईएसपी लाइनें हो सकती हैं और एक ट्रक इमारत में दुर्घटनाग्रस्त हो जाता है और उन दोनों को बाहर निकालता है, क्योंकि आपने नहीं सोचा था कि भवन के विपरीत छोरों से उन्हें रूट किया जाना एक उदाहरण है।

लागत के लिए एक शुरुआत के रूप में, सब कुछ डबल। आपके पास 5 सर्वर हैं, इसलिए आपको दोगुना करने की आवश्यकता है। यह सभी हार्डवेयर पर होने की आवश्यकता नहीं है, आप वर्चुअलाइज कर सकते हैं, लेकिन आप देखते हैं कि मेरा क्या मतलब है। उसके ऊपर, सब कुछ हा जागरूक होना चाहिए जो लागत में भी जोड़ देगा, आपको पता चल सकता है कि आपको अपने राउटर को एक नए के साथ बदलना होगा और ओह आपको उनमें से 2 की आवश्यकता है। पावर फीड को दोगुना करने और जनरेटर प्राप्त करने के लिए मत भूलना, क्योंकि आप गारंटी नहीं दे सकते कि बिजली कंपनी 30 मिनट के भीतर वापस आ जाएगी।

ये उदाहरण अपने कमोबेश एक हॉट स्टैंडबाय सेटअप के बारे में सोच रहे हैं, जो मुझे लगता है कि आपके बॉस की सोच है।

छोटे व्यवसाय के लिए मुझे जो बेहतर लगता है वह है सब कुछ ठीक करने और वर्गीकृत करने की योजना तैयार करना।

जानें कि कौन सी सेवाएं हैं

महत्वपूर्ण (व्यवसाय रुक जाता है)

महत्वपूर्ण (व्यापार धीमा)

दिनचर्या (व्यवसाय कुछ समय के लिए इसके बिना कर सकते हैं)।

उदाहरण के लिए, आपका कॉल सेंटर फ़ोन क्रमागत है, इसलिए हो सकता है कि एक दूसरा सर्वर खरीदने के लायक हो और दूसरा आईएसपी और आपका औसत पॉवर आउटेज लगभग 15 मिनट का हो, इसलिए हमें एक यूपीएस मिलेगा जो 60 मिनट तक चलेगा (नहीं या तो कार्यस्थानों को भूल जाओ)। अब कहते हैं कि ईआरपी केवल महत्वपूर्ण है, जिसका अर्थ है कि आपका इसके बिना थोड़ा सा काम कर सकता है। हो सकता है कि आपके कॉल सेंटर के लोग इसका उपयोग करें, लेकिन अगर यह नीचे है, तो वे पेन और पेपर या नोटपैड पर वापस लौट सकते हैं और उसके बाद ईआरपी अपडेट कर सकते हैं। यह करने की प्रक्रिया कि अगर यह नीचे है तो सस्ता हो सकता है फिर इसे एक महत्वपूर्ण सेवा बनाने की कोशिश कर रहा है। और दिनचर्या कुछ प्रिंटर की तरह हो सकती है, ठीक है इसका दर्द लेकिन हम कुछ दिनों के लिए बना सकते हैं यदि वे सभी नीचे जाते हैं।

यह भी आपको सामान को ठीक करने का आदेश देता है यदि s ** t वास्तव में एक दिन प्रशंसक को मारता है :)

— SpaceManSpiff
स्रोत

1

क्या यह संभव है? ज़रूर। क्या यह सस्ती है? शायद "छोटे व्यवसाय" के लिए नहीं, खासकर यदि आपके पास एक बॉस है जो आपको मनमानी संख्या दे रहा है जिसके द्वारा काम करना है, और वह एक आईटी विभाग से उच्च उपलब्धता की मांग कर रहा है जिसमें एक डिप्यूटाइज्ड प्रोग्रामर शामिल है (इसे कई बार अन्य स्थानों पर देखा जाता है और यह कभी नहीं होता है आपके तनाव के स्तर के लिए बहुत सुंदर है, अगर आपकी स्थिति उनकी तरह थी)।

विफलता संभव है, लेकिन आम तौर पर अनावश्यक हार्डवेयर की आवश्यकता होती है, सर्वरों के बीच डेटा साझा करने के लिए सैंस, आदि ... दूसरे शब्दों में, सौभाग्य से इसे वित्त पोषित किया जा रहा है अगर वे इसकी देखभाल के लिए एक समर्पित व्यवस्थापक को किराए पर नहीं लेंगे।

आपके द्वारा उल्लिखित आपका कॉल सिस्टम हार्डवेयर विशेष हार्डवेयर है, और आपने कॉलसेंटर होने के लिए कहा। आपको उस बेमानी बनाने के विकल्पों के बारे में विक्रेता से बात करनी चाहिए। इस के साथ नासमझ पहली जगह में समर्थन शून्य कर सकता है।

अन्य प्रणालियाँ, जिन्हें आप VMWare- प्रकार के समाधानों (या हाइपर- V या XenServer) में निवेश करके कुछ अतिरेक प्राप्त कर सकते हैं, लेकिन मैं पहले VMware और XenServer को देखूंगा। तब आप एक सैन को देख सकते हैं, एक फास्ट नेटवर्क स्विच के साथ दो बीफ सर्वर, और हार्डवेयर सर्वर के बीच वर्चुअलाइज्ड सर्वर को माइग्रेट करने के लिए LiveMotion का उपयोग करते हैं, यदि विफलता है, साथ ही सर्वर के बीच लोड में से कुछ को संतुलित करने की जरूरत है।

आपने उल्लेख किया है कि आप उन सिस्टमों पर लिनक्स चला रहे हैं। कई सर्वर प्राप्त करने के लिए पैसे के साथ, आप एक धड़कन कार्यक्रम के साथ DRBD स्थापित करने के बजाय देख सकते हैं और सर्वर के बीच डेटा को दोहराने के लिए STONITH और जब कोई अनुपलब्ध हो जाए, तो उसे संभाल सकता है; आप एक ऐसी प्रणाली स्थापित करने की ओर देख रहे हैं, जहाँ आपने प्रत्येक सर्वर को डुप्लिकेट किया हो, साथ ही सर्वर रूम (यदि आपके पास सर्वर रूम है) में अपनी बिजली की खपत और गर्मी अपव्यय को दोगुना कर दिया है। यह हार्डवेयर की लागत और आपकी पवित्रता के लिए किया जा सकता है। इसके अलावा आपको इसका परीक्षण करना होगा, इसे कॉन्फ़िगर करते समय आपके पास डाउनटाइम होगा, और आपके पास अभी भी संभावना है कि यह कई बार काम नहीं करेगा क्योंकि अभी भी मुद्दों की संभावना है जिस पर ध्यान देना है (विभाजन मस्तिष्क, उदाहरण के लिए)।

अंतिम एक सिस्टम है जिसमें खाली स्लेट सिस्टम के रूप में कार्य करने के लिए कुछ सिस्टम है और यदि सर्वर की मृत्यु हो जाती है तो आपको डेटा को "रिक्त" सिस्टम में से एक में पुनर्स्थापित करने की अनुमति देने के लिए एक बहुत अच्छी बैकअप योजना है। हार्डवेयर ऑनसाइट होने से आपको कुछ विकल्प मिलेंगे यदि / जब कोई सर्वर मर जाता है; लेकिन डेटा को पुनर्स्थापित करते समय आपके पास कुछ डाउनटाइम होगा, और आपको नए सर्वर पर अपने एप्लिकेशन को ठीक से स्थापित करने के तरीके पर निर्देश की आवश्यकता होगी। आप कितनी तेजी से काम करते हैं और कितना बड़ा डेटा है, इस पर निर्भर करता है कि आपके पास कुछ घंटे से लेकर एक या दो दिन तक का समय हो सकता है। आपके पास अपने सर्वर के लिए एक कार्यशील, ज्ञात-अच्छा बैकअप है, जगह में एक वसूली योजना के साथ, हाँ?

क्या आपको इसका प्रयास करना चाहिए? मेरी पहली प्रतिक्रिया यह है कि यदि आप किसी भी सुझाव पर अपना सिर खुजला रहे हैं या अपने पेट में गड्ढे महसूस कर रहे हैं, तो इस सामान को सोचने की कोशिश करें, तो आपको ऐसा नहीं करना चाहिए। आपको इस मुद्दे पर आने और लागत को देखने और इसे लागू करने के लिए एक परामर्श कंपनी की आवश्यकता होगी, या आपको अपनी कंपनी के लिए ऐसा करने के लिए एक समर्पित sysadmin को किराए पर लेना होगा।

तथ्य यह है कि वे आपको ऐसा करने के लिए कह रहे हैं और आप कह रहे हैं "आप सिर्फ एक प्रोग्रामर हैं जो" पदोन्नत "हुए थे और आपके पास PHB है जो आपको 30 मिनट की अधिकतम विफलता समय के साथ अतिरेक देने के लिए कह रहा है कि आप दयालु हैं एक बकवास के ऊपर।

— बार्ट सिल्वरस्ट्रिम
स्रोत