वेब एप्लिकेशन के लिए 100% अपटाइम


312

हमें आज एक ग्राहक से एक दिलचस्प "आवश्यकता" प्राप्त हुई।

वे वेब एप्लिकेशन पर ऑफ-साइट फेलओवर के साथ 100% अपटाइम चाहते हैं । हमारे वेब एप्लिकेशन के दृष्टिकोण से, यह कोई समस्या नहीं है। इसे कई डेटाबेस सर्वरों आदि में विभाजित करने में सक्षम होने के लिए डिज़ाइन किया गया था।

हालाँकि, नेटवर्किंग समस्या से मैं यह पता नहीं लगा सकता कि इसे कैसे काम किया जाए।

संक्षेप में, एप्लिकेशन क्लाइंट के नेटवर्क के भीतर सर्वर पर लाइव होगा। इसे आंतरिक और बाहरी दोनों लोगों द्वारा एक्सेस किया जाता है। वे चाहते हैं कि हम सिस्टम की एक ऑफ-साइट कॉपी बनाए रखें, ताकि उनके परिसर में एक गंभीर विफलता की स्थिति में तुरंत उठा और ले जा सके।

अब हम जानते हैं कि आंतरिक लोगों (वाहक कबूतर?) के लिए इसे हल करने का कोई तरीका नहीं है, लेकिन वे चाहते हैं कि बाहरी उपयोगकर्ता भी ध्यान न दें।

बहुत स्पष्ट रूप से, मैं यह कैसे संभव हो सकता है की धूमिल विचार नहीं है। ऐसा लगता है कि यदि वे इंटरनेट कनेक्टिविटी खो देते हैं तो हमें बाहरी मशीनों को आगे बढ़ाने के लिए DNS परिवर्तन करना होगा ... जो निश्चित रूप से समय लेता है।

विचार?

अपडेट करें

मैंने आज क्लाइंट के साथ चर्चा की और उन्होंने इस मुद्दे पर स्पष्टीकरण दिया।

वे यह कहते हुए 100% नंबर से अटक गए कि बाढ़ की स्थिति में भी आवेदन सक्रिय रहना चाहिए। हालाँकि, यह आवश्यकता तभी होती है जब हम इसे उनके लिए होस्ट करते हैं। उन्होंने कहा कि यदि एप्लिकेशन पूरी तरह से उनके सर्वर पर रहता है तो वे अपटाइम आवश्यकता को संभाल लेंगे। आप मेरी प्रतिक्रिया का अनुमान लगा सकते हैं।


49
हैकिंग की वजह से भारी गिरावट को कम मत समझो, सोनी और प्लेस्टेशन नेटवर्क को देखो। आप गारंटी दे सकते हैं कि उनके पास समान% 100 अपटाइम विचार और इसे वापस करने के लिए पैसा / हार्डवेयर है। ग्राहक के साथ स्पष्ट करें कि 100% अपटाइम एक अक्षम्य अपेक्षा है, यहां तक ​​कि Google टेक "100% अपटाइम" को म्यूट करने में संकोच करेंगे। एक संकेत btw गतिशील डीएनएस का उपयोग करने पर ध्यान देना है, वे केवल 60 सेकंड के लिए कैश करते हैं, इसमें ओएस और स्थानीय डीएनएस सर्वर शामिल होना चाहिए।
सिल्वरफायर

182
मैं व्यक्तिगत रूप से इस क्लाइंट से जितना संभव हो उतना तेजी से दौड़ सकता हूं । मुझे संदेह है कि यह अंतिम पागल विचार नहीं होगा जो उनके पास (एक प्रौद्योगिकी दृष्टिकोण से) हो सकता है।
ग्रेग सिप

137
काश मैं आपके ग्राहक को नीचा दिखा सकता।
जोकेवेटी

81
यदि आप 100% अपटाइम का पता लगाते हैं तो मुझे बताएं। मैं इसके साथ एक व्यवसाय बनाऊंगा और इसे Google को बेचूंगा। 100% गारंटी देना असंभव है। यहां तक ​​कि Microsoft, amazon या google जैसी कंपनियाँ भी उतनी ऊँची नहीं जायेंगी क्योंकि उन्हें पता है कि यह असंभव है। सबसे अच्छा मैंने देखा है 99.999% और यहां तक ​​कि एक खिंचाव (एक वर्ष में 5 मिनट) है। सबसे अच्छा आप शायद कर सकते हैं 99.99% मज़बूती से।
मैट

39
बस एक पागल उच्च मूल्य टैग बनाने के लिए उनके पागल अनुरोध पर डाल दिया। जो शायद उन्हें वापस उनके होश में ला देगा। या तो, या यह उन्हें किसी को झूठ बोलने के लिए तैयार तलाश कर भेजेगा।
नैट सीके

जवाबों:


368

यहाँ विकिपीडिया के नौसिखियों की खोज का आसान चार्ट है:

यहां छवि विवरण दर्ज करें

दिलचस्प बात यह है कि शीर्ष 20 वेबसाइटों में से केवल 3 2007 में पौराणिक 5 नाइन या 99.999% अपटाइम हासिल करने में सक्षम थे। वे याहू, एओएल और कॉमकास्ट थे। 2008 के पहले 4 महीनों में, कुछ सबसे लोकप्रिय सोशल नेटवर्क भी इसके करीब नहीं आए।

चार्ट से, यह स्पष्ट होना चाहिए कि 100% अपटाइम का पीछा कितना हास्यास्पद है ...


62
P दूसरा भी हर सेकंड चेक नहीं कर रहा है। उसके शीर्ष पर, जिन लोगों ने पाँच निन्यानवे की संभावना को पूरा किया था, उनमें अभी भी स्थानीय व्यवधान थे जिनका पता नहीं हो सकता था, या ग्लिच जो कुछ सेवाओं को अनुपलब्ध बना रहे थे, जो अभी भी पिंग का जवाब दे रहे थे।
ceejayoz

8
जो खुद में और पाँच नाइनों को संदिग्ध बनाता है ...
ग्रेग सिप

5
यकीनन। और उन्हें काम करने के लिए $ अरबों मिले हैं!
सइयोजोज

43
क्षमा करें कि चैट चल रही है, लेकिन ओपी का सवाल यह था कि तकनीकी स्तर पर 100% अपटाइम के लक्ष्य की दिशा में प्रयास कैसे किया जाए, वैचारिक रूप से नहीं, मुझे यकीन है कि वह जानते हैं कि यह हमेशा प्राकृतिक घटनाओं के कारण संभव नहीं होता है जो हार्डवेयर के साथ होते हैं और पर्यावरण। क्या हम उसके साथ मदद कर सकते थे?
डेविड डी सी ई फ्रीटास

5
ओपी को: मैंने एसएलए को देखा है जो "सामान्य रखरखाव के बाहर" के संदर्भ में अपटाइम की गारंटी देता है। अद्यतन, पैच, आदि के लिए प्रति माह डाउनटाइम का सामान्य रखरखाव, जो आमतौर पर महीने के कम से कम व्यस्त समय (आमतौर पर रात के मध्य में) के दौरान महीने के कम से कम व्यस्त दिन पर होता है। उनके पास व्यापार के संबंध में अपने व्यवसाय के लिए कुछ प्रकार के मैट्रिक्स होने चाहिए। आप केवल उन समय के दौरान उनके लिए बेहतर अपटाइम (4 नौ) पेश कर सकते हैं ।
ग्रेग सेप

186

उन्हें 100% परिभाषित करने के लिए कहें और यह किस समय अवधि में मापा जाएगा। वे शायद 100% के करीब का मतलब के रूप में वे बर्दाश्त कर सकते हैं। उन्हें खर्चा दीजिए।

समझाने के लिए। मैं पिछले कुछ वर्षों में ग्राहकों के साथ विचार-विमर्श कर रहा हूं, जो कि स्पष्ट रूप से आकर्षक आवश्यकताओं के साथ है। सभी मामलों में वे वास्तव में पर्याप्त सटीक भाषा का उपयोग नहीं कर रहे थे।

बहुत बार वे ऐसी चीजों को फ्रेम करते हैं जो निरपेक्ष दिखाई देती हैं - जैसे कि 100% लेकिन गहरी जांच पर वास्तविक रूप से वे उचित / लाभ विश्लेषण करने के लिए पर्याप्त हैं जो कि लागत शमन डेटा के लिए लागत के साथ प्रस्तुत किए जाने पर आवश्यक हैं। यह पूछना कि वे उपलब्धता को कैसे मापेंगे, एक महत्वपूर्ण प्रश्न है। यदि वे यह नहीं जानते हैं तो आप उन्हें सुझाव देने की स्थिति में हैं कि पहले इसे परिभाषित करने की आवश्यकता है।

मैं ग्राहक से यह परिभाषित करने के लिए कहूंगा कि व्यावसायिक प्रभाव / लागतों के संदर्भ में क्या होगा यदि साइट निम्नलिखित परिस्थितियों में नीचे गई:

  • एक्स घंटे के लिए उनके व्यस्ततम घंटों में
  • एक्स घंटे के लिए उनके कम से कम व्यस्त घंटों में

और यह भी कि वे इसे कैसे मापेंगे।

इस तरह आप '100%' के सही स्तर को निर्धारित करने के लिए उनके साथ काम कर सकते हैं। मुझे इस प्रकार के प्रश्न पूछने से संदेह है कि वे अपनी अन्य आवश्यकताओं की प्राथमिकताओं को बेहतर ढंग से निर्धारित कर पाएंगे। उदाहरण के लिए वे SLA के कुछ स्तरों का भुगतान करना चाहते हैं और इसे प्राप्त करने के लिए अन्य कार्यक्षमता से समझौता कर सकते हैं।


21
माना। वे सिर्फ एक बहुत ठोस विफलता की रणनीति के साथ "बहुत उच्च" अपटाइम (ऊपरी 90 के दशक?) का मतलब हो सकता है। यदि नहीं, तो शामिल लागत पैमाने की एक व्याख्या उम्मीद है कि उन्हें मनाने ...
मार्टिन डॉव

32
+1 निष्कर्ष पर नहीं कूदने के लिए, और इसके बजाय केवल ग्राहक को यह बताने के लिए कहें कि उनके पास क्या है।
sleske

4
मैं "निष्कर्ष पर नहीं कूद रहा हूं" कथन को प्रतिध्वनित करता हूं ... यदि ग्राहक का मतलब 100% अपटाइम (माइनस शेड्यूल्ड रखरखाव) है, तो यह एक उचित आवश्यकता से अधिक हो सकता है।
टिम रेड्डी

1
व्यावसायिक प्रभाव के बारे में, हम वास्तव में उनके व्यवसाय को पूरी तरह से जानते हैं और समझते हैं और नीचे जाने वाली साइट के लिए शामिल लागत वित्तीय नहीं है। पिचफोर्क, संभावित हैंगिंग, आदि के साथ दिखाने वाले मूल निवासी की रेखाओं के साथ और अधिक;) बस 40,000 लोगों को आपके सामने के दरवाजे पर चिल्लाते हुए दिखाते हैं। यही वे एक जुनून के साथ बचना चाहते हैं।
NotMe

7
@ChrisLively सभी और अधिक जोखिम की परिपक्व समझ है। सुरक्षा इंजीनियरिंग के लिए प्रमुख प्रतिमान संभाव्य जोखिम मूल्यांकन है । ऐसी प्रणालियां हैं जो हजारों लोगों को मार सकती हैं (न केवल नाराज) और उनके पास अभी भी एक कम है, उम्मीद है कि अच्छी तरह से समझ में आता है, लेकिन असफलता की गैर-शून्य संभावना।
पूली

140

आपके ग्राहक पागल हैं। 100% अपटाइम असंभव है चाहे आप उस पर कितना पैसा खर्च करें। सादा और सरल - असंभव। Google, अमेज़ॅन आदि को देखें, उनके पास अपने बुनियादी ढांचे को फेंकने के लिए लगभग अंतहीन धन है और फिर भी वे डाउनटाइम का प्रबंधन करते हैं। आपको उन्हें वह संदेश देने की आवश्यकता है, और यदि वे आग्रह करना जारी रखते हैं कि वे उचित मांगों की पेशकश करते हैं। अगर वे नहीं पहचानते हैं कि डाउनटाइम की कुछ राशि अपरिहार्य है, तो उन्हें खाई है।

उन्होंने कहा, आपको लगता है कि मैकेनिकली स्केलिंग / डिस्ट्रीब्यूशन खुद ही किया जाता है। नेटवर्किंग हिस्से में विभिन्न ISP के लिए अनावश्यक अपलिंक शामिल करने की आवश्यकता होगी, ASN और IP आवंटन प्राप्त करना, और BGP और वास्तविक रूटिंग गियर में गर्दन को गहरा करना ताकि IP पता स्थान ISPs के बीच स्थानांतरित हो सके यदि आवश्यकता हो।

यह, जाहिर है, एक बहुत ही कठिन जवाब है। आपके पास अपटाइम की इस डिग्री की आवश्यकता वाले अनुप्रयोगों के साथ अनुभव नहीं है, इसलिए यदि आप कहीं भी पौराणिक 100% अपटाइम के करीब जाना चाहते हैं, तो आपको वास्तव में एक पेशेवर को शामिल करने की आवश्यकता है।


7
माना। पूरी तरह से। पागल।
jdw

2
वे करने के लिए इस्तेमाल किया ??
सिरेक्स

2
@ साइरेक्स हाल के प्रयोग का हवाला देते हुए @ सर्न जहां न्यूट्रिनो को प्रकाश की तुलना में तेजी से यात्रा करते पाया गया है। परिणामों की पुष्टि अभी तक स्वतंत्र वैज्ञानिकों ने नहीं की है।
TC1

9
@ TC1 मैं आपको $ 200 का दांव लगाऊंगा जो कड़ाही नहीं करता है।
dpatchery

4
@ एरिक 100% अपटाइम के लिए एक अनुरोध सिस्टम की तकनीकी विशेषताओं की अज्ञानता का संकेत है। यह ठीक है, क्योंकि ग्राहक का काम वे जो कुछ भी कर रहे हैं। आपका काम इंजीनियर आईटी सिस्टम का है। इस तरह के मुश्किल ग्राहक बुरे सपने हो सकते हैं, लेकिन वे आपके सबसे अच्छे ग्राहक भी बन सकते हैं।
duffbeer703

54

खैर, यह निश्चित रूप से एक दिलचस्प है। मुझे यकीन नहीं है कि मैं खुद को 100% अपटाइम के लिए अनुबंधित करना चाहता हूं, लेकिन अगर मुझे लगता है कि ऐसा लगता है तो यह होगा:

पूरी तरह से नेटवर्क से बाहर एक लोड बैलेंसर पर सार्वजनिक आईपी के साथ शुरू करें और उनमें से कम से कम दो का निर्माण करें ताकि एक दूसरे पर विफल हो सके। हीटबियर जैसा कार्यक्रम उन लोगों की स्वचालित विफलता के साथ मदद कर सकता है।

वार्निश को मुख्य रूप से कैशिंग समाधान के रूप में जाना जाता है लेकिन यह कुछ बहुत ही अच्छे लोड संतुलन के रूप में भी काम करता है। शायद यह लोड संतुलन को संभालने के लिए एक अच्छा विकल्प होगा। इसे 1 से n बैकेंड के लिए वैकल्पिक रूप से निर्देशकों में समूहीकृत करने के लिए सेट किया जा सकता है जो कि रैंडमली या राउंड-रॉबिन को बैलेंस लोड करेगा। वार्निश को हर बैक एंड के स्वास्थ्य की जांच करने के लिए पर्याप्त स्मार्ट बनाया जा सकता है और अस्वास्थ्यकर वापस छोरों को लूप से बाहर निकाला जाता है जब तक कि यह ऑनलाइन वापस नहीं आता है। बैकएंड का एक ही नेटवर्क पर होना जरूरी नहीं है।

मुझे इन दिनों अमेज़न EC2 में इलास्टिक आईपी के साथ प्यार है, इसलिए मैं शायद EC2 में अलग-अलग क्षेत्रों में या एक ही क्षेत्र में कम से कम अलग-अलग उपलब्धता वाले क्षेत्रों में अपने लोड बैलेंसरों का निर्माण करूँगा। यदि आपको मैन्युअल रूप से (भगवान न करे) एक नया लोड बैलेंसर कताई करने का विकल्प मिलेगा, अगर आपको मौजूदा ए रिकॉर्ड आईपी को नए बॉक्स में ले जाना और स्थानांतरित करना था।

वार्निश एसएसएल को समाप्त नहीं कर सकता है, हालांकि, अगर यह एक चिंता है तो आप इसके बजाय नग्नेक्स जैसे कुछ को देखना चाहते हैं।

आप अपने क्लाइंट नेटवर्क में अपने अधिकांश बैकएंड और उनके नेटवर्क के बाहर एक या अधिक कर सकते हैं। मुझे विश्वास है, लेकिन मैं 100% निश्चित नहीं हूं, कि आप बैकएंड को प्राथमिकता दे सकते हैं ताकि आपके क्लाइंट मशीनों को प्राथमिकता मिले जब तक कि यह सभी अस्वस्थ नहीं हो जाते।

अगर मैं यह काम करता और जहाँ मैं साथ जाता, निस्संदेह इसे निखारता, तो मैं यहीं से शुरू होता।

हालाँकि, जैसा कि @ErikA बताता है, यह इंटरनेट है और हमेशा नेटवर्क के कुछ हिस्से होते हैं जो आपके नियंत्रण से बाहर होते हैं। आप यह सुनिश्चित करना चाहेंगे कि आपका कानूनी केवल उन चीज़ों के साथ संबंध बनाए जो आपके नियंत्रण में हैं।


2
थोड़ी देर के लिए मैं अमेज़न और एमएस के बारे में एक क्लाउड परिनियोजन के बारे में सोच रहा था, लेकिन पिछले कुछ महीनों में इन दोनों को प्रमुख नुकसान हुआ है। एसएसएल क्रिटिकल है।
1

3
यदि आप अमेज़न का उपयोग करने जा रहे हैं, तो आप निश्चित रूप से अपनी मशीनों को 5 उपलब्धता क्षेत्रों के आसपास फैलाना चाहेंगे। यह बहुत संभावना नहीं है कि उनके सभी क्षेत्र एक ही समय में बाहर हो जाएंगे।
jdw

11
ओपी के मुख्य प्रश्न को संबोधित करने के लिए वास्तव में +1।
फिल

आपके पास हमेशा विफलता का एक बिंदु होगा, jdw, जब तक कि श्रृंखला में एक गैर-वितरित चीज नहीं है (आपके मामले में दिल की धड़कन, जब तक कि आपके पास दूरस्थ मशीनों पर चलने के कई उदाहरण हैं, सभी एक-दूसरे की निगरानी करने के साथ-साथ आपके सर्वर, जो उनमें से कोई भी रूटिंग के साथ नेटवर्क की परेशानी के कारण देख सकता है या नहीं देख सकता है)। जो हमें "डाउनटाइम" में लाता है। सर्वर अप और रनिंग हो सकता है और फिर भी क्लाइंट के लिए अनुपलब्ध हो सकता है बिना दिल की धड़कन के कभी भी इसका पता नहीं लगा सकता है यदि विफलता रूटिंग मार्ग में नहीं है।
9

माना। जैसा कि हर किसी ने बताया है, 100% अपटाइम जैसी कोई चीज नहीं है। आप सभी कोशिश कर सकते हैं और मैंने जो वर्णन किया है वह यह है कि मैं कैसे प्रयास करना शुरू करूंगा।
jdw

30

कोई समस्या नहीं - थोड़ा संशोधित अनुबंध शब्द हालांकि:

... 100% तक की गारंटी (शून्य दशमलव स्थानों तक)।


2
+1 नोट करने के लिए, कि 100% 100,0% या 100,000% आदि नहीं है। दशमलव अंक मायने रखते हैं, वे सटीक संकेत देते हैं;)
डेन्यूबियन नाविक

4
कुछ सम्मेलनों के अनुसार, "100%" में केवल एक महत्वपूर्ण आकृति होती है, जैसे कि एक-आध के बीच की सभी संख्याएँ और "100%" के लिए गोल होती हैं; 50% 100% के लिए गोल होगा।
थॉमस लेविन

1
गिनती के लिए मानक के आधार पर कुछ कहेंगे कि 50% में दो meeningfull नंबर हैं, जहाँ 100% में तीन meeningful नंबर हैं। 50,5 और 100 उतने ही सटीक हैं। दशमलव अंक के बाद अन्य अंक की गणना करेंगे। तब 50,5 और 100,4 एकदम सटीक होंगे। अगर और कुछ नहीं कहा गया तो मैं मानूंगा कि 100% 99,5% और ऊपर है। 100,0% 99.95% और ऊपर आदि है
टिल्बेक

26

अगर फेसबुक और अमेज़ॅन ऐसा नहीं कर सकते, तो आप नहीं कर सकते। यह इतना सरल है।


17
वह अपने सभी लोगों के साथ होशियार हो सकता है, जो जानता है: पी
मैट

3
100% अपटाइम का शाब्दिक लोगों के लिए होना जरूरी नहीं है - इसका मतलब है: उस समय के दौरान उपलब्ध 100% जो इसकी आवश्यकता है। उदाहरण के लिए, बैंक सिस्टम हमेशा उपलब्ध होना चाहिए, और वे काफी अच्छा करते हैं। सिर्फ इसलिए कि वे एक वर्ष में 1 सेकंड के लिए रखरखाव के लिए नीचे जाते हैं इसका मतलब यह नहीं है कि वे अपने 100% अपटाइम लक्ष्य पर विफल रहे हैं।
डेविड डी सी ई फ्रीटास

13
@DavidFreitas - मुझे लगता है कि कॉन्ट्रैक्ट्स में यह आम तौर पर बहुत शाब्दिक है ...
UpTheCreek

2
@Matt सिर्फ इसलिए कि फेसबुक / अमेज़ॅन ऐसा नहीं कर सकते इसका मतलब यह नहीं है कि एक छोटी साइट ऐसा नहीं कर सकती। बहुत सी बड़ी वेबसाइट्स को एक छोटी साइट की तुलना में बहुत कठिन समस्याओं का सामना करना पड़ता है।
ज़ोरलेव

1
इसलिए आप जो कह रहे हैं वह यह है कि आपके पास 100% अपटाइम नहीं था क्योंकि आपके पास कुछ क्लाइंट थे जिनमें त्रुटियां थीं .. प्लस डीएनएस एक त्वरित स्विच नहीं है क्योंकि आपके पास आईएसपी है जो छोटे टीटीएल को अनदेखा करता है
माइक

25

हैकर न्यूज से ओकोनोर के उत्तर को जोड़ने के लिए

मुझे समझ नहीं आ रहा है कि मुद्दा क्या है। ग्राहक चाहता है कि आप आपदा की योजना बनाएं, और वे गणित उन्मुख नहीं हैं, इसलिए 100% संभावना के लिए पूछना उचित लगता है। इंजीनियर, इंजीनियर के रूप में करने के लिए प्रवण हैं, अपने पहले दिन की संभावना और स्टेट 101 को याद किया, बिना यह विचार किए कि क्लाइंट नहीं हो सकता है। जब वे ऐसा कहते हैं, तो वे परमाणु सर्दियों के बारे में नहीं सोच रहे हैं, वे फ्रेड के बारे में सोच रहे हैं कि वह कार्यालय सर्वर पर अपनी कॉफी डंप कर रहा है, एक डिस्क दुर्घटनाग्रस्त हो रही है, या एक आईएसपी नीचे जा रहा है। इसके अलावा, आप इसे पूरा कर सकते हैं। भौगोलिक रूप से अलग, स्वतंत्र, स्वयं निगरानी सर्वर के साथ, आपके पास मूल रूप से कोई डाउनटाइम नहीं होगा। 3 सर्वर एक स्वतंत्र (1) तीन 9 विश्वसनीयता पर काम कर रहे हैं, अच्छे फेलओवर मोड के साथ, आपका अपेक्षित डाउनटाइम एक दूसरे प्रति वर्ष (2) के तहत है। भले ही यह सब एक साथ हो, आप अभी भी वेब कनेक्शन के लिए एक उचित SLA के भीतर हैं, और इसलिए डाउनटाइम व्यावहारिक रूप से मौजूद नहीं है। क्लाइंट को अभी भी प्रलय के दिन के परिदृश्य से निपटना है, लेकिन गॉडजिला को बाहर रखा गया है, उसके पास एक सेवा होगी जो "हमेशा" है।

(1) एलए में एक सर्वर बोस्टन में सर्वर से काफी स्वतंत्र है, लेकिन हां, मैं समझता हूं कि परमाणु युद्ध से जुड़े कुछ चौराहे हैं, चीनी हैकर्स पावर ग्रिड को दुर्घटनाग्रस्त करते हैं, आदि मुझे नहीं लगता कि आपके ग्राहक इससे परेशान होंगे। इस।

(2) DNS फेलओवर कुछ सेकंड जोड़ सकते हैं। आप अभी भी एक ऐसे परिदृश्य में हैं जहाँ ग्राहक को एक वर्ष में एक बार अनुरोध वापस लेना पड़ता है, जो कि, फिर से, एक उचित SLA के भीतर, और आमतौर पर एक ही नस में "डाउनटाइम" के रूप में नहीं माना जाता है। एक ऐसे अनुप्रयोग के साथ जो विफलता पर उपलब्ध नोड के लिए स्वचालित रूप से फिर से जुड़ता है, यह ध्यान देने योग्य नहीं हो सकता है।


6
समस्या यह है कि वे इसे अनुबंध-ए में कह रहे हैं। मतलब कि अगर कोई आपदा आती है और आपको साइट को वापस लेने के लिए दस से अधिक सेकंड की आवश्यकता होती है तो बैकअप के माध्यम से वे मुकदमा करने के लिए खड़े होंगे।
शादुर

@ बहादुर: यदि वे वास्तव में चाहते हैं, तो आपको वास्तव में उन्हें चार्ज करना चाहिए । भौगोलिक रूप से दूर-दूर तक सर्वरों को फैलाएं, उम्मीद है कि हर जगह आपदा नहीं होगी।
जंगल हंटर

3
मैंने एक साइट देखी है जो 100% अपटाइम गारंटी या आपके पैसे वापस की पेशकश करती है। चाल थी कि उन्हें एक नाव लोड किया गया था और महीनों में विभाजित किया गया था। तो कुछ महीने अवैतनिक हो जाते हैं और आप अपने आस-पास सब कुछ निर्धारित करते हैं, और उन महीनों के नुकसान को कवर करते हैं जो ठीक से काम करते हैं।
jldugger

17

आपसे कुछ असंभव के लिए कहा जा रहा है।

यहां अन्य उत्तरों की समीक्षा करें, अपने ग्राहक के साथ बैठें, और यह बताएं कि यह असंभव क्यों है, और उनकी प्रतिक्रिया का अनुमान लगाएं।

यदि वे अभी भी 100% अपटाइम पर जोर देते हैं, तो विनम्रता से उन्हें सूचित करें कि यह नहीं किया जा सकता है और अनुबंध को अस्वीकार कर सकता है। आप कभी भी उनकी मांग को पूरा नहीं करेंगे, और यदि अनुबंध पूरी तरह से चूसना नहीं है, तो आप दंड के साथ तिरछा हो जाएंगे।


2
100% को परिभाषित करने की आवश्यकता है, अर्थात रखरखाव या उन्नयन करते समय 100% उपलब्ध है और यह समय अधिकतम कुछ महीनों के लिए शांत घंटों तक सीमित रहेगा। यह सब इस बात पर निर्भर करता है कि इस मामले में वेब ऐप का उद्देश्य और उपयोग क्या है ...
डेविड डी सी ई फ्रीटास

1
और "डाउनटाइम" को परिभाषित करें। सिद्धांत रूप में भी गारंटी नहीं दे सकते हैं कि वे फेयरबैंक्स में अपने कार्यालयों से ओमाहा में एक सर्वर तक पहुंचने में सक्षम होंगे जब तक कि आप बीच में पूरे नेटवर्क को नियंत्रित नहीं करते हैं (हालांकि आप सर्वर के ऊपर होने और चलने के बारे में आश्वासन दे सकते हैं)।
जॉइंटिंग

परिभाषाएँ, IMHO, अप्रासंगिक हैं यदि वे "100% अपटाइम" के लिए पूछते हैं: भले ही आप अनुसूचित रखरखाव पर बातचीत करते हैं और एन + एन अतिरेक में निर्माण करते हैं यदि एक मामूली गड़बड़ एक अनिर्धारित रिबूट या सर्विस ब्लिंक का कारण बनता है जिसे आपने अपने एसएलए को उड़ा दिया है। निश्चित रूप से प्रासंगिक आप एक 3, 4 या 5 नौ SLA बातचीत कर रहे हैं, हालांकि।
voretaq7

हालांकि SLA की शर्तों पर निर्भर करता है, है ना? यदि आपको प्रति माह $ 100K का भुगतान किया जाता है और डाउनटाइम के प्रत्येक मिनट में $ 1K का जुर्माना लगता है, तो यह पूरी तरह से संभव हो सकता है (यदि आपके पास 24/7 ऑन-साइट sysadmins की लागत को कम करने के लिए अन्य अनुबंध हैं)।
माइकल बोर्गवर्ड्ट

@MichaelBorgwardt निश्चित रूप से शुद्ध संख्या के दृष्टिकोण से "इसे काम करने" के तरीके हैं, लेकिन मैं अभी भी खराब पीआर के लिए संभावित की वजह से गिरावट आई हूं ($ _CLIENT ट्विटर पर चला जाता है और दुनिया को बताता है 'हम नीचे हैं क्योंकि $ _PROVER अक्षम है) और उनके SLA को पूरा नहीं कर सकता! ')। व्यक्तिगत रूप से मेरे पास 10 छोटे हैं, अधिक उचित ग्राहक मुझे $ 10ka महीने का भुगतान करते हैं :-)
voretaq7

13

तदनुसार कीमत, और फिर अनुबंध में निर्धारित करें कि SLA के पिछले किसी भी समय वे भुगतान कर रहे दर पर वापस कर दिए जाएंगे।

मेरी आखिरी नौकरी पर ISP ने ऐसा किया। हमारे पास $ 40 / मो के लिए 99.9% अपटाइम पर "नियमित" डीएसएल लाइन का विकल्प था, या $ 1100 / मो के लिए 99.99% अपटाइम पर T1 का बंधुआ तिकड़ी। प्रति माह 10+ घंटे लगातार होते थे, जो $ 40 / मो डीएसएल के नीचे उनके अपटाइम को अच्छी तरह से लाता था, फिर भी हमें केवल $ 15 या इसके आसपास वापस कर दिया गया था, क्योंकि प्रति घंटे * घंटे की दर यही थी। वे सौदे से डाकुओं की तरह बने।

यदि आप 100% अपटाइम के लिए $ 450,000 प्रति माह का बिल देते हैं, और आप केवल 99.999% हिट करते हैं, तो आपको उन्हें $ 324 वापस करना होगा। मैं अवसंरचना लागत पर दांव लगाने के लिए तैयार हूं। 99.999% हिट करने के लिए $ 45,000 एक महीने के पड़ोस में हैं जो पूरी तरह से वितरित कोलोस, मल्टीपल टियर 1 अपलिंक, फैन्सीपेंट्स हार्डवेयर, आदि।


3
यदि आप किसी को 100% अपटाइम का वादा करते हुए देखते हैं तो यह ठीक वैसा ही है जैसा वे कर रहे हैं। 100% अपटाइम का वादा करने और इसे वितरित करने के बीच एक अंतर है। ग्राहक को यह समझाने के लिए एक अच्छा विचार होगा यदि वे आपके लिए एक प्रतियोगी एसएलए को उद्धृत करने का प्रयास करते हैं।
sjbotha

10

अगर पेशेवर 99.999 प्रतिशत उपलब्धता पर सवाल उठाते हैं, तो क्या कभी व्यावहारिक या आर्थिक रूप से व्यावहारिक संभावना है , तो 99.9999% उपलब्धता भी कम संभव है या व्यावहारिक है। अकेले 100% चलो।

आप समय की विस्तारित अवधि के लिए 100% उपलब्धता लक्ष्य को पूरा नहीं करेंगे। आप इसके साथ एक सप्ताह या एक साल के लिए दूर हो सकते हैं, लेकिन तब कुछ होगा और आपको जिम्मेदार ठहराया जाएगा। आउटफिट क्षतिग्रस्त प्रतिष्ठा से हो सकता है (आपने वादा किया था, आप अनुबंधित जुर्माना से दिवालियापन तक नहीं पहुंचा सकते)।


10

दो प्रकार के लोग हैं जो 100% अपटाइम मांगते हैं:

  1. कंप्यूटर, कंप्यूटर सिस्टम, या इंटरनेट के बारे में बिल्कुल ज्ञान नहीं रखने वाले लोग। *
  2. ऐसे लोग जो जानबूझकर खुद को एक गधा बना रहे हैं, या तो आपके नो (Google "ऑरेंज जूस टेस्ट") कहने की क्षमता का परीक्षण करें, या बाद में आपको भुगतान करने के लिए किसी प्रकार का अनुबंध SLA उत्तोलन प्राप्त करने का प्रयास करें।

मेरी सलाह, इन दोनों प्रकार के ग्राहकों को कई मौकों पर झेलना, इस ग्राहक को नहीं लेना है। उन्हें किसी और पागल को चलाने दें।

* यह एक ही व्यक्ति को तेज़-से-हल्की यात्रा, सदा गति, शीत संलयन, आदि के बारे में पूछताछ करने में कोई शर्मिंदगी नहीं हो सकती है।


2
ऑरेंज जूस टेस्ट के लिए +1 .. मुझे पसंद है और इसके बारे में नहीं पता था :)
ओलिवर एम ग्रीच

8

मैं ग्राहक के साथ संवाद करने के लिए उनके साथ स्थापित करेगा कि 100% अपटाइम का क्या मतलब है। यह संभव है कि वे वास्तव में 99% अपटाइम और 100% अपटाइम के बीच अंतर नहीं देखते हैं। अधिकांश लोगों के लिए (अर्थात सर्वर व्यवस्थापक नहीं) उन दो संख्याएँ समान हैं।


6

100% अपटाइम?

यहाँ आपको क्या चाहिए:

एकाधिक, (और निरर्थक) DNS सर्वर, प्रत्येक ISP के साथ उचित SLAs के साथ, दुनिया भर में कई साइटों की ओर इशारा करते हैं।

सुनिश्चित करें कि DNS सर्वर ठीक से सेटअप हैं, TTL को प्रभावी रूप से मान्यता प्राप्त है।


1
हां, DNS एक अच्छी शुरुआत है - जैसे कि nslookup google.comकुछ काम नहीं करने की स्थिति में अतिरेक के लिए 6 अलग-अलग आईपी लौटाता है। इसके अलावा RobTex.com को कुछ डोमेन के कॉन्फ़िगरेशन को देखने के लिए एक महान साइट देखें जैसे कि robtex.com/dns/google.com.html#records
डेविड डी ई फ्रीटास

6

यह आसान है। अमेज़न EC2 SLA में स्पष्ट रूप से कहा गया है:

"वार्षिक उत्थान प्रतिशत" की गणना सेवा वर्ष के दौरान 5 मिनट की अवधि के 100% से घटाकर की जाती है, जिसमें Amazon EC2 "क्षेत्र अनुपलब्ध" की स्थिति में था।

http://aws.amazon.com/ec2-sla/

सेवा के पूरे बंडल के सापेक्ष होने के लिए बस 'अपटाइम' को परिभाषित करें, आप वास्तव में समय का 100% चालू रख सकते हैं, और आपको कोई समस्या नहीं होनी चाहिए।

इसके अलावा, यह इंगित करने योग्य है कि SLA का संपूर्ण बिंदु यह निर्धारित करना है कि आपके दायित्व क्या हैं और यदि आप उनसे नहीं मिल सकते हैं तो क्या होता है। इससे कोई फर्क नहीं पड़ता कि क्लाइंट 3 निन या 5 नाइन या एक लाख नाइन से पूछता है - सवाल यह है कि उन्हें क्या मिलता है / जब वह डिलीवर नहीं कर सकते। स्पष्ट उत्तर 5x पर 100% अपटाइम के लिए एक लाइन आइटम प्रदान करना है, जिस कीमत पर आप चार्ज करना चाहते हैं, और तब आपको 4x रिफंड मिलता है यदि आप उस लक्ष्य को याद करते हैं। आप स्कोर कर सकते हैं!


5

DNS परिवर्तन केवल समय लेते हैं यदि उन्हें समय लेने के लिए कॉन्फ़िगर किया गया हो। आप टीटीएल को रिकॉर्ड पर एक सेकंड के लिए सेट कर सकते हैं - आपका एकमात्र मुद्दा यह सुनिश्चित करना होगा कि आप डीएनएस प्रश्नों का समय पर जवाब दें, और डीएनएस सर्वर उस स्तर के प्रश्नों का सामना कर सकते हैं।

यह ठीक इसी तरह है कि F5 बिग आईपी में GTM कैसे काम करता है - डिफ़ॉल्ट रूप से DNS TTL को 30 सेकंड के लिए सेट किया जाता है और यदि क्लस्टर के एक सदस्य को कार्यभार संभालने की आवश्यकता होती है, तो DNS को अपडेट किया जाता है और नया IP लगभग तुरंत लिया जाता है। आउटेज के अधिकतम 30 सेकंड, लेकिन यह बढ़त का मामला है, औसत 15 सेकंड होगा।


10
यह मेरा अनुभव है कि कुछ DNS सर्वर एक टीटीएल की अवहेलना करेंगे जो वे अप्रिय मानते हैं (आरएफसी के बावजूद)। 5 मिनट से कम की कोई भी चीज़ वैश्विक स्तर पर कुछ अविश्वसनीय हो जाती है।
jdw

13
वास्तविकता को नजरअंदाज करते हुए @Paul कोई स्वीकार्य प्रैक्टिस नहीं है, चाहे वह सभी को कितना भी परेशान करे।
एमडीएमरा

5
मैं इस पर jdw के साथ हूं। मैंने कई DNS सर्वरों को पूरी तरह से TTL को नजरअंदाज करते हुए देखा है, यहां तक ​​कि 1 घंटा सेटिंग और डिफ़ॉल्ट रूप से 24 घंटे या कुछ के लिए वापस।
NotMe

6
@Paul - ओपी का हर ISP के डीएनएस रिसोल्वर्स पर नियंत्रण नहीं है। एर्गो, उन्हें यह कहने का विकल्प नहीं मिलता है कि "यदि आप हमारी वेबसाइट का उपयोग करने जा रहे हैं, तो Comcast / Roadrunner / whomever का उपयोग अपने ISP के रूप में न करें क्योंकि वे हमारी TTL सेटिंग्स की अनदेखी करेंगे"। यह कुछ ऐसा है जो बस उनके नियंत्रण से बाहर है और इसलिए इस समस्या का एक समाधान माना जाना बहुत ही नाजुक है। समाधान में किसी तरह से नेटवर्क के अन्य बिट्स पर भरोसा किए बिना आईपी को आंतरिक रूप से बाध्य करने में सक्षम होने के लिए किसी तरह को शामिल करना है जो सहकारी नहीं हो सकता है।
jdw

3
यह यूपीएस की तरह नहीं है क्योंकि बिजली 'सिर्फ काम करना चाहिए'। यह एक सिस्टम को आर्किटेक्चर करने के लिए आगे की सोच नहीं है। यदि आप जानते हैं कि प्रणाली का एक नाजुक हिस्सा है, तो किसी भी कारण से, आपको इसके लिए जिम्मेदार होना चाहिए।
jdw

5

तुम्हें पता है कि यह असंभव है।

इसमें कोई संदेह नहीं है कि ग्राहक "100%" देखने पर ध्यान केंद्रित करता है, इसलिए आप जो सबसे अच्छा कर सकते हैं वह 100% का वादा करता है, सिवाय इसके [सभी उचित कारणों से जो आपकी गलती नहीं है]।


कोई संदेह नहीं है कि ग्राहक कोई समाधान नहीं चाहता है। वे एक गिरावट चाहते हैं। तो वे कह सकते हैं, उन्होंने कम से कम कोशिश की।
mbx

शायद हो सकता है। आप एक उच्च स्तर का सुराग मान रहे हैं।
मार्सिन

4

जबकि मुझे संदेह है कि 100% संभव है आप एक संभावना के रूप में एज़्योर (या समान एसएलए के साथ कुछ) पर विचार करना चाहें। क्या हो रहा है:

आपके सर्वर वर्चुअल मशीन हैं। यदि एक सर्वर पर कभी कोई हार्डवेयर समस्या होती है तो आपकी वर्चुअल मशीन को एक नई मशीन में ले जाया जाता है। लोड बैलेंसर पुनर्निर्देशन का ख्याल रखता है इसलिए ग्राहक को कोई डाउनटाइम नहीं देखना चाहिए (हालांकि मुझे यकीन नहीं है कि आपके सत्र राज्य कैसे प्रभावित होंगे)।

कहा कि, इस असफलता के साथ भी, 99.999 और पागलपन पर 100 सीमाओं के बीच का अंतर।

आपको निम्नलिखित कारकों पर पूर्ण नियंत्रण रखना होगा।
- मानवीय कारक, दोनों आंतरिक और बाह्य, द्वेष और नपुंसकता दोनों। इसका एक उदाहरण किसी को उत्पादन कोड के लिए कुछ धक्का दे रहा है जो एक सर्वर को नीचे लाता है। इससे भी बदतर, तोड़फोड़ के बारे में क्या?
- व्यापार के मुद्दे। क्या होगा यदि आपका प्रदाता अपने बिजली बिलों का भुगतान करने के लिए उतावलेपन से बाहर निकलता है या भूल जाता है, या बिना पर्याप्त चेतावनी के आपके आधारभूत ढांचे का समर्थन करना बंद कर देता है?
- प्रकृति। क्या होगा अगर असंबंधित बवंडर एक साथ पर्याप्त डेटा केंद्रों को बैकअप क्षमता को हिट करने के लिए?
- एक पूरी तरह से बग मुक्त वातावरण। क्या आप सुनिश्चित हैं कि कुछ थर्ड पार्टी या कोर सिस्टम कंट्रोल के साथ कोई एज केस नहीं है जो स्वयं प्रकट नहीं हुआ है लेकिन फिर भी भविष्य में ऐसा कर सकता है?
- भले ही आपका उपरोक्त कारकों पर पूर्ण नियंत्रण हो, लेकिन क्या आप सुनिश्चित हैं कि सॉफ्टवेयर / व्यक्ति यह देख रहा है कि जब आपका सिस्टम चालू है तो जाँचने के दौरान आप इसे झूठे नकारात्मक के साथ प्रस्तुत नहीं करेंगे?


2
एज़्योर और ईसी 2 दोनों हाल ही में पूर्ण और कुल विफलताओं के पास थे। मेरा मानना ​​है कि हाल ही में डीएनएस सर्वर पर एक खराब विन्यास प्रविष्टि के कारण एज़्योर को नीचे ले जाया गया था। किसी भी तरह से, जानकारी के लिए धन्यवाद।
NotMe

और अगर आपका लोड बैलेंसर (जो स्विचिंग करता है) किसी का ध्यान नहीं जाता है (जब नोड नीचे चला जाता है, तो इसका मॉनिटर भी किसी का ध्यान नहीं जा सकता, एड इनफिनिटम)।
जॉइंटिंग

1
मुझे लगता है कि आपका मतलब 'अक्षमता' था। 'नपुंसकता' से आईटी कर्मचारियों की अपनी नौकरी करने की क्षमता पर बहुत अधिक प्रभाव नहीं होना चाहिए।
mfinni 12

4

हैकिंग अटैक के मामले में कम से कम एक वेवर के बिना ईमानदारी से 100% पूरी तरह से पागल है। आपकी सबसे अच्छी शर्त यह है कि आप Google और अमेज़ॅन में ऐसा करें कि आपके पास एक भू-वितरित होस्टिंग समाधान हो, जहां आपकी साइट हो और DB कई भौगोलिक स्थानों में कई सर्वरों पर प्रतिकृति हो। यह किसी भी चीज़ में इसकी गारंटी देगा, लेकिन एक बड़ी आपदा जैसे कि इंटरनेट रीढ़ को एक क्षेत्र में काट दिया जाता है (जो समय-समय पर होता है) या लगभग सर्वनाश होता है।

मैं इस तरह के मामलों (DDOS, इंटरनेट बैकबोन कटिंग, एपोकैलिक टेररिस्ट अटैक या एक बड़े युद्ध आदि) के लिए एक क्लॉज में डालूंगा।

इसके अलावा अमेज़ॅन एस 3 या रैकस्पेस क्लाउड सेवाओं पर ध्यान दें। अनिवार्य रूप से क्लाउड सेटअप प्रत्येक स्थान पर न केवल अतिरेक प्रदान करेगा, बल्कि असफलता वाले भू-क्षेत्रों के आसपास पुनर्निर्देशित करने की क्षमता के साथ-साथ स्केलेबिलिटी और भू-वितरण भी प्रदान करेगा। हालांकि मेरी समझ यह है कि जियो-डिस्ट्रीब्यूशन में अधिक पैसा खर्च होता है।


3

मैं तो बस "इसे करने के लिए एक और आवाज जोड़ना चाहते थे कर सकते हैं (सैद्धांतिक रूप से) किया जाना" पार्टी।

मैं एक अनुबंध पर नहीं जाऊंगा जिसमें यह निर्दिष्ट किया गया हो कि उन्होंने मुझे कितना भुगतान किया है, लेकिन एक शोध समस्या के रूप में, इसके कुछ दिलचस्प समाधान हैं। मैं कदमों को रेखांकित करने के लिए नेटवर्किंग के साथ पर्याप्त रूप से परिचित नहीं हूं, लेकिन मैं नेटवर्क से संबंधित कॉन्फ़िगरेशन + इलेक्ट्रिकल / हार्डवेयर वायरिंग फेलओवर + सॉफ्टवेयर विफलताओं के संयोजन की कल्पना करता हूं, संभवतः, कुछ कॉन्फ़िगरेशन या अन्य कार्य वास्तव में इसे खींचने के लिए।

किसी भी कॉन्फ़िगरेशन में लगभग हमेशा विफलता का एक ही बिंदु होता है, लेकिन यदि आप पर्याप्त परिश्रम करते हैं, तो आप विफलता के उस बिंदु को धक्का दे सकते हैं जो कुछ "लाइव" की मरम्मत कर सकता है (यानी रूट डीएनएस नीचे चला जाता है, लेकिन मूल्य अभी भी कैश हैं हर जगह तो आपके पास इसे ठीक करने का समय है)।

फिर से, यह कहना संभव नहीं है .. मुझे यह पसंद नहीं आया कि कैसे एक भी जवाब ने इस तथ्य को संबोधित नहीं किया कि यह "वहाँ से बाहर" नहीं है - यह सिर्फ कुछ ऐसा नहीं है जो वे वास्तव में चाहते हैं यदि वे इसके माध्यम से सोचते हैं।


3

उपलब्धता को मापने की अपनी कार्यप्रणाली पर फिर से विचार करें और सार्थक लक्ष्य निर्धारित करने के लिए अपने ग्राहक के साथ काम करें ।

यदि आप एक बड़ी वेबसाइट चला रहे हैं, तो अपटाइम उपयोगी नहीं है। यदि आप 10 मिनट के लिए प्रश्नों को छोड़ते हैं, जब आपके ग्राहकों को उन्हें सबसे अधिक (ट्रैफिक पीक) की आवश्यकता होती है, तो रविवार को सुबह 3 बजे एक घंटे के आउटेज की तुलना में यह व्यवसाय के लिए अधिक हानिकारक हो सकता है।

कभी-कभी बड़ी वेब कंपनियां निम्नलिखित मैट्रिक्स का उपयोग करके उपलब्धता, या विश्वसनीयता को मापती हैं:

  1. सर्वर-साइड त्रुटि (HTTP 500s) के बिना सफलतापूर्वक पूछे जाने वाले प्रश्नों का प्रतिशत ।
  2. कुछ निश्चित लक्ष्य विलंबता के नीचे दिए गए प्रश्नों का प्रतिशत ।
  3. गिराए गए प्रश्नों को आपके आँकड़ों के विरुद्ध गिना जाना चाहिए (नीचे देखें)।

नमूना जांच का उपयोग करके उपलब्धता को मापा नहीं जाना चाहिए , जो कि बाहरी इकाई जैसे कि p षटतिंग और पिंगबिलिटी रिपोर्ट करने में सक्षम है। पूरी तरह से उस पर भरोसा मत करो। यदि आप इसे सही करना चाहते हैं, तो हर एक क्वेरी को गिनना चाहिए । अपनी वास्तविक, कथित सफलता को देखकर अपनी उपलब्धता को मापें।

सबसे प्रभावी तरीका अपने लोड-बैलेंसर से लॉग या आंकड़े एकत्र करना है और ऊपर मैट्रिक्स के आधार पर उपलब्धता की गणना करना है।

गिराए गए प्रश्नों का प्रतिशत भी आपके आँकड़ों के विरुद्ध गिना जाना चाहिए। इसे सर्वर-साइड त्रुटियों के रूप में उसी बाल्टी में देखा जा सकता है। यदि नेटवर्क या किसी अन्य बुनियादी ढांचे जैसे DNS या लोड बैलेंसरों के साथ समस्याएं हैं, तो आप अनुमान लगाने के लिए सरल गणित का उपयोग कर सकते हैं कि कितने प्रश्न खो गए हैं । यदि आपको सप्ताह के उस दिन के लिए X क्वेरी की उम्मीद है लेकिन आपको X-1000 मिला है, तो संभवत: आपने 1000 प्रश्नों को छोड़ दिया है। प्रति मिनट (या सेकंड) ग्राफ़ में अपने ट्रैफ़िक को प्रश्नों में प्लॉट करें। यदि अंतराल दिखाई देते हैं, तो आपने प्रश्न छोड़ दिए। उन अंतरालों के क्षेत्र को मापने के लिए बुनियादी ज्यामिति का उपयोग करें , जो आपको गिराए गए प्रश्नों की कुल संख्या प्रदान करता है।

अपने ग्राहक के साथ इस पद्धति पर चर्चा करें और इसके लाभ बताएं। उनकी वर्तमान उपलब्धता को मापकर आधार-रेखा निर्धारित करें । यह उनके लिए स्पष्ट हो जाएगा कि 100% एक असंभव लक्ष्य है।

फिर आप आधार रेखा पर सुधार के आधार पर एक अनुबंध पर हस्ताक्षर कर सकते हैं। कहो, अगर वे वर्तमान में 95% उपलब्धता का अनुभव कर रहे हैं, तो आप 98.5% प्राप्त करके स्थिति को दस गुना बेहतर बनाने का वादा कर सकते हैं ।

नोट: उपलब्धता को मापने के इस तरीके के नुकसान हैं। जब तक आप इसे करने के लिए मौजूदा औजारों का उपयोग नहीं करते हैं, पहले, लॉग्स को इकट्ठा करना, रिपोर्ट तैयार करना और रिपोर्ट तैयार करना आपके लिए मामूली नहीं हो सकता है। दूसरा, एप्लिकेशन बग आपकी उपलब्धता को नुकसान पहुंचा सकते हैं। यदि आवेदन कम गुणवत्ता वाला है, तो यह अधिक त्रुटियों की सेवा करेगा। इसका समाधान केवल आवेदन से आने वाले लोगों के बजाय लोड-बैलेंसर द्वारा बनाए गए 500 पर विचार करना है।

इस तरह से चीजें थोड़ी जटिल हो सकती हैं, लेकिन यह केवल आपके सर्वर अपटाइम को मापने से परे एक कदम है ।


3

जबकि कुछ लोगों ने यहां ध्यान दिया, कि 100% पागल या असंभव है , वे किसी भी तरह वास्तविक बिंदु से चूक गए। उन्होंने तर्क दिया, इसका कारण यह है कि सबसे अच्छी कंपनियां / सेवाएं भी इसे हासिल नहीं कर सकती हैं।

वैसे, यह बहुत आसान है। यह गणितीय रूप से असंभव है

हर चीज की एक संभावना होती है। उन सभी स्थानों पर एक साथ भूकंप आ सकता है जहाँ आप अपने सर्वर को संग्रहीत करते हैं, उन सभी को नष्ट कर देता है। कहीं-कहीं यह एक हास्यास्पद रूप से छोटी संभावना है, लेकिन यह 0. नहीं है। आप सभी इंटरनेट प्रदाता एक साथ आतंकवादी / साइबर हमले का सामना कर सकते हैं। फिर, बहुत संभावित नहीं, लेकिन शून्य भी नहीं। आप जो भी प्रदान करते हैं, आप एक गैर-शून्य संभावना परिदृश्य प्राप्त कर सकते हैं जो पूरी सेवा को नीचे लाता है। क्योंकि यह, आपका अपटाइम 100% भी नहीं हो सकता है।


वास्तव में, मैं पिछले पागल या असंभव जाना और इसे मूर्खतापूर्ण कहूंगा। कुछ भी नहीं मनुष्य 100% जानता है।
quadruplebucky

2

सांख्यिकीय नमूने का उपयोग करके विनिर्माण गुणवत्ता नियंत्रण पर एक पुस्तक ले लो। इस पुस्तक में एक सामान्य चर्चा, कॉलेज में एक सामान्य सांख्यिकी पाठ्यक्रम में किसी भी प्रबंधक को उजागर करने की अवधारणाएं, एक हजार में एक उत्तेजना से जाने की लागत निर्धारित करती हैं, एक लाख में दस में से 1 से 1 तक 1 बिलियन में तेजी से वृद्धि। अनिवार्य रूप से 100% अपटाइम को हिट करने की क्षमता को लगभग असीमित राशि खर्च करनी होगी, जैसे कि किसी वस्तु को प्रकाश की गति पर धकेलने के लिए आवश्यक ईंधन की मात्रा।

एक प्रदर्शन इंजीनियरिंग के दृष्टिकोण से मैं आवश्यकता को अस्वीकार्य और अनुचित दोनों के रूप में अस्वीकार कर दूंगा, कि यह अभिव्यक्ति एक सच्ची आवश्यकता से अधिक इच्छा है। एप्लिकेशन निर्भरता के साथ जो नेटवर्किंग, नाम समाधान, मार्ग, अंतर्निहित वास्तु घटकों या विकास उपकरणों से प्रचारित होने के लिए किसी भी आवेदन के बाहर मौजूद है, यह किसी भी गुरुत्व 100% अपटाइम के लिए एक व्यावहारिक अक्षमता बन जाता है।


1

मुझे नहीं लगता कि ग्राहक वास्तव में 100% अपटाइम या 99.999% अपटाइम के लिए पूछ रहा है। यदि आप देखते हैं कि वे क्या वर्णन कर रहे हैं, तो वे उस स्थान को चुनने के बारे में बात कर रहे हैं जहां अगर कोई उल्का उनके साइट डाटासेंटर को बाहर निकालता है।

यदि आवश्यकता बाहरी लोगों को भी नहीं दिखती है, तो कितना कठोर होना पड़ता है? क्या अजाक्स अनुरोध को फिर से करना और अंतिम उपयोगकर्ता को 30 सेकंड के लिए एक स्पिनर दिखाना स्वीकार्य होगा?

उन चीजों के प्रकार हैं जिनके बारे में ग्राहक ध्यान रखते हैं। यदि ग्राहक वास्तव में सटीक SLAs के बारे में सोच रहा था, तो वे इसे 99.99 या 99.999 के रूप में व्यक्त करने के लिए पर्याप्त जानेंगे।


अगर ग्राहक को लगता है कि वे "100% अपटाइम" चाहते हैं और वह अनुबंध अनुबंध में समाप्त हो रहा है, तो आप इसे अदालत में समाप्त होने पर पकड़ सकते हैं। इसे बाहर बात करने और ग्राहक को यह समझने में मदद करने के लिए कि वे क्या सोच रहे हैं, यह जानने के बजाय वे वास्तव में क्या चाहते हैं।
क्रिस एस

ओह, मैं मानता हूं कि अनुबंध में आने से पहले इसे साफ करने की जरूरत है। मैं सिर्फ यह कह रहा हूं कि इसके लिए संपर्क करने की जरूरत है क्योंकि क्लाइंट संचार नहीं कर रहा है कि वे वास्तव में क्या चाहते हैं, जैसा कि ग्राहक का विरोध कुछ हास्यास्पद है।
केविन पीटरसन

1

मेरे 2 सेंट। मैं एक भाग्य -5 कंपनी के लिए बहुत लोकप्रिय वेब साइट के लिए जिम्मेदार था जो सुपर बाउल के लिए विज्ञापन निकालता था। मुझे ट्रैफ़िक में भारी स्पाइक्स से निपटना पड़ा और जिस तरह से मैंने इसे हल किया वह अकामाई जैसी सेवा का उपयोग करना था। मैं अकामाई के लिए काम नहीं करता लेकिन मुझे उनकी सेवा बहुत अच्छी लगी। उनके पास अपना स्वयं का, स्मार्ट DNS सिस्टम है जो किसी विशेष नोड / होस्ट के साथ जानता है या तो भारी लोड के अधीन है या नीचे है और तदनुसार ट्रैफ़िक को रूट कर सकता है।

उनकी सेवा के बारे में साफ-सुथरी बात यह थी कि मुझे अपने डेटा सेंटर में सर्वर पर सामग्री को उनके डेटा सेंटर में दोहराने के लिए वास्तव में कुछ भी जटिल नहीं करना था। इसके अतिरिक्त, मैं उनके साथ काम करना जानता हूं, उन्होंने अपाचे HTTP सर्वर का भारी उपयोग किया।

जबकि 100% अपटाइम नहीं है, आप दुनिया भर में सामग्री को फैलाने के ऐसे विकल्पों पर विचार कर सकते हैं। जैसा कि मैंने चीजों को समझा, अकामाई में यातायात का स्थानीयकरण करने की क्षमता भी थी यदि मैं मिशिगन में था, तो मुझे मिशिगन / शिकागो सर्वर से सामग्री मिलती थी और यदि मैं कैलिफ़ोर्निया में होता, तो मुझे कैलिफोर्निया में स्थित सर्वर से सामग्री प्राप्त होती।


-1 क्योंकि यह एक व्यावहारिक उत्तर है लेकिन उपयोगी नहीं है। इस साइट के सभी सवालों का जवाब "इसे करने के लिए किसी और को किराए पर लेना" हो सकता है, लेकिन यही कारण है कि हम यहां नहीं हैं।
यवेस जुनेकेरा

क्षमा करें मैं असहमत हूं। "बिल्कुल उपयोगी नहीं है?" यह मेरे लिए सबसे निश्चित रूप से उपयोगी था और आपके "किसी और को इसे करने के लिए किराया दें" टिप्पणी के विपरीत, मुझे लगता है कि आपके तर्क से आदमी को अपने स्वयं के फाइबर ऑप्टिक केबल को ट्रेंच करना चाहिए और उन्हें खरीदने के बजाय अपने स्वयं के स्विचेस को डिजाइन करना चाहिए? क्या आप गंभीर हैं, यवेस? आप किसी ऐसे व्यक्ति की तरह आवाज निकालते हैं जिसने आईटी क्षेत्र में ज्यादा समय नहीं बिताया है।
किलो ऑक्ट

0

ऑफ-साइट फ़ेलओवर के बजाय, बस दो स्थानों से आवेदन को एक साथ आंतरिक और बाहरी चलाएं। और दो डेटाबेस को सिंक्रोनाइज़ करें ... तब यदि आंतरिक नीचे चला जाता है, तो आंतरिक लोग अभी भी काम कर पाएंगे और बाहरी लोग अभी भी एप्लिकेशन का उपयोग कर पाएंगे। जब आंतरिक ऑनलाइन वापस आता है, तो परिवर्तनों को सिंक्रनाइज़ करें। आपके पास एक डोमेन नाम या राउंड रॉबिन के साथ एक नेटवर्क राउटर के लिए दो DNS प्रविष्टियां हो सकती हैं।


0

बाहरी रूप से होस्ट की गई साइटों के लिए, आपको निकटतम 100% अपटाइम मिलेगा जो आपकी साइट को Google के ऐप इंजन पर होस्ट कर रहा है और इसके उच्च प्रतिकृति डेटास्टोर (HRD) का उपयोग कर रहा है , जो वास्तविक समय में कम से कम तीन डेटा केंद्रों में आपके डेटा को स्वचालित रूप से दोहराता है। इसी तरह, ऐप इंजन फ्रंट-एंड सर्वर आपके लिए ऑटो स्केल्ड / प्रतिकृति हैं।

हालाँकि, Google के सभी संसाधनों और दुनिया के सबसे परिष्कृत प्लेटफ़ॉर्म के साथ भी, ऐप इंजन SLA अपटाइम गारंटी केवल "किसी भी कैलेंडर महीने में 99.95% समय है।"


0

सरल और प्रत्यक्ष: एनीकास्ट

http://en.wikipedia.org/wiki/Anycast

यही वह है जो क्लाउडफेयर, गूगल और किसी भी अन्य बड़ी कंपनी के लिए निरर्थक, कम विलंबता, क्रॉस कॉन्टिनेंटल फेल-ओवर या बैलेंसिंग का उपयोग करता है।

लेकिन यह भी ध्यान रखें कि 100% अपटाइम होना असंभव है, और यह कि 99.999% से 99.9999% तक जाने की लागत बहुत बड़ी है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.