सही क्रम में सर्वर को पुनरारंभ करने के लिए यूपीएस को कैसे कॉन्फ़िगर करें?


12

यहां हमारे पास कुछ सर्वर हैं और उनमें से प्रत्येक के पास एक समर्पित यूपीएस है। उनके बीच निर्भरताएं हैं इसलिए उन्हें सही क्रम में बदल दिया जाना चाहिए। अंततः हम बिजली की आपूर्ति के साथ गंभीर समस्याओं का सामना कर रहे हैं, इसलिए सर्वरों को बंद कर दिया जाता है और फिर बिजली बहाल होने पर एक यादृच्छिक क्रम में पुनरारंभ होता है। यह एक समस्या नहीं है अगर सर्वर को ब्लैकआउट के दौरान बंद कर दिया गया था, तो यह महत्वपूर्ण है कि वे किसी भी मानवीय हस्तक्षेप के बिना सही ढंग से काम करें एक बार शक्ति बहाल हो जाए।

हमारा यूपीएस काफी सस्ता है और मेरे लक्ष्य के लिए उपयोगी एकमात्र कॉन्फ़िगरेशन पैरामीटर है power the load xx seconds after power is restored। प्रत्येक यूपीएस पर सही देरी डालने के सिद्धांत में मैं सर्वर पुनरारंभ के क्रम को ठीक कर सकता हूं लेकिन मुझे विश्वास नहीं है कि यूपीएस उम्मीद के मुताबिक व्यवहार करेगा।

क्या यह जाने का सही तरीका है?
क्या उच्च स्तर यूपीएस पुनः आरंभ अनुक्रम को ठीक करने के लिए अन्य विकल्प देता है?
एक अंतिम नोट: मेरे अप्स 1000 - 2200 वीए की सीमा में हैं


1
यह उन अच्छी चीजों systemdमें से एक है जो स्टार्टअप प्रक्रिया में उचित निर्भरता को परिभाषित करने की क्षमता है। सेवा वाई शुरू करने से पहले सेवा एक्स उपलब्ध होने तक प्रतीक्षा करें।
MSalters

1
@MSalters AFAIK systemd निर्भरता प्रबंधन केवल तब काम करता है जब इकाइयां एक ही systemdउदाहरण द्वारा नियंत्रित की जाती हैं और पूरी तरह से अलग सर्वर पर चलने वाली सेवाओं के लिए नहीं ...
HBruijn

1
@Hruijn: सॉर्ट करें, उदाहरण के लिए नेटवर्क आरोह सर्वर पर काम करते हैं। कहने का तात्पर्य यह है कि, अगर server1 एक फाइल सिस्टम को सर्वर 2 द्वारा होस्ट करता है, तो सेवा 1 की सेवाएं जो माउंट पर निर्भर करती हैं, जब तक कि सर्वर 2 ने उन सेवाओं को शुरू नहीं कर दिया है। और IIRC में आप सर्वर भी डीएचसीपी के लिए इंतजार कर सकते हैं (मुझसे यह न पूछें कि सर्वर डीएचसीपी का उपयोग क्यों करता है, लेकिन यह एक उत्तर में उल्लेख किया गया था)
MSalters

जवाबों:


25

इसके लिए मानक उत्तर "बिल्कुल नहीं" है। यादृच्छिक क्रम में पुनरारंभ को संभालने के लिए सॉफ़्टवेयर को ठीक करें। यदि आपको वास्तव में पहले शुरू करने के लिए कुछ सर्वरों की आवश्यकता है (उदाहरण: सक्रिय निर्देशिका) ने उन्हें यूएसवी पर रखा है जो संभवतः लंबे समय तक जीवित रहे हैं। एक कम शक्ति परमाणु आधारित सर्वर सक्रिय निर्देशिका नियंत्रक के रूप में पर्याप्त है और एक छोटे से यूएसवी पर एक दिन जीवित रहेगा।

क्या उच्च स्तर यूपीएस पुनः आरंभ अनुक्रम को ठीक करने के लिए अन्य विकल्प देता है?

नहीं, मैं कहूंगा कि आम तौर पर यह माना जाता है कि प्रोग्रामर सक्षम हैं कि वे इस मुद्दे को ठीक से काम कर सकें।

आप क्या कर रहे हैं:

  • सर्वर "बेतरतीब ढंग से" शुरू करते हैं। डीएचसीपी / सक्रिय निर्देशिका को छोड़कर वास्तव में एक आदेश की मांग करने के लिए कुछ भी नहीं है जिसे तय नहीं किया जा सकता है।
  • नियंत्रण सर्वर को कुछ समय (5 मिनट) के बाद सही क्रम में विभिन्न मशीनों पर सेवाएं शुरू करें।

मैं कहूंगा कि इस प्रकार का सेटअप बहुत अधिक सामान्य है। मैं ऐसे किसी भी सॉफ्टवेयर को कॉल करूंगा जिसे REQUIRES सर्वर एक विशेष क्रम में (शुद्ध अवसंरचना के बाहर) टूटे और व्यवसाय के लिए अयोग्य घोषित करता है।

बस नोट के रूप में: हमारा अपना सेटअप एक कम लागत वाला 20kva USV (कम लागत है क्योंकि हमें सर्वर के लिए एक का उपयोग किया गया), नेटवर्क की "रूट" (और बैकअप मशीन) के रूप में सेवारत एक मशीन के लिए 2000VA यूएसवी के साथ। स्लेव्ड का मतलब है कि यूएसवी बड़े के पीछे है - इसलिए यह केवल तभी बैटरी पर स्विच करता है जब बड़े वाले (जो कि आधे घंटे से 8 घंटे के बीच रहता है, यह इस बात पर निर्भर करता है कि हमारा कंप्यूटिंग ग्रिड कितना ऑनलाइन है) टर्मिनल शटडाउन में जा रहा है।


2
मुझे लगता है कि यह कभी-कभी किया गया आसान है (एडी, जैसा कि आप कहते हैं, एक स्पष्ट उदाहरण है) लेकिन मैं सहमत हूं। सही समाधान सर्वर या सेवाओं के स्टार्ट ऑर्डर जैसी चीजों के लिए निर्भरता को खत्म करने पर काम करना है। यदि और कुछ नहीं, तो यह एक वेब ऐप पर संभव होना चाहिए, उदाहरण के लिए, कोड लिखने के लिए जो कहता है कि "अगर मैं अपने बैक-एंड, 'स्लीप' से कनेक्ट नहीं कर सकता हूं और बाद में दुर्घटना के बजाय फिर से कोशिश करता हूं"।
रोब मोइर

वह AD के साथ समस्या भी AD नहीं है - यह ज्यादातर IPv4 DHCP है जो dhcp सर्वर से पहले कंप्यूटर के ऑनलाइन होने के लिए तैयार नहीं है। आईपीवी 6 इसे संभालता है;)
टॉमटॉम

यह सच है। IPv4 एक दर्द है ... और मुझे अभी भी यहां लोग मुझसे पूछते हैं कि हमें "इस newfangled IPv6 बकवास" से परेशान होने की आवश्यकता क्यों है।
रोब मोइर

1
"यह आमतौर पर माना जाता है कि प्रोग्रामर इस मुद्दे के आसपास काम करने के लिए पर्याप्त सक्षम हैं" - आपको बहुत प्रोग्रामिंग नहीं करनी चाहिए! नहीं, सभी गंभीरता में, एक प्रणाली में एक विशिष्ट क्रम में लाने के लिए आवश्यक कारणों की एक बड़ी मात्रा है। हां, सॉफ़्टवेयर को "सुशोभित रूप से विफल" होना चाहिए और टूटे हुए कनेक्शन को फिर से आज़माना चाहिए, लेकिन यह हमेशा संभव नहीं है। मुझे जो याद है, उसमें से कुछ अच्छे पीडीयू में व्यक्तिगत पोर्ट को शुरू / बंद करने की क्षमता है, इसलिए शायद वहां कुछ किया जा सकता है।
स्नेकडोक

1
मुझे "यूएसवी" की खोज करनी थी और "मानव रहित सतह वाहन" मिला। मैं जानता हूं कि यह गलत है, लेकिन मैं चाहता हूं कि यह सही हो।
ब्रिअम

14

प्रबंधित बिजली वितरण इकाइयाँ (यूपीएस के बजाय) अक्सर बिजली फिर से शुरू होने के बाद व्यक्तिगत आउटलेट को सक्षम करने में अनुकूलित देरी का समर्थन करती हैं।

आमतौर पर यह है कि सर्किट ब्रेकर को ट्रिपिंग से बचाने के लिए जब सिस्टम को पावर से रिस्टोर करने के तुरंत बाद उसी समय पूरा सिस्टम शक्तियां देता है, लेकिन इसका उपयोग आपके सिस्टम की निर्भरता के बूट ऑर्डर को संरक्षित करने के लिए भी किया जा सकता है।


हाँ, सही है। यह उन्नत कार्यक्षमता है और यह नहीं माना जाता है कि यूएसवी वास्तव में सर्वर से जुड़ा है - लेकिन यह रैकिंग को शक्ति प्रदान करता है जो कि विवरणों को संभालने के लिए पीडीयू का उपयोग करता है।
टॉमटॉम

6

मेरे पास यह सटीक मुद्दा था। एकमात्र अंतर जो हमने मजबूत रैक माउंटेड एपीसी बिजली इकाइयों (उदाहरण के लिए एपीसी स्मार्टयूपीएस 3000 ) में निवेश किया है । APC PowerChute नेटवर्क शटडाउन सॉफ़्टवेयर ( PowerChute नेटवर्क शटडाउन सॉफ़्टवेयर) के साथ , मैं एक विशिष्ट क्रम में सर्वर को बंद और लाने में सक्षम हूं। सॉफ़्टवेयर की एक अन्य उपयोगी विशेषता सर्वरों को बहुत अंतिम समय में बंद करने के लिए सेट कर रही थी, अर्थात यह गणना करते हुए कि एपीसी इकाइयों ने कितनी बैटरी की शक्ति छोड़ दी थी और सर्वरों को केवल पर्याप्त समय के लिए बंद कर दिया था, बस बिजली बंद करने के बजाय उन्हें ठीक से बंद कर दिया था।

सॉफ्टवेयर है ... उपयोगकर्ता के अनुकूल नहीं है लेकिन यह मुश्किल नहीं है अगर आप इसे जानने के लिए कुछ समय लेते हैं। यदि आप अपने बुनियादी ढांचे में अधिक निवेश करने में रुचि रखते हैं, तो यह निश्चित रूप से जाने का मार्ग है।


1
हमारे पास Apc स्मार्ट अप भी हैं, उनमें से कुछ अपेक्षाकृत पुराने हैं और शायद कमजोर बैटरी हैं। उन पर कुछ परीक्षण करना मुश्किल है क्योंकि वे उत्पादन में हैं। इसके अलावा हमारे पास किसी भी फ्रीक लोड की कमी है, मेरा मतलब है एक लोड जो समस्याओं के बिना अचानक बिजली को सहन कर सकता है। कहा कि हर बार जब मैंने ब्लैकआउट किया तो यूपीएस ने अलग तरह से व्यवहार किया, जिसकी उम्मीद थी, यह गलत धारणा के कारण हो सकता है लेकिन मेरी भावना यह है कि वे यूपीएस बहुत विश्वसनीय नहीं हैं।
फिलिप्पो

@Filippo निश्चित रूप से YMMV है, लेकिन मेरे पास 3 वर्षों में जाने के लिए PowerChute सॉफ़्टवेयर का उपयोग करके कई साइटों पर SmartUPS 3000 और 3000XLM का मिश्रण है और सॉफ़्टवेयर का पता लगाने के बाद, निश्चित रूप से सीखने की अवस्था है और कुछ परीक्षण की आवश्यकता है, यह बहुत ठोस है।
विन्स्की टेक

2

ऐसा लगता है कि यूपीएस इकाइयाँ कम लागत वाली हैं और बिजली के बहाल होने के बाद एक विशिष्ट आउटपुट-ऑन प्रतीक्षा समय के लिए कॉन्फ़िगर होने में सक्षम नहीं है (कुछ उच्च अंत इकाइयाँ हैं)। समान कार्यक्षमता प्राप्त करने के लिए, आपको हमेशा सही पर बिजली देने के लिए एक विशिष्ट होस्ट चुनने की आवश्यकता होती है (हो सकता है कि जो भी सिस्टम किसी भी समय बूट करने की अनुमति हो) और सभी अन्य सर्वरों को एक संचालित ऑफ स्टेट में छोड़ दें (सत्ता में लौटने के लिए बायोस में कॉन्फ़िगर किया गया) जब एसी लागू किया जाता है, और जब ऐसा करने के लिए कहा जाता है, तो सत्ता पर वेक ऑन लैन जादू पैकेट का सम्मान करने के लिए)। फिर, मुख्य होस्ट जो बूट करता है, प्रत्येक होस्ट को WOL मैजिक पैकेट के प्रसारण के लिए एक स्क्रिप्ट / उपयोगिता चलाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.