क्या करें जब आपका ऑलवेज क्लस्टर हमेशा के लिए कोरम खो देता है?


9

मैं हमारी कंपनी की डीआर प्रक्रियाओं की समीक्षा कर रहा था और जब मैंने देखा कि ऑलवेज ऑन क्लस्टर के समाधान के लिए ऑनलाइन, कोरम को खोने के लिए, तुलना करने के लिए। मैं इस विषय पर पहले एसई पद खोजने से पहले गूगल परिणामों में तीन पृष्ठों था क्लस्टरिंग बनाम व्यवहार प्रतिकृति बनाम उपलब्धता समूहों जो केवल हल्के से खो कोरम के विषय पर छू लेती है।

जबकि हर कोई इस बात से सहमत है कि हारने वाला कोरम बुरा है, और संभावित कम करने के लिए कुछ सुझाव हैं, यह अभी भी हो सकता है। मैं एक अच्छा सहकर्मी की समीक्षा कर रहा हूँ जो कि कोरम के हमेशा के लिए क्लस्टर हानि से उबरने के सर्वोत्तम मार्ग का उत्तर देता है।


यदि यह पहले से ही नहीं है, तो मैं Windows Server 2012 R2 पर प्राप्त करने का प्रयास करता हूं। डायनेमिक कोरम, डायनेमिक गवाह और टाई ब्रेकर फीचर्स आपको बहुत सारे मामलों में "अंतिम आदमी खड़े" प्राप्त करने की अनुमति देते हैं। sqlha.com/2013/06/06/…
SQL हैमर

जवाबों:


11

एजी विंडोज क्लस्टरिंग पर आधारित हैं। कोरम हानि के लिए WSFC प्रक्रियाएं लागू होती हैं।

एक बार WSFC चल रहा हो, तो आप AG को बल दे सकते हैं, यदि आवश्यक हो। एक उपलब्धता समूह का जबरदस्ती मैनुअल फ़ेलओवर प्रदर्शन :

डब्लूएसएफसी क्लस्टर (जबरन कोरम) पर कोरम के लिए मजबूर करने के बाद, आपको प्रत्येक उपलब्धता समूह (संभावित संभावित नुकसान के साथ) को विफल करने की आवश्यकता है। डब्ल्यूओएसएफसी क्लस्टर मूल्यों की वास्तविक स्थिति खो जाने के कारण मजबूरन विफलता की आवश्यकता होती है। हालाँकि, आप डेटा हानि से बच सकते हैं, यदि आप उस सर्वर उदाहरण पर विफलता को बाध्य करने में सक्षम हैं जो प्रतिकृति की मेजबानी कर रहा था जो कि कोरम मजबूर करने से पहले या आपके द्वारा कोरम से पहले सिंक्रनाइज़ किए गए माध्यमिक प्रतिकृति के लिए प्राथमिक प्रतिकृति थी। अधिक जानकारी के लिए, कोरम के बाद डेटा हानि से बचने के लिए संभावित तरीके देखें ।


बिना क्लस्टर के नए एजी सेटअप के साथ यह कैसे काम करता है? क्या अभी भी एक कोरम है?
शालिनेटर

6

जब आपका ऑवरऑन क्लस्टर कोरम खो देता है तो क्या करें?

मैं विशेष रूप से मल्टी-सबनेट क्लस्टरिंग के साथ विभिन्न देशों (एनवाई-एलडी-एचके) में इस स्थिति में रहा हूं।

मल्टी-सबनेट क्लस्टर में कोरम लॉस से कैसे बचें?

  • क्लस्टर डिफ़ॉल्ट सेटिंग को और अधिक आराम से मॉनिटर करने की स्थिति में परिवर्तित करें विशेष रूप से क्लस्टर हार्टबीट सेटिंग्स का उपयोग करके CrossSubnetDelay, या इस हॉटफिक्सCrossSubnetThreshold द्वारा संपत्ति ।
  • एजी WSFC का उपयोग करता है जो क्लस्टर स्वास्थ्य को निर्धारित करने के लिए कोरम आधारित दृष्टिकोण का उपयोग करता है। सुनिश्चित करें कि आप उचित चयन करें और कोरम को कॉन्फ़िगर करें । यह ब्लॉग पोस्ट हमेशा के लिए कोरम वोट विन्यास में गहरा गोता लगाता है
  • साइट जागरूक क्लस्टर और क्लाउड गवाह की शुरुआत के साथ विंडोज सर्वर 2016 में चीजें बदल जाती हैं ।

    स्ट्रेच किए गए समूहों में नोड्स को अब उनके भौतिक स्थान (साइट) के आधार पर समूहीकृत किया जा सकता है। क्लस्टर साइट-जागरूकता क्लस्टर जीवन चक्र के दौरान कुंजी संचालन को बढ़ाती है जैसे कि विफलता व्यवहार, प्लेसमेंट नीतियां, नोड्स और कोरम व्यवहार के बीच दिल की धड़कन।

    क्लाउड गवाह एक नए प्रकार का फेलओवर क्लस्टर कोरम गवाह है जो मध्यस्थता बिंदु के रूप में Microsoft Azure का लाभ उठाता है। यह Microsoft Azure Blob Storage को एक ब्लॉब फ़ाइल को पढ़ने / लिखने के लिए उपयोग करता है जो तब विभाजित-मस्तिष्क रिज़ॉल्यूशन के मामले में मध्यस्थता बिंदु के रूप में उपयोग किया जाता है।

कोरम के गुम होने पर क्या करें?

  • यदि अनियोजित आउटेज / आपदा के कारण क्लस्टर नीचे चला जाता है, तो मैन्युअल हस्तक्षेप की आवश्यकता होती है। या तो एक विंडो व्यवस्थापक या क्लस्टर व्यवस्थापक को मैन्युअल रूप से कोरम (जो इस बिंदु को कवर करता है @ रेमुस के जवाब को वापस जोड़ना है) को मजबूर करना होगा और जीवित नोड्स को ऑनलाइन लाना होगा।

हमेशा की तरह, रूट कॉज एनालिसिस (आरसीए) करने के लिए, ऑल्टरनोन आरसीए के लिए अपने विंडोज क्लस्टर लॉग को इकट्ठा करें - SQL सर्वर विफलता क्लस्टर डायग्नोस्टिक लॉग का उपयोग करें । SQL सर्वर लॉग निर्देशिका में इन फ़ाइलों में निम्न प्रारूप है <HOSTNAME>_<INSTANCENAME>_SQLDIAG_X_XXXXXXXXX.xel:।


0

एक बार जब मैं एक आउटेज में शामिल होता हूं, जहां हमारे मिरर किए गए सर्वर कनेक्टिविटी खो देते हैं। चिंता करने वाली चीजों में से एक यह सुनिश्चित कर रही है कि आपके आवेदन एकल उदाहरण के लिए इंगित किए गए हैं। एक नेटवर्क आउटेज में आपके पास ऑलवेज ऑन क्लस्टर के सभी नोड्स हो सकते हैं लेकिन एक दूसरे के साथ संवाद करने में असमर्थ हैं। आप एक असफल को एक माध्यमिक के लिए मजबूर करते हैं और तब तक जब तक एक आउटेज होता है तब आपके पास दो प्राथमिक नोड हो सकते हैं क्योंकि मूल प्राथमिक को मजबूर असफलता के बारे में नहीं पता होगा।

आपके एप्लिकेशन सर्वर के स्थानों, उनके कॉन्फ़िगरेशन और SQL सर्वर तक पहुंचने की उनकी क्षमता के आधार पर, फिर सिद्धांत रूप में आपको दो नोड्स पर विश्वास हो सकता है कि वे प्राथमिक हैं और एक ही समय में डेटा बदल रहे हैं। एक बार जब आप अपने नेटवर्क के मुद्दों को ठीक कर लेते हैं और नोड्स कनेक्टिविटी फिर से शुरू हो जाती है, तो मूल प्राथमिक पर बदले गए सभी डेटा को उस नोड से अधिलेखित कर दिया जाएगा, जहां असफलता के लिए मजबूर किया गया था। इसके परिणामस्वरूप महत्वपूर्ण डेटा की हानि हो सकती है।

मैंने इस स्थिति को SQL 2005 और मिररिंग के साथ एक बार देखा है। और हमने असफलता पर बल न देने और इसे अप्राप्य रहने देने का फैसला किया। कारण यह है कि सबसे खराब स्थिति में अगर हमें बैक-अप करना पड़ता है और मिररिंग को फिर से शुरू करना पड़ता है, तो यह हमारे लिए 2 दिन की प्रक्रिया होगी जिसमें लेन-देन लॉग का जोखिम पूर्ण हो जाएगा और उस डिस्क का विस्तार करने में सक्षम नहीं होगा जिस पर वह बैठी थी।


मिररिंग और ऑल्वेज़ऑन अलग-अलग हैं। हमेशा के साथ आपको (उम्मीद है) मल्टीसुबनेटफेलओवर के साथ एक श्रोता की ओर इशारा करना चाहिए = सच्चा
जेम्स जेनकिंस

मुझे पता है कि लेकिन सर्वरों का भौगोलिक रूप से नेटवर्क आउटेज से अलग होना संभव है जहां कुछ ऐप कुछ सर्वरों तक पहुंच सकते हैं लेकिन अन्य नहीं। और जावा ड्राइवर का उपयोग किया जा रहा है जो मल्टीस्बनेटफेलओवर = ट्रू का समर्थन नहीं करते हैं। संभवतः अन्य थर्ड पार्टी ऐप भी। मैंने देखा है कि कुछ लोग इसके लिए अपने कनेक्शन स्ट्रिंग्स को कॉन्फ़िगर करने से इनकार करते हैं। फिर भी आप अपनी सटीक स्थिति के लिए बिना सोचे-समझे एक असफलता को मजबूर कर सकते हैं और दो योग्य सर्वरों के साथ संवाद करने में सक्षम नहीं हैं। और उन अनुप्रयोगों के साथ जो दोनों साइटों पर संवाद करने की अपनी क्षमता के कारण लिख रहे हैं।
एलन 16

PS मैंने एक ऐसी स्थिति देखी है जहां हम अपनी प्राथमिक साइट से एक मील से भी कम दूरी पर संपर्क नहीं कर सकते थे, लेकिन हमारी DR साइट से 100 मील दूर तक कनेक्टिविटी ने बहुत अच्छा काम किया।
एलेन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.