आप एक निगरानी सर्वर की निगरानी कैसे करते हैं?


14

इसलिए हम अपने विभिन्न सर्वरों और प्रक्रियाओं की निगरानी के लिए CentOS पर ग्राउंडवर्क्स (नागियोस के साथ) चलाते हैं। चीजों को चेतावनी या गंभीर स्थिति तक पहुंचाने के लिए मेरे पास ईमेल और एसएमएस ग्रंथों को स्वचालित रूप से भेजने के लिए यह सेटअप है। आम तौर पर यह पूरी तरह से काम करता है। हालाँकि, दो बार हमें उस सर्वर पर पोस्टफ़िक्स के साथ समस्याएँ आईं जहाँ पोस्टफ़िक्स ने ईमेल भेजने से रोकने का फैसला किया। सबसे हाल का समय 4 दिनों तक चला क्योंकि हममें से किसी ने भी गौर नहीं किया।

यह मुझे एक महत्वपूर्ण प्रश्न की ओर ले जाता है: मैं अपने निगरानी सर्वर की निगरानी कैसे करूं?


5
क्विस कस्टोडिएट ipsos कस्टोड?
जेम्स एल

हे। Juvenal। अच्छी तरह से खेला।
आर्गेनिक वेजी डे

चौकीदार कौन देखते हैं? : D
फ्लोरेंट कोर्टे

1
@organicveggie, एक मॉनिटरिंग सर्वर भी एक सर्वर है ... मॉनिटरिंग सर्वर की निगरानी के लिए मॉनिटरिंग सर्वर का उपयोग करने से आपको किन समस्याओं का सामना करना पड़ेगा?
पचेरियर

जवाबों:


12

एक दूसरे मॉनिटरिंग सर्वर के साथ, बिल्कुल। दूसरा सबसे ज्यादा सरल हो सकता है, क्योंकि इसे करने के लिए पहले निगरानी करनी होगी। और इसकी निगरानी मुख्य निगरानी प्रणाली द्वारा की जानी चाहिए, निश्चित रूप से।

यदि आपका समूह अलग-अलग आईटी अवसंरचनाओं के साथ एक बड़े संगठन का हिस्सा है, तो आप दूसरे समूह की निगरानी सेवा के लिए आपकी व्यवस्था करने में सक्षम हो सकते हैं।

आप यह भी सुनिश्चित कर सकते हैं कि सर्वर हर दिन एक "यह ठीक है" संदेश भेजता है, और इसे देखने की आदत डालें। (यह तभी प्रभावी होगा जब आप पहले से ही नियमित संदेशों से अभिभूत न हों, निश्चित रूप से।)


14

अन्य लोग नियमित संदेश भेजने की सलाह देते हुए कहते हैं कि चीजें ठीक हैं, लेकिन व्यक्तिगत रूप से मैं इससे सहमत नहीं हूं। निगरानी तब तक मौन होनी चाहिए जब तक कि कोई समस्या न हो, और कभी भी किसी उपयोगकर्ता पर भरोसा नहीं करना चाहिए कि कुछ गलत है, जैसे "ओह, मैंने कुछ दिनों में उस दैनिक ई-मेल को प्राप्त नहीं किया है।" खासकर यदि आपके पास अलर्ट का जवाब देने वाले एक से अधिक व्यक्ति हैं, तो प्रत्येक सोच सकता है कि दूसरे ने दैनिक "आई एम ओके" संदेश हटा दिया है।

हमारे पास एक बाहरी सेवा है (जिनमें से सैकड़ों हैं, लेकिन हम कृमि का उपयोग करते हैं ) हमारे निगरानी सर्वर की HTTP जांच करने के लिए सुनिश्चित करें कि यह ऊपर है और इंटरनेट तक पहुंच सकता है। इसकी निगरानी के लिए यह हमारी प्राथमिक चिंता है। तब हमारा Nagios सर्वर हमारे सभी क्लाइंट Nagios सर्वर पर नज़र रखता है।

लेकिन, आप एक अच्छी बात लाते हैं। हमें संभवतः एक HTTP URL जोड़ना चाहिए जो पोस्टफ़िक्स कतार की जाँच करता है और यदि यह असामान्य संख्या में संदेश दिखाता है, जिसका अर्थ है कि यह कतार में कोई भी है, तो एक अलर्ट बढ़ाएँ। एक अन्य विकल्प अलर्ट के लिए विभिन्न तरीकों का उपयोग करना होगा, एक गैर-एसएमटीपी एसएमएस वितरण एजेंट और साथ ही एसएमटीपी जो हम वर्तमान में उपयोग करते हैं।

हमारे मामले में, मुझे याद नहीं आ रहा है कि हमने कभी मेल सर्वर को मरवाया है। बेशक, मेल सर्वर के लिए उपयोग होने वाले सभी नागोस अलर्ट भेज रहा है, इसलिए कॉन्फ़िगरेशन बहुत सरल है और लगभग कभी नहीं बदलता है।


2
नियमित ओके संदेश उपयोगी नहीं हैं: आप किसी व्यक्ति को प्रोत्साहन के अभाव में कार्रवाई करने के लिए मज़बूती से शर्त नहीं रख सकते।
टिम विलिसक्रॉफ्ट

@ समय: क्षमा करें, लेकिन "उत्तेजना का अभाव" उस स्थिति का वर्णन नहीं करता है जहां एक अनुमानित ईमेल प्राप्त नहीं होता है। ऐसे मामले में, मुझे विश्वास है कि मैं यह जांचने के लिए "उत्तेजित" होगा कि संदेश क्यों नहीं आया। लेकिन शायद वह सिर्फ मैं ही हूं। :)
स्टीवन सोमवार

1
मुझे लगता है कि मैं मनोवैज्ञानिक शब्दों का उपयोग कर लिख रहा हूं, जिसका मतलब यह नहीं है कि आपको लगता है कि उनका मतलब क्या है। व्यवहार मनोविज्ञान, और विमानन मनोविज्ञान में सिस्टम इंजीनियरों को बताने के लिए बहुत कुछ है। इस क्षेत्र का विकास WWII में 18-20 साल पुराने कर्मचारियों को दुर्घटनाग्रस्त हुए बिना अत्याधुनिक विमान उड़ाने के लिए किया गया था, और अभी भी उनके वास्तविक सैन्य कार्यों पर ध्यान नहीं दिया गया है। यही कारण है कि विमान में मास्टर सावधानी प्रकाश है, न कि "सब कुछ ठीक है" प्रकाश। TLDR (मुझे नहीं लगता कि इस शब्द का मतलब है कि आपको क्या लगता है इसका मतलब है)
टिम विलिसक्रॉफ्ट

1
मैं इस बात पर बहुत ज़ोर देता हूँ कि सिस्टम को तब तक शोर नहीं करना चाहिए जब तक कि कोई ऐसी चीज़ न हो जिस पर किसी इंसान का ध्यान जाए। हमारे पास ध्यान देने योग्य है, और कंप्यूटर आसानी से हमें "मैं जीवित हूँ!" जैसे छोटे ब्लिप्स के साथ अभिभूत कर सकता है। इसके अलावा, जो चीजें इसके माध्यम से आती हैं, वे समस्याओं को इंगित नहीं करती हैं जो लोगों को चीजों को अनदेखा करने के दिमाग में डालती हैं। मैं यह सुनिश्चित करने के लिए बहुत मेहनत करता हूं कि जब कोई चीज मानव के पास आती है, तो यह वह चीज है जिसे उन्हें वास्तव में देखने की जरूरत है। मैं किसी ऐसे व्यक्ति के साथ काम करता हूं जिसके पास हर दिन आने वाले सभी प्रकार के लॉग हैं जो वह समीक्षा करता है। बेशक, वह इतना व्यस्त है कि वह दोपहर के भोजन के लिए बाहर नहीं जा सकता है ...
सीन Reifschneider

1
मैं मानता हूं कि सेवाओं को बहुत अधिक संदेश नहीं भेजने चाहिए या लोग तेजी से उन्हें अनदेखा करना शुरू कर देते हैं। हालाँकि, यदि मॉनिटरिंग सिस्टम सही ढंग से सेटअप है, तो आपको बहुत सारे संदेश नहीं मिलने चाहिए। बेशक, हमारे पास ग्राउंडवर्क्स / नागियोस से अलर्ट स्वीकार करने के बारे में एक नीति है, जो संदेशों को प्रभावी ढंग से समय की अवधि के लिए रोकती है। यदि यह एक दीर्घकालिक आउटेज है, तो हम सिस्टम या सेवा के लिए निगरानी को अक्षम करते हैं। नतीजतन, एक दैनिक "आई एम अलाइव" संदेश वास्तव में बहुत उचित है।
आर्गेनिक वेजी डे

5

जाहिर है कि आपके पोस्टफिक्स की निगरानी भी की जानी चाहिए, लेकिन एक अन्य विषय;)

मैं फ़ायरफ़ॉक्स के लिए Nagios चेकर प्लगइन का उपयोग करता हूं , यह हमेशा किसी भी कंप्यूटर पर स्थिति पट्टी में चल रहा है जो मैं नियमित रूप से उपयोग करता हूं।

इसके अलावा मेरे पास बाहर की मेजबानी पर एक कस्टम स्क्रिप्ट है जो नागों के मेजबान को पिंग करती है और पिंग्स का जवाब नहीं देने पर एसएमएस भेजती है।

अब तक (5+ वर्ष) यह ठीक काम करता था (लकड़ी पर दस्तक)।


2

सर्वर मॉनिटरिंग (हमारे मामले में nagios) की निगरानी के लिए, पीएसआई या अलर्टफॉक्स की मुफ्त या बुनियादी योजना महान काम करती है।


अच्छा सुझाव है। लेकिन इस मामले में, हमारा निगरानी सर्वर फ़ायरवॉल के बाहर पहुंच योग्य नहीं है। तो Pशिया और Alertfox वास्तव में हमारे लिए काम नहीं करते हैं।
आर्गेनिक वेजी डे

1

पहली बात: इसे एक दिन में एक या दो बार "मैं जीवित हूं" संदेश भेजने दें। दूसरा, मैं इस उद्देश्य के लिए एक पुरानी मशीन चलाता हूं, जिसमें एक और जीएसएम मॉडम, एक छोटा यूपीएस आदि और प्राथमिक निगरानी सर्वर के लिए एक समर्पित (प्रत्यक्ष) कनेक्शन है। यह एक बिंदु तीन के साथ भी मदद करता है: सुनिश्चित करें कि आप नियमित रूप से अपने मॉनिटरिंग सिस्टम की स्थिति की जांच करते हैं। छोटी सहायक निगरानी प्रणाली हर समय मेरे कार्यालय में प्राथमिक प्रणाली की स्थिति पृष्ठ प्रदर्शित करती है।


1

यदि आपका मॉनिटरिंग सर्वर इंटरनेट से उपलब्ध है, तो आपके पास बाहरी प्रदाता (जैसे वेबसाइटपॉल एट अल।) द्वारा इसकी निगरानी होनी चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.