अभिवादन,
मैं वितरित निगरानी प्रणालियों पर सामूहिक राय और विचार पूछना चाहता हूं, आप क्या उपयोग करते हैं और आप क्या जानते हैं कि मेरे बक्से पर टिक हो सकता है?
आवश्यकताएँ काफी जटिल हैं;
असफलता का एक भी बिंदु नहीं। वास्तव में। मैं गंभीर हूँ! एकल / एकाधिक नोड विफलता को सहन करने में सक्षम होने की आवश्यकता है, दोनों 'मास्टर' और 'कार्यकर्ता' और आप मान सकते हैं कि किसी भी निगरानी स्थान ("साइट") में कई नोड नहीं हैं, या एक ही नेटवर्क पर हैं। इसलिए यह शायद पारंपरिक HA तकनीकों जैसे DRBD या Keepalive को नियंत्रित करता है।
वितरित तर्क, मैं कई नेटवर्कों पर और कई महाद्वीपों पर, कई नेटवर्कों पर 5+ नोड्स तैनात करना चाहता हूं। मैं अपने नेटवर्क के "बर्ड्स आई" दृश्य और अपने ग्राहकों के दृष्टिकोण से आवेदन चाहता हूं, मॉनिटरिंग लॉजिक के लिए बोनस अंक जब आपके पास 50+ नोड्स, या यहां तक कि 500+ नोड्स नहीं होते हैं।
बॉलपार्क के आंकड़े 1500-2500 मेजबानों और प्रति मेजबान 30 सेवाओं के लिए एक उचित नागो / मेजबान चेक की एक उचित संख्या को संभालने में सक्षम होने की आवश्यकता है। यह वास्तव में अच्छा होगा यदि अधिक निगरानी नोड्स जोड़ने से आपको अपेक्षाकृत रैखिक रूप से स्केल करने की अनुमति मिलती है, शायद 5 साल के समय में मैं प्रति होस्ट 5000 होस्ट और 40 सेवाओं की निगरानी करना चाहूंगा! 'वितरित तर्क' के बारे में ऊपर मेरे नोट से जोड़ना यह कहना अच्छा होगा:
- सामान्य परिस्थितियों में, इन जांचों को मॉनिटरिंग नोड्स के $ n या n% पर चलना चाहिए।
- यदि एक विफलता का पता चला है, तो नोड्स के अन्य $ n या n% पर चेक चलाएं, परिणामों को सहसंबंधित करें और फिर उन्हें यह तय करने के लिए उपयोग करें कि क्या मानदंड चेतावनी जारी करने के लिए मिले हैं।
रेखांकन और प्रबंधन के अनुकूल सुविधाएँ। हमें अपने SLAs को ट्रैक करने की आवश्यकता है और यह जानना कि हमारे 'अत्यधिक उपलब्ध' अनुप्रयोग 24x7 हैं, कुछ हद तक उपयोगी हैं। आदर्श रूप से आपके प्रस्तावित समाधान को कम से कम फाफ के साथ "बॉक्स से बाहर" रिपोर्टिंग करनी चाहिए।
बीस्पोक चेक विकसित करने के लिए एक ठोस एपीआई या प्लगइन सिस्टम होना चाहिए।
अलर्ट के बारे में समझदार होने की जरूरत है। मैं जरूरी नहीं जानना चाहता (एसएमएस के माध्यम से, सुबह 3 बजे!) कि एक मॉनिटरिंग नोड मेरे कोर राउटर को डाउन करता है। मैं करते जानना चाहते हैं कि उनमें से एक निर्धारित प्रतिशत चाहते हैं इस बात से सहमत है कि कुछ अजीब हो रहा है;) अनिवार्य रूप से क्या मैं यहाँ के बारे में बात कर रहा हूँ "कोरम" तर्क, या वितरित पागलपन को विवेक के अनुप्रयोग है!
मैं दोनों वाणिज्यिक और खुले स्रोत विकल्पों पर विचार करने के लिए तैयार हूं, हालांकि मैं लाखों पाउंड की लागत वाले सॉफ़्टवेयर को साफ करना पसंद करूंगा :-) मैं यह स्वीकार करने के लिए भी तैयार हूं कि उन सभी बॉक्सों पर टिक नहीं हो सकता है, लेकिन सामूहिक से पूछना चाहता था कि।
जब नोड्स और उनके प्लेसमेंट की निगरानी के बारे में सोचते हैं, तो इनमें से अधिकांश यादृच्छिक आईएसपी नेटवर्क पर समर्पित सर्वर होंगे और इस तरह बड़े पैमाने पर मेरे नियंत्रण से बाहर हो जाएंगे। समाधान जो बीजीपी फ़ीड और अन्य जटिल नेटवर्किंग हरकतों पर निर्भर करते हैं, संभावना नहीं है।
मुझे यह भी इंगित करना चाहिए कि मैंने या तो नागोइस, ज़ैबिक्स और दोस्तों सहित अतीत में खुले स्रोत के अधिकांश फ्लेवरों का मूल्यांकन, तैनाती या भारी उपयोग / अनुकूलित किया है - वे वास्तव में खराब उपकरण नहीं हैं, लेकिन वे पूरी तरह से सपाट हैं " वितरित "पहलू, विशेष रूप से मेरे प्रश्न और 'बुद्धिमान' अलर्ट में चर्चा किए गए तर्क के संबंध में।
आवश्यक किसी भी बिंदु को स्पष्ट करने के लिए खुश। चियर्स दोस्तों और लड़कियों :-)