मैं एक मौजूदा Nagios इंस्टॉल में ईमेल अलर्ट जोड़ने का प्रयास कर रहा हूं। मैं कुछ महीनों के लिए कुछ गैर-महत्वपूर्ण प्रणालियों पर नज़र रखने के लिए वेब इंटरफ़ेस का उपयोग कर रहा हूं और यह अच्छी तरह से चल रहा है; इश्यू के बिना चेतावनी और गंभीर समस्याओं का पता लगाया जाता है।
मेरा अगला कदम अलर्टिंग कार्यक्षमता को सक्षम करना है, लेकिन घंटों की ललक के बावजूद मैं आग के लिए सबसे सरल चेतावनी प्राप्त करने में असमर्थ हूं । मैं विचारों से बाहर फ्लैट हूं कि क्या गलत हो सकता है। यह लगभग निश्चित रूप से कुछ सरल है जिसे मैं अभी तक लेने में विफल रहा हूं, इसलिए उम्मीद है कि आप में से कोई एक इसे आसानी से देखेगा।
मैं जिस कमांड से परीक्षण कर रहा हूं वह सरल है। प्रारंभ में मैं केवल एक फ़ाइल में लिखने की कोशिश कर रहा हूँ:
define command{
command_name alerter
command_line echo "Alerter command fired by Nagios" >> /usr/local/nagios/var/alerter.log
}
मैंने nagios का परीक्षण किया है उपयोगकर्ता sudo का उपयोग करके इस कमांड को निष्पादित कर सकता है। सब ठीक लगता है।
मेजबानों और सेवाओं के सभी 'प्रवेश' संपर्क समूह को देखें। ये वे टेम्पलेट हैं जिनका वे उपयोग करते हैं, उनमें से कोई भी इन सेटिंग्स को ओवरराइड नहीं करता है।
define host{
name generic-host
notifications_enabled 1
event_handler_enabled 1
flap_detection_enabled 1
failure_prediction_enabled 1
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1
check_period 24x7
check_interval 1
retry_interval 1
max_check_attempts 10
check_command check-host-alive
notification_period 24x7
notification_interval 120
notification_options d,u,r,s,f
contact_groups admins
register 0
}
define service{
name generic-service
active_checks_enabled 1
passive_checks_enabled 1
parallelize_check 1
obsess_over_service 1
check_freshness 0
notifications_enabled 1
event_handler_enabled 1
flap_detection_enabled 1
failure_prediction_enabled 1
process_perf_data 1
retain_status_information 1
retain_nonstatus_information 1
is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 1
retry_check_interval 1
contact_groups admins
notification_options w,u,c,r
notification_interval 120
notification_period 24x7
register 0
}
संपर्क और संपर्क समूह इस प्रकार कॉन्फ़िगर किए गए हैं:
define contact{
name generic-contact
service_notification_period 24x7
host_notification_period 24x7
service_notification_options w,u,c,r,f,s
host_notification_options d,u,r,f,s
service_notification_commands alerter
host_notification_commands alerter
register 0
}
define contact{
contact_name nagiosadmin
use generic-contact
alias Nagios Admin
email alerts@tekretic.tk
}
define contactgroup{
contactgroup_name admins
alias Nagios Administrators
members nagiosadmin
}
जब मैं एक आक्रोश का कारण बनता हूं तो नागिओस इसे उठाता है और इसे इस तरह से लॉग करता है ...
[1315210448] SERVICE ALERT: ifs.aleph;Test service;CRITICAL;HARD;3;HTTP CRITICAL: HTTP/1.1 400 Bad Request - string 'Blah blah' not found on 'http://aleph.tekretic.com.au:80/' - 168 bytes in 0.369 second response time
[1315210653] SERVICE ALERT: ifs.aleph;Test service;OK;HARD;3;HTTP OK: HTTP/1.1 200 OK - 416 bytes in 0.364 second response time
.. लेकिन मेरी 'alerter.log' फ़ाइल में कुछ भी लॉग नहीं है। यह ऐसा है जैसे कि एल्टर कमांड को कभी भी निकाल नहीं दिया जाता है।
मैं क्या खो रहा हूँ??
nagios
) चलाता है, उसे लिखने का विशेषाधिकार है/usr/local/nagios/var
? आप उस मार्ग को भी हार्डकोर करने का प्रयासecho
कर सकते हैं, जो अच्छी तरह से हो सकता है/bin/echo
।