समस्या निवारण Nagios अलर्ट; उर्फ। मेरे अलर्ट फायरिंग क्यों नहीं हैं?

मैं एक मौजूदा Nagios इंस्टॉल में ईमेल अलर्ट जोड़ने का प्रयास कर रहा हूं। मैं कुछ महीनों के लिए कुछ गैर-महत्वपूर्ण प्रणालियों पर नज़र रखने के लिए वेब इंटरफ़ेस का उपयोग कर रहा हूं और यह अच्छी तरह से चल रहा है; इश्यू के बिना चेतावनी और गंभीर समस्याओं का पता लगाया जाता है।

मेरा अगला कदम अलर्टिंग कार्यक्षमता को सक्षम करना है, लेकिन घंटों की ललक के बावजूद मैं आग के लिए सबसे सरल चेतावनी प्राप्त करने में असमर्थ हूं । मैं विचारों से बाहर फ्लैट हूं कि क्या गलत हो सकता है। यह लगभग निश्चित रूप से कुछ सरल है जिसे मैं अभी तक लेने में विफल रहा हूं, इसलिए उम्मीद है कि आप में से कोई एक इसे आसानी से देखेगा।

मैं जिस कमांड से परीक्षण कर रहा हूं वह सरल है। प्रारंभ में मैं केवल एक फ़ाइल में लिखने की कोशिश कर रहा हूँ:

define command{
        command_name    alerter
        command_line    echo "Alerter command fired by Nagios" >> /usr/local/nagios/var/alerter.log
}

मैंने nagios का परीक्षण किया है उपयोगकर्ता sudo का उपयोग करके इस कमांड को निष्पादित कर सकता है। सब ठीक लगता है।

मेजबानों और सेवाओं के सभी 'प्रवेश' संपर्क समूह को देखें। ये वे टेम्पलेट हैं जिनका वे उपयोग करते हैं, उनमें से कोई भी इन सेटिंग्स को ओवरराइड नहीं करता है।

define host{
        name                            generic-host
        notifications_enabled           1
        event_handler_enabled           1
        flap_detection_enabled          1
        failure_prediction_enabled      1
        process_perf_data               1
        retain_status_information       1
        retain_nonstatus_information    1
        check_period                    24x7
        check_interval                  1
        retry_interval                  1
        max_check_attempts              10
        check_command                   check-host-alive
        notification_period             24x7
        notification_interval           120
        notification_options            d,u,r,s,f
        contact_groups                  admins
        register                        0
}
define service{
        name                            generic-service
        active_checks_enabled           1
        passive_checks_enabled          1
        parallelize_check               1
        obsess_over_service             1
        check_freshness                 0
        notifications_enabled           1
        event_handler_enabled           1
        flap_detection_enabled          1
        failure_prediction_enabled      1
        process_perf_data               1
        retain_status_information       1
        retain_nonstatus_information    1
        is_volatile                     0
        check_period                    24x7
        max_check_attempts              3
        normal_check_interval           1
        retry_check_interval            1
        contact_groups                  admins
        notification_options            w,u,c,r
        notification_interval           120
        notification_period             24x7
        register                        0
}

संपर्क और संपर्क समूह इस प्रकार कॉन्फ़िगर किए गए हैं:

define contact{
        name                            generic-contact
        service_notification_period     24x7
        host_notification_period        24x7
        service_notification_options    w,u,c,r,f,s
        host_notification_options       d,u,r,f,s
        service_notification_commands   alerter
        host_notification_commands      alerter
        register                        0
}
define contact{
        contact_name            nagiosadmin
        use                     generic-contact
        alias                   Nagios Admin
        email                   alerts@tekretic.tk
}
define contactgroup{
        contactgroup_name       admins
        alias                   Nagios Administrators
        members                 nagiosadmin
}

जब मैं एक आक्रोश का कारण बनता हूं तो नागिओस इसे उठाता है और इसे इस तरह से लॉग करता है ...

[1315210448] SERVICE ALERT: ifs.aleph;Test service;CRITICAL;HARD;3;HTTP CRITICAL: HTTP/1.1 400 Bad Request - string 'Blah blah' not found on 'http://aleph.tekretic.com.au:80/' - 168 bytes in 0.369 second response time
[1315210653] SERVICE ALERT: ifs.aleph;Test service;OK;HARD;3;HTTP OK: HTTP/1.1 200 OK - 416 bytes in 0.364 second response time

.. लेकिन मेरी 'alerter.log' फ़ाइल में कुछ भी लॉग नहीं है। यह ऐसा है जैसे कि एल्टर कमांड को कभी भी निकाल नहीं दिया जाता है।

मैं क्या खो रहा हूँ??

nagios troubleshooting alerts

— Molomby
स्रोत

क्या जो उपयोगकर्ता NAGIOS अवसंरचना (अक्सर nagios) चलाता है, उसे लिखने का विशेषाधिकार है /usr/local/nagios/var? आप उस मार्ग को भी हार्डकोर करने का प्रयास echoकर सकते हैं, जो अच्छी तरह से हो सकता है /bin/echo।

— 9

अनुमतियाँ मुद्दों में से एक होने का अंत किया। मैंने भी पथ को हार्डकोड किया है, लेकिन परीक्षण नहीं किया है अगर यह विशेष रूप से अंतर करता है। चीयर्स

— मोलोमबी

सुनिश्चित करें कि आपके पास निम्नलिखित हैं nagios.cfg:

log_notifications=1
enable_notifications=1

यह debug_levelदेखने के लिए कि यह क्या कहता है, यह देखने के लिए सूचनाओं को 32 तक ले जाने की कोशिश करें :

debug_level=32

— क्वांटा
स्रोत

पहले दो थे लेकिन मैं किसी तरह छूट गया debug_level। debug_verbosity=2ने भी मदद की। इन युक्तियों ने मुझे (कई!) अन्य समस्याओं का निवारण करने के लिए आवश्यक अंतर्दृष्टि प्रदान की, जिन्हें मैं अंत में काम करने से पहले मारता था। उसके लिए आपको बिग ग्रीन टिक मिलता है।

— मोलोमबी