हाल ही में, मैंने कुछ ड्रुपल साइटों पर कुछ डाउनटाइम का सामना किया है जिन्हें मैंने तैनात किया है। मैं समस्या को सेवाओं या सर्वर से पुनः आरंभ करके उन डाउनटाइम्स पर प्रतिक्रिया करने के बजाय प्रो-सक्रिय रूप से संपर्क करना चाहूंगा। मैंने आपके सर्वर / अवसंरचना के स्वास्थ्य की निगरानी के लिए नगियोस, मुनिन, कैक्टी, आदि जैसे उपकरणों की निगरानी के बारे में पढ़ा है, लेकिन मैंने वास्तव में उत्पादन में एक की कोशिश नहीं की है। मैं Drupal के साथ लगभग 99% बार व्यवहार करता हूं, और मैं सर्वर स्तर की निगरानी और Drupal (एप्लिकेशन कोड) स्तर की निगरानी दोनों के लिए सुझाव प्राप्त करना चाहता हूं।
मूल रूप से, मुझे सूचित किया जाना चाहिए जब सर्वर लोड अधिक होता है, संभवतः अपराधी (या पीड़ित) को इंगित किया जा रहा है, ताकि मैं सूचित निर्णय ले सकूं। मैं यह भी जानना चाहूंगा कि जब कोई PHP त्रुटि / चेतावनी होती है, तो लोग Drupal स्तर की निगरानी (जैसे ईमेल) के लिए क्या उपयोग करते हैं। (क्या होता है जब ईमेल सर्वर ही डाउन हो जाता है?)