अब हम लगभग दो साल से ऐमज़ॉन AWS इन्फ्रास्ट्रक्चर के लिए एक दो वेबसाइट चला रहे हैं और लगभग दो दिन पहले वेबसर्वर ने एक या दो बार एक दिन में एक ही त्रुटि के साथ नीचे जाना शुरू कर दिया है जो मुझे मिल सकता है:
HTTP/1.1 503 Service Unavailable: Back-end server is at capacity
क्लाउडवर्च द्वारा कोई अलार्म (सीपीयू / डिस्क आईओ / डीबी कॉन) चालू नहीं किया जा रहा है। मैंने लोचदार आईपी के माध्यम से ईएलबी को छोड़ने के लिए साइट पर जाने की कोशिश की और यह मिल गया:
HTTP request sent, awaiting response... Read error (Connection reset by peer) in headers. Retrying.
मुझे अपाचे लॉग में साधारण से कुछ भी दिखाई नहीं देता और सत्यापित किया गया कि उन्हें ठीक से घुमाया जा रहा है। एसएसएच के माध्यम से "डाउन" होने पर मुझे मशीन तक पहुंचने में कोई समस्या नहीं है और प्रक्रिया सूची को देखते हुए मुझे 151 अपाचे 2 प्रक्रियाएं दिखाई देती हैं जो मुझे सामान्य लगती हैं। अपाचे को दोबारा चालू करने से समस्या ठीक हो जाती है। यह मशीन एक ईएलबी के पीछे एक वेबसर्वर के रूप में काम करती है। किसी भी सुझाव के लिए बहुत आभार होगा।
CPU उपयोग औसत: 7.45%, न्यूनतम: 0.00%, अधिकतम: 25.82%
मेमोरी उपयोग औसत: 11.04%, न्यूनतम: 8.76%, अधिकतम: 13.84%
स्वैप उपयोग औसत: एन / ए, न्यूनतम: एन / ए, अधिकतम: एन / ए
डिस्क स्पेस यूटिलाइजेशन के लिए / dev / xvda1 पर घुड़सवार / औसत: 62.18%, न्यूनतम: 53.39%, अधिकतम: 65.49%
मुझे स्पष्ट करना चाहिए कि मुझे लगता है कि यह मुद्दा व्यक्तिगत EC2 उदाहरण के साथ है न कि ELB मैं केवल इस बात पर शासन नहीं करना चाहता था कि मैं इलास्टिक आईपी तक पहुंचने में असमर्थ था। मुझे संदेह है कि ईएलबी केवल वास्तविक ईसी 2 उदाहरण को मारने के परिणामों को वापस कर रहा है।
अपडेट: 2014-08-26 मुझे जल्द ही इसे अपडेट करना चाहिए था लेकिन "फिक्स" को "खराब" उदाहरण का स्नैपशॉट लेना था और परिणामस्वरूप एएमआई शुरू करना था। यह तब से नीचे नहीं गया है। जब मैंने अभी भी समस्याओं का सामना कर रहा था तब स्वास्थ्य जांच को देखा और curl http://localhost/page.html
जब मैं लोड बैलेंसर से क्षमता के मुद्दे प्राप्त कर रहा था तब भी स्वास्थ्य जांच पृष्ठ ( ) पर जा सकता था। मुझे विश्वास नहीं हो रहा है कि यह एक स्वास्थ्य जांच मुद्दा था, लेकिन चूंकि कोई भी, अमेज़ॅन सहित, एक बेहतर जवाब प्रदान नहीं कर सकता है जिसे मैं उत्तर के रूप में चिह्नित कर रहा हूं। धन्यवाद।
अद्यतन: २०१५-०५-०६ मुझे लगा कि मैं यहां वापस आऊंगा और कहूंगा कि इस मुद्दे का जो हिस्सा अब मुझे विश्वास है कि स्वास्थ्य जांच सेटिंग थी। मैं एएमआई के साथ उनकी समस्या होने से इंकार नहीं करना चाहता क्योंकि एएमआई लॉन्च होने के बाद यह निश्चित रूप से बेहतर हो गया था, लेकिन मुझे पता चला कि हमारे स्वास्थ्य की जाँच प्रत्येक लोड बैलेंसर के लिए अलग-अलग थी और यह कि सबसे अधिक परेशानी हो रही थी वास्तव में आक्रामक अस्वास्थ्यकर दहलीज और प्रतिक्रिया मध्यांतर था। हमारा ट्रैफ़िक अप्रत्याशित रूप से बढ़ता है और मुझे लगता है कि आक्रामक स्वास्थ्य जांच सेटिंग और ट्रैफ़िक में स्पाइक्स के बीच यह एक आदर्श तूफान था।