6 घंटे तक डिबग करने के बाद - मैं यह दे रहा हूँ: |
हमारे पास लगभग 100 वर्डप्रेस के साथ लैन में एक nginx + php-fpm + mysql है (परीक्षण वर्डप्रेस सेटअप पर काम करने वाले सभी डिजाइनरों / डेवलपर्स द्वारा बनाया और उपयोग किया जाता है)
हम लंबे समय से बिना किसी मुद्दे के nginx का उपयोग कर रहे हैं।
आज, अचानक - नग्नेक्स ने नीले रंग से "504 गेटवे टाइम-आउट" लौटाना शुरू कर दिया ...
मैंने वर्चुअल होस्ट के लिए nginx त्रुटि लॉग की जाँच की ...
2010/09/06 21:24:24 [error] 12909#0: *349 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /favicon.ico HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 21:25:11 [error] 12909#0: *349 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /favicon.ico HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 21:25:11 [error] 12909#0: *443 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /info.php HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 21:25:12 [error] 12909#0: *443 connect() failed (111: Connection refused) while connecting to upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /favicon.ico HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 22:08:32 [error] 12909#0: *1025 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET / HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 22:09:33 [error] 12909#0: *1025 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /favicon.ico HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 22:09:40 [error] 12909#0: *1064 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /info.php HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 22:09:40 [error] 12909#0: *1064 connect() failed (111: Connection refused) while connecting to upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /favicon.ico HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 22:24:44 [error] 12909#0: *1313 upstream timed out (110: Connection timed out) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET / HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
2010/09/06 22:24:53 [error] 12909#0: *1313 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 192.168.0.1, server: rahul286.rtcamp.info, request: "GET /favicon.ico HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "rahul286.rtcamp.info"
जैसा कि मैंने TCP मोड के माध्यम से पोर्ट 9000 पर php-fpm चलाया है, मैंने "netstat | grep 9000" चलाया और कुछ असामान्य देखा ... (पढ़ने में आसानी के लिए आंशिक उत्पादन यहाँ पेस्ट करना)
tcp 9 0 localhost:9000 localhost:36094 CLOSE_WAIT 14269/php5-fpm
tcp 0 0 localhost:46664 localhost:9000 FIN_WAIT2 -
tcp 1257 0 localhost:9000 localhost:36135 CLOSE_WAIT -
tcp 1257 0 localhost:9000 localhost:36125 CLOSE_WAIT -
tcp 9 0 localhost:9000 localhost:36102 CLOSE_WAIT 14268/php5-fpm
tcp 0 0 localhost:46662 localhost:9000 FIN_WAIT2 -
tcp 745 0 localhost:9000 localhost:46644 CLOSE_WAIT -
tcp 0 0 localhost:46658 localhost:9000 FIN_WAIT2 -
tcp 1265 0 localhost:9000 localhost:46607 CLOSE_WAIT -
tcp 0 0 localhost:46672 localhost:9000 ESTABLISHED 12909/nginx: worker
tcp 1257 0 localhost:9000 localhost:36119 CLOSE_WAIT -
tcp 1265 0 localhost:9000 localhost:46613 CLOSE_WAIT -
tcp 0 0 localhost:46646 localhost:9000 FIN_WAIT2 -
tcp 1257 0 localhost:9000 localhost:36137 CLOSE_WAIT -
tcp 0 0 localhost:46670 localhost:9000 ESTABLISHED 12909/nginx: worker
tcp 1265 0 localhost:9000 localhost:46619 CLOSE_WAIT -
tcp 1336 0 localhost:9000 localhost:46668 ESTABLISHED -
tcp 0 0 localhost:46648 localhost:9000 FIN_WAIT2 -
tcp 1336 0 localhost:9000 localhost:46670 ESTABLISHED -
tcp 9 0 localhost:9000 localhost:36108 CLOSE_WAIT 14274/php5-fpm
tcp 1336 0 localhost:9000 localhost:46684 ESTABLISHED -
tcp 0 0 localhost:46674 localhost:9000 ESTABLISHED 12909/nginx: worker
tcp 1336 0 localhost:9000 localhost:46666 ESTABLISHED -
tcp 1257 0 localhost:9000 localhost:46648 CLOSE_WAIT -
tcp 1336 0 localhost:9000 localhost:46678 ESTABLISHED -
tcp 0 0 localhost:46668 localhost:9000 ESTABLISHED 12909/nginx: wo
"CLOSE_WAIT" और "FIN_WAIT2" जोड़े बहुत नीचे दिए गए हैं (ऊपर आउटपुट में):
tcp 1337 0 localhost:9000 localhost:46680 CLOSE_WAIT -
tcp 0 0 localhost:46680 localhost:9000 FIN_WAIT2 -
कृपया ऊपर 46680 पोर्ट नोट करें।
मैंने mysql को धीमी क्वेरी त्रुटि लॉग सक्षम किया, लेकिन यह काम नहीं किया।
अब के रूप में php5-fpm को हर मिनट एक क्रोनजोब के माध्यम से फिर से शुरू करना (नीचे कमांड देखें) सब कुछ "सुचारू रूप से" चल रहा है, लेकिन मैं पैचवर्क से नफरत करता हूं और इसे हल करना चाहता हूं ...
1 * * * * service php5-fpm restart > /dev/null
मैंने Google पर बड़े पैमाने पर खोज की - कोई मदद नहीं मिली। जैसा कि उल्लेख किया गया है, लैन में यह एक परीक्षण-सर्वर, सीपीयू लोड कभी भी 0.10 को पार नहीं करता है और मेमोरी का उपयोग भी 25% से कम है (सिस्टम में 2 जीबी रैम और ubuntu- सर्वर स्थापित है) इसलिए यदि आपको इसका समय-भ्रामक लगता है तो कृपया मेरी मदद करें। कम से कम एक संकेत छोड़ दें।
सहायता के लिए अग्रिम धन्यवाद।
-Rahul
(नोट - यह रीपोस्टिंग है - http://forum.nginx.org/read.php?11,12769494 )
अद्यतन: मुझे उत्तर मिला, जो नीचे पोस्ट किया गया है।