एक जीवित दुकान की निगरानी के अच्छे तरीके क्या हैं?


41

प्रस्तावना: हम अपने एक webshops की निगरानी का विस्तार करना चाहते हैं क्योंकि प्रदाता को PHP कॉन्फ़िगरेशन और लाइव webshop के कुछ हिस्सों के दुर्घटनाग्रस्त होने (बैकेंड और चेकआउट काम नहीं करने) से परेशानी थी। मैं यहां किसी अन्य प्रदाता के पास जाने के बारे में चर्चा नहीं करना चाहता।

जैसा कि अब हम खुद की निगरानी करने और कुछ हिस्सों की उपलब्धता की संभावनाओं के बारे में सोच रहे हैं (जैसे "क्या चेकआउट काम कर रहा है?"), सवाल यह है:

लाइव वेबसाइट की निगरानी के लिए आप कौन से उपकरण और रणनीतियाँ सुझाते हैं?

कुछ विचार:

  • क्या आप स्वचालित रूप से जांच करते हैं, अगर चेकआउट अभी भी एक लाइव वेबसाइट पर काम कर रहा है?
  • विफलता का पता लगाने के लिए निगरानी करने के लिए अच्छे पैरामीटर क्या हो सकते हैं? अंतिम आदेश <1 दिन पहले, अंतिम उपयोगकर्ता लॉगिन, ...
  • क्रोन नौकरियों का उपयोग करना: उदाहरण के लिए अंतिम आदेश की तारीख / समय के लिए जाँच करना और यदि यह बहुत पहले हो, तो ईमेल भेजें और / या मैन्युअल रूप से जाँच करें कि क्या चेकआउट अभी भी काम करता है?
  • Icinga, Uptime Robot, जैसे सॉफ्टवेयर / टूल का उपयोग ...
  • ई-मेल्स को Admins को चेतावनी देकर भेजना, ...

आपके उत्तर की प्रतीक्षा में :)


1
यहां तक ​​कि अगर यह थोड़ा "राय आधारित" दिखता है, तो मैं वास्तव में कुछ जवाब देखने के लिए उत्सुक हूं :)।
मेरियस

धन्यवाद @ मैरी, मुझे पता है कि यह व्यक्तिपरक है, लेकिन यह वैसे भी साझा करना दिलचस्प हो सकता है :)
अन्ना वोक्कल

महान प्रश्न, मैं एक ही बात सोच रहा हूँ! धन्यवाद!
वेसल से

जवाबों:


30

कुछ चीजें हैं जो आप स्वचालित कर सकते हैं।

  1. अगर दुकान के कुछ हिस्सों में काम करना बंद हो जाता है तो यूनिट परीक्षण यह पता लगाने का एक अच्छा तरीका है कि क्या कुछ कार्यशीलता अभी भी काम कर रही है।
  2. फ्रंटएंड का परीक्षण करने के लिए मैं एक दूरस्थ सर्वर पर phpQuery का उपयोग समय-समय पर कुछ प्रमुख पृष्ठों पर कुछ DOM तत्वों के लिए देखने के लिए करता हूं जैसे 'श्रेणी सूची में अभी भी उत्पाद हैं', 'होमपेज पर एक पाद * है' आदि।
  3. एक साधारण क्रोनजॉब सेट करें जो आपके होस्ट को यह देखने के लिए पिंग करता है कि क्या यह अभी भी उपलब्ध है
  4. यदि आदेश अभी भी आ रहे हैं, तो जांच करने के लिए देशी मैगनेटो ऑर्डर आरएसएस फ़ीड का उपयोग करें। उच्च यातायात की दुकानों पर शुक्रवार शाम को एक घंटे के लिए कोई आदेश नहीं एक अच्छा संकेतक है कि कुछ गड़बड़ है :)
  5. अपने भुगतान सेवा प्रदाता की निगरानी करें। नीदरलैंड में हम भुगतान से निपटने के लिए iDeal का उपयोग करते हैं। यह वेबसाइट उनके अपटाइम को प्रदर्शित करती है, आपका PSP एक समान सेवा प्रदान कर सकता है

* अगर वहाँ एक पृष्ठ पर कोई पाद लेख है कि एक PHP त्रुटि पड़ाव प्रतिपादन को इंगित कर सकता है।

ये कुछ समाधान हैं जिनका हम उपयोग कर रहे हैं। उन्हें बस कुछ सेटअप समय चाहिए और चलाने के लिए स्वतंत्र हैं।

जिस तरह से महान सवाल है, मैं वास्तव में सभी जवाबों की प्रतीक्षा कर रहा हूं!


25

मैं सैंडर के शानदार जवाब पर निम्नलिखित टिप्पणी करूंगा, जो मान लेता है कि आपने सेट अप किया है और एक निगरानी सेवा का उपयोग करता है जैसे कि Phatt *:

  • पृष्ठ पर सामग्री के लिए देखें; आमतौर पर समापन </html>टैग। मैंने before_body_endतीसरी पार्टियों (असफल अपवाद, इत्यादि) के साथ बहुत सी स्क्रिप्ट को विफल देखा है, जो एंड-यूज़र्स के लिए अदृश्य हैं लेकिन 500 स्टेटस लौटाते हैं - SEO / Google / वेबमास्टर टूल्स के लिए बहुत बुरा
  • जब एक निश्चित सीमा से ऊपर की त्रुटियां बढ़ रही हों तो आपको सूचित करने के लिए वेबमास्टर टूल सेट करें
  • पृष्ठ पर अमान्य SSL के लिए अलर्ट सेट करें
  • पृष्ठ पर जावास्क्रिप्ट त्रुटियों के लिए अलर्ट सेट करें
  • भुगतान विफल ईमेल, त्रुटि रिपोर्ट के लिए ईमेल समूहों / बीसीसी का उपयोग करें।
  • अपने कॉल सेंटर के लोगों के साथ तंग हो जाएं और सुनिश्चित करें कि उन्हें पता है कि शॉट मुद्दों को कैसे स्क्रीन करना है - वे आमतौर पर सबसे पहले इंगित करते हैं जब चीजें गलत हो रही हैं।
  • एक धीमी साइट एक डाउन साइट जितनी ही खराब है। सुनिश्चित करें कि जब आपकी साइट सामान्य से अधिक लोड होने में अधिक समय ले रही है, तो आपके अलर्ट संवेदनशील हों।
  • अपनी सभी मुख्य 3 पार्टी / होस्ट की गई सेवाओं के लिए ट्विटर फ़ीड की सदस्यता लें। जब कोई समस्या होती है, तो बड़े होस्ट के पास आमतौर पर ट्विटर ट्रिगर होते हैं। जब कुछ खाते पोस्ट करते हैं, तो आप ट्विटर को ईमेल / पाठ में कॉन्फ़िगर कर सकते हैं।

DevOps:

  • महत्वपूर्ण प्रणालियों की निगरानी और अलर्ट भेजने के लिए Nagios की स्थापना करें
  • लॉग लॉग डेटा के आधार पर लॉग एकत्र करने और अलर्ट जारी करने के लिए एक syslog या Splunk (प्रश्नों के एक निश्चित # दिन तक खाली) सेट करें
  • अपने नेटवर्क उपकरणों की एक स्क्रिप्टेड, नियमित जांच को कॉन्फ़िगर करें। मैंने देखा है (एक से अधिक अवसरों पर) एनआईसी वापस जाते हैं और 1GB से 10MB तक हमारे लिए अनजाने में छोड़ देते हैं।

बड़ी टीमों के लिए:

  • एक सीआई सर्वर (ट्रैविस, जेनकिंस / हडसन, कैपिस्ट्रानो) स्थापित करें जो आपको कमिट करने में संभावित विफल परीक्षणों से आगाह करें।
  • कोड के मानकों को लागू करने के लिए या टूटे हुए कोड जैसे स्पष्ट मुद्दों की जांच करने के लिए अपने स्रोत नियंत्रण में पूर्व-प्रतिबद्ध हुक स्थापित करें
  • जैसे सैंडर ने कहा, दिन के समय तक आरएसएस के आदेशों और मात्रा के लिए फ़ीड की निगरानी के लिए कुछ सेट करें - यहां एक लाभ यह अनकैप्ड है और आमतौर पर यदि आप अधिसूचना थ्रेशोल्ड को कम सेट करते हैं तो एक संभावित मुद्दा इसे तुरंत यात्रा करेगा।
  • सेलेनियम का उपयोग करें। बहुत। हर घंटे या दो घंटे में चेकआउट की प्रक्रिया से गुजरने वाले स्क्रिप्टेड टेस्ट करवाएं।
  • SSL समाप्ति के लिए कैलेंडर अनुस्मारक और विशिष्ट अलर्ट सेट करें

आप बहुत सारे डेटा और संभावित रूप से गलत सकारात्मक उत्पन्न करने जा रहे हैं; अलर्ट के लिए प्रतिरक्षा न बनें।


मैं Phatt से संबद्ध नहीं हूं। मैं सिर्फ उनके (मुक्त) उत्पाद से प्यार करता हूं।


8

यदि आपको केवल अपने होस्टर के साथ समस्याएं हैं और भुगतान नहीं है, तो आप एक उत्पाद स्थापित करने के बारे में सोच सकते हैं, जो छिपा हुआ है, एक सेलेनियम-परीक्षण लिखें इसे कार्ट में डाल दें इसे स्वतंत्र बनाने के लिए एक कूपन जोड़ें और फिर चेकआउट के माध्यम से कदम रखें।


1
अच्छा, मुझे छिपा हुआ मुफ्त उत्पाद विचार पसंद है :-)
अन्ना वोक्कल

5

आपके सेटअप के आधार पर यहां पहले से ही कुछ शानदार जवाब हैं। मैं सर्वर और लेन-देन के आँकड़ों की निगरानी के लिए न्यूट्रेल का उपयोग करता हूं, साथ ही चेकआउट प्रक्रिया के हर चरण के लिए महत्वपूर्ण लेनदेन स्थापित करता हूं। इस तरह, मैं अपने फोन पर एक स्क्रीन को देख सकता हूं और निर्धारित कर सकता हूं कि क्या हम अभी भी पूरी प्रक्रिया के माध्यम से लोगों की उचित मात्रा की जांच कर रहे हैं, और यदि उन्हें उचित प्रतिक्रिया समय मिल रहा है। यदि मुझे अंतिम चरण तक सब कुछ पर थ्रूपुट का एक गुच्छा दिखाई देता है, तो मुझे पता है कि पेपैल शायद टूट गया है क्योंकि कोई भी अपने कार्ड को संसाधित करने में सक्षम नहीं है। अगर बहुत सारी त्रुटियां हैं, तो प्रतिक्रिया समय बंद होने आदि के बारे में मुझे अलर्ट मिलता है। आपको ऐसा करने के लिए न्यूट्रेलिक की सख्त आवश्यकता नहीं है, लेकिन यह स्थापित करने के लिए बहुत सरल और त्वरित है और मेरे पास निर्माण के लिए समय नहीं है। मेरा अपना डैशबोर्ड / ऐप / अलर्टिंग सिस्टम।


1
मैं आपके साथ NewRelic एक आकर्षण की तरह काम करता हूं। मैं यह भी जोड़ना चाहूंगा कि सर्वर की पहुँच की निगरानी के लिए Phatt जैसी सेवा का उपयोग करना एक अच्छा विकल्प है।
एरिक

5

मुझे इसके लिए NewRelic और PagerDuty पसंद है, वे बस एक मिनट में आपकी साइट पर या आपकी साइट के किसी भी हिस्से के डाउन होने पर आपको (ईमेल, पाठ और कॉल) सूचित करते हैं। यहां तक ​​कि यह भी सूचित करता है कि आपका सीपीयू या मेमोरी गैर-जिम्मेदार साइट का उपयोग करने के निर्दिष्ट प्रतिशत से परे है या नहीं।

  • उन सभी पृष्ठों के साथ नया अवशेष सेट करें जिन्हें आप आवृत्ति की निगरानी और निगरानी करना चाहते हैं। उदाहरण: मुखपृष्ठ, कोई 1 श्रेणी पृष्ठ, कोई 1 उत्पाद पृष्ठ, कार्ट पृष्ठ, चेकआउट पृष्ठ, आदि।
  • उपयोगकर्ता (जिन्हें सभी सूचनाएं प्राप्त होती हैं), शेड्यूल (दिन और समय जब आप सूचनाएं प्राप्त करना पसंद करते हैं), सेवाएं (नए अवशेष अलर्ट) और पेजरूट अलर्ट पर अलर्ट नीतियां और इच्छित सूचनाएं (ईमेल, पाठ, कॉल)

https://www.pagerduty.com/docs/guides/new-relic-integration-guide/

अस्वीकरण: मैं उपरोक्त सेवाओं में से किसी के साथ संबद्ध नहीं हूं।



3
  • सभी सर्वरों (एलबी, ऐप, डीबी, रेडिस, आदि) और सभी सेवाओं (मेमोरी, लोड, आईओओ) के लिए ऐतिहासिक मूल्य प्राप्त करने के लिए प्रदाता पक्ष पर मुनिन।
  • सभी सर्वरों पर लाइव मॉनीटरिंग लोड के लिए प्रदाता या स्थानीय पक्ष पर नागियोस / इविंगा
  • "महत्वपूर्ण" url जैसे फ्रंट पेज, चेकआउट आदि के लिए प्रतिक्रिया समय एकत्र करने के लिए Phatt
  • वास्तविक उपयोगकर्ता की निगरानी के लिए Phatt, आपको APDEX के समान मूल्य मिलता है और ऐतिहासिक विकास को देखते हैं
  • यूआरएल और उनके सही सामग्री की जांच करने के लिए पीएसटीपी
  • ऑटो पुनः लोड मोड में अंतिम X आदेशों के साथ रिपोर्टिंग। इसके साथ मैं संभावित विराम देख सकता हूं
  • एक समान मंच प्रणाली पर सेलेनियम के साथ स्वचालित परीक्षण। मैं अपने लाइव सिस्टम पर स्वचालित चेकआउट का मित्र नहीं हूं। आपको अपने खाते की समस्याएं बाद में मिलेंगी :)
  • Email2SMS के लिए जैपियर और ट्विलियो। महत्वपूर्ण त्रुटियों को एक फोन पर एसएमएस के रूप में भेजा जाता है
  • freeboard.io और dweet.io सब कुछ एक अच्छे डैशबोर्ड पर प्रदर्शित करने के लिए।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.