उपयोगकर्ता अपने ई-मेल पर नहीं जा सकते, सीईओ कंपनी के होम पेज पर नहीं जा सकते, और आपका पेजर केवल "911" कोड के साथ बंद हो गया। जब सब कुछ उड़ जाता है तो आप क्या करते हैं?
उपयोगकर्ता अपने ई-मेल पर नहीं जा सकते, सीईओ कंपनी के होम पेज पर नहीं जा सकते, और आपका पेजर केवल "911" कोड के साथ बंद हो गया। जब सब कुछ उड़ जाता है तो आप क्या करते हैं?
जवाबों:
पहला उत्तर शांत रहना है! मैंने सीखा कि कठिन तरीका जो अक्सर घबराहट करता है, वह चीजों को बदतर बना देता है। एक बार जब thats ने अगली चीज हासिल कर ली है तो वास्तव में यह पता लगाना है कि समस्या क्या है। सभी कोणों से उपयोगकर्ताओं और प्रबंधकों की शिकायतें आपके पास आ रही हैं, आपको बताएंगे कि वे क्या नहीं कर सकते हैं, लेकिन समस्या क्या है।
एक बार जब आप समस्या को जान लेते हैं तो आप इसे ठीक करने के लिए योजना शुरू कर सकते हैं और अपने नाराज उपयोगकर्ताओं को टाइमस्केल देना शुरू कर सकते हैं!
शांत रहो
बाहर बेकार मत करो। साँस! (डायाफ्राम से, यह मदद करता है।) यदि आपने ध्यान का अध्ययन किया है, तो यह भी मदद कर सकता है।
जब अत्यधिक तनाव का सामना करना पड़ता है तो आपका शरीर एक उड़ान-या-लड़ाई मोड में चला जाएगा, क्योंकि आपका शरीर सोचता है कि यह जीवन-या-मौत की स्थिति में है। इस समय आपका शरीर वास्तव में आपके मस्तिष्क के कुछ हिस्सों में कम रक्त पंप करेगा, तर्क जैसे कार्यों को कम करेगा। यह आपकी बुद्धि को प्रभावी ढंग से कम कर देता है, जैसे कि तर्कसंगतता के बजाय, आपके मस्तिष्क के कार्यों पर हावी होने लगता है। यदि आप कभी भी गर्मजोशी से बहस करते हैं या देखते हैं तो आप इन लक्षणों को पहचान सकते हैं क्योंकि लोगों की भावनाएं भड़क जाती हैं और तर्कसंगतता छुट्टी लेती है। बाद में, जब लोगों को शांत होने का मौका मिलता है, तो उन्हें गलती करने या गलत होने को स्वीकार करने की अधिक संभावना होगी, और दूसरे पक्ष को देखने में अधिक सक्षम होंगे, लेकिन इस समय की गर्मी में, कम।
अपने कंपार्टमेंट को बनाए रखना और आपके बारे में अपने दिमाग को बनाए रखना आपके दिमाग को पूरी क्षमता से काम करता रहेगा और यह सुनिश्चित करेगा कि आप भावनाओं और डर के बजाय सबूत और तर्क के आधार पर तर्कसंगत निर्णय लें।
ट्राइएज
सबसे कम लागत पर सबसे बड़ा लाभ प्राप्त करने के लिए सीमित संसाधनों का कुशल अनुप्रयोग यहां अत्यंत महत्वपूर्ण है। जल्द से जल्द निर्णय लें कि किन चीजों को अभी तय किया जाना है, जो थोड़ी देर (घंटों, दिनों) इंतजार कर सकते हैं, और जो अनिश्चित काल तक इंतजार कर सकते हैं। यह भी महसूस करना सीखें कि जब कोई चीज उपलब्ध नहीं है और बचत करने लायक नहीं है (जैसे कि आधा राऊटर पिघला हुआ है, भले ही यह आपका एकमात्र है, आप इसे नहीं बचा सकते हैं, एक नया खरीदें और इसे साइट पर जल्दबाजी में प्राप्त करें या ऐसा कुछ पा सकते हैं जो कर सकते हैं अंतर अस्थायी रूप से भरें)।
रिटेन सिचुएशनल अवेयरनेस
अपना ध्यान किसी दिलचस्प समस्या से या कुछ ऐसी चीज़ों से फँसाने की अनुमति दें, जिन्हें आप अभी तक समझ नहीं पाए हैं। बड़ी तस्वीर पर और काम करने वाली सबसे महत्वपूर्ण चीजों पर ध्यान केंद्रित रखें।
वैज्ञानिक विधि का प्रयोग करें
एक परिकल्पना का रूप। निर्धारित करें कि आप इस परिकल्पना का परीक्षण कैसे करेंगे। परिकल्पना का परीक्षण करने के लिए डेटा इकट्ठा करें। डेटा की पुष्टि करने के लिए भी देखें। अपनी परिकल्पना को परिष्कृत करें और जब तक कार्रवाई करने के लिए अपनी परिकल्पना में पर्याप्त आत्मविश्वास न हो, तब तक चक्र को जितनी बार आवश्यक हो दोहराएं।
व्यावहारिक हो
अब हठधर्मिता का समय नहीं है। आपदा से उबरने के दौरान यहां और वहां कुछ शॉर्टकट लेना ठीक है। यह अनिवार्य रूप से तकनीकी ऋण की प्राप्ति है। कई कंपनियों में, भयावह विफलता का मतलब है कि राजस्व का भयावह नुकसान। यह बेहतर है कि चीजों को चलाने के लिए, भले ही वह हिलती-डुलती हो, आपकी कंपनी की आजीविका को जोखिम में डाल सकती है। हमेशा की तरह, यहाँ निर्णय बहुत महत्वपूर्ण है। कभी-कभी यह एक सर्वर रैक पर इंगित एक बॉक्स प्रशंसक को चलाने के लिए समझ में आता है, कभी-कभी ऐसा नहीं होता है।
अपना ख्याल रखें
आप कब से इस आपातकाल पर काम कर रहे हैं? आपने आखिरी बार कब पानी पिया था? आखिरी बार कब खाया था? तुम कब से जागे हुए हो? अपने आप को सिर्फ इसलिए बाहर न जलाएं क्योंकि आपातकाल है, हाइड्रेटेड, खिलाया और आराम करने के लिए समय निकालें (यदि यह एक लंबी, बहु-दिवसीय स्लॉग है)।
भर्ती मदद
आपकी कंपनी में लगभग निश्चित रूप से कई प्रतिभाशाली लोग हैं, जो प्रेरित और उधार देने में सक्षम दोनों हैं। हालांकि बहुत से लोग इधर-उधर भागते हुए और एक-दूसरे के लिए परेशानी का कारण बन जाते हैं। साथ ही लोगों को एक "फ़ेडरिल" के जरिए परेशान करने से सावधान रहें। उन लोगों को ढूंढें जो पहले से ही मदद करना चाहते हैं, उन्हें लक्षित कार्यों पर काम करवाएं और सुनिश्चित करें कि लोग एक-दूसरे के साथ संवाद कर रहे हैं।
संवाद
संचार महत्वपूर्ण है। कुछ भी अज्ञात के रूप में डरावना नहीं है। जब लोग जानते हैं कि इसके अलावा कुछ नहीं टूटा है, तो एक खाली बयान कि यह एक्स घंटों में वापस आ जाएगा, केवल हल्के रूप से आश्वस्त है (एक्स घंटे बीतने के बाद भी कम आश्वस्त और चीजें अभी भी टूटी हुई हैं)। खेलने का दबाव आपको अत्यधिक आशावादी WAG समय-अनुमान देने की दिशा में आगे बढ़ा सकता है, लेकिन यह गलत कोर्स है। केवल यह मत कहो कि तुम उस पर काम कर रहे हो, बस यह मत कहो कि चीजें एक्स टाइम द्वारा तय की जाएंगी। खुले रहें, अपनी प्रक्रिया दिखाएं, अपनी प्रगति और अपनी असफलताओं को विस्तार से बताएं। समस्या के बारे में जानकारी प्रदान करें, इसे ट्रैक करने की आपकी प्रक्रिया और चीजों को ठीक करने की आपकी योजना (हालांकि माइनुटिया में लोगों को डुबोना नहीं है)। यह दिखाएं कि समस्या अचूक नहीं है, यह दिखाएं कि चीजें अंततः बनाई जाएंगी, यह दिखाएं कि समस्या पर सक्षम लोग हैं,
दहशत नहीं।
चरण 0. जाँच करें कि यह आपकी निगरानी प्रणाली नहीं है जो गलती पर है
तुरंत एक गैर-प्रत्यर्पण देश के लिए एक उड़ान बुक करें
मूल बातें पहले जांचें, यह मूर्खतापूर्ण लगता है, लेकिन जैसी चीजें
मुझे पता है कि समस्या के अपस्ट्रीम होने पर समाधान ढूंढने में बहुत समय बर्बाद हो सकता है
मैं पिंग सामान। इसके बाद क्या होता है यह पिंग के परिणामों के आधार पर बहुत भिन्न होता है।
क्षमा करें, लेकिन यह प्रश्न पहले से ही पसंदीदा sysadmin कार्टून में पूरी तरह से उत्तर दिया गया है :
RTFLF - फ्रैककिन लॉग फ़ाइल पढ़ें
(मैं इसका श्रेय नहीं ले सकता, यह सब स्कॉट हैंसेलमैन को जाता है )
अभी तक कुछ भी ठीक करने की कोशिश मत करो।
सुनिश्चित करें कि आप वास्तव में जानते हैं कि वास्तविक, अंतर्निहित, समस्या क्या है। अब चीजों को ठीक करना शुरू कर रहे हैं। यदि ठीक करने के लिए कई चीजें हैं, तो ध्यान से विचार करें कि किन चीजों में देरी हो सकती है (उम्मीद है कि अगले कार्यदिवस तक, कम से कम!) और जो बिल्कुल बिल्कुल तय होनी चाहिए।
लेकिन सबसे महत्वपूर्ण: एक बार जब सब कुछ काम कर रहा है, तो पूछें कि "सब कुछ उड़ा दिया" क्यों? आप इसे फिर से होने से रोकने के लिए क्या करने जा रहे हैं? वहाँ किसी भी चरण हैं, जो समाधान आसान अगर यह होता हैं करता दोबारा?
लोगों को बताएं, कि आप इस पर हैं और यदि संभव हो तो उन्हें इस बात का अनुमान दें कि चीजें कब सामान्य होंगी।
वास्तविक समस्या निवारण के लिए जो स्पष्ट रूप से इस बात पर निर्भर करता है कि क्या गलत है। मैं आमतौर पर विभिन्न सेवाओं के लिए "चेक स्टेटस" स्क्रिप्ट का एक संग्रह रखता हूं।
केबलिंग की जाँच करें! मैं घंटे खो दिया है जब एक साधारण Eth0 केबल स्वैप समस्या का समाधान होता है अन्य सामान की जाँच ...
आपके पास आकस्मिक योजनाएं होनी चाहिए।
आवश्यक प्रणालियों को स्वचालित विफलता या दस्तावेज और परीक्षण वसूली योजना के साथ डिज़ाइन किया जाना चाहिए।
यह प्रणाली जितनी महत्वपूर्ण है, उतनी ही अधिक लचीलापन आपको इसमें बनाने की आवश्यकता है और यह जितनी अधिक स्वचालित होनी चाहिए।
यदि आपके पास एक नहीं है, तो यह महत्वपूर्ण नहीं था, क्या यह था!
सुनिश्चित करें कि आपके फिर से शुरू का बैकअप सुरक्षित है :) फिर,
सामान्यताओं का पता लगाएं। प्रभावित होने वाली सभी प्रणालियों के लिए सामान्य बात है।
खोजो क्या बदला है। आपके संगठन में कुछ औपचारिक परिवर्तन प्रबंधन होने चाहिए।
नया आदमी कहाँ है ... मालिक कहाँ है ...? क्या उनमें से एक ने शॉर्टकट लिया? (यह सिर्फ एक त्वरित सर्वर रिबूट है, यह संभवतः क्या चोट पहुंचा सकता है)
मैं इस समस्या निवारण सूची की तरह सरल मुसीबत शूटिंग आवेदन अब सब कुछ ठीक करता है =)
कार्रवाई के एक विशिष्ट सेट प्रदान करने के लिए बयान से यह मुश्किल है। आपका पहला कदम इस पर आधारित होगा:
जाहिर है, आपको हाथ में मुद्दे के बारे में शांत और सतर्क रहने की जरूरत है। नेटवर्क समस्या निवारण के साथ आपके अनुभव ने आपको सिखाया होगा कि यह बहुत अच्छी तरह से कुछ तुच्छ हो सकता है, जैसे:
कहा जा रहा है कि, यह भी श्रेणियों में कुछ गंभीर हो सकता है:
प्रमुख घटक यह है कि आप इस मुद्दे के बारे में कितना जानते हैं। आपका संदर्भ बिंदु क्या है? (किस दृष्टिकोण से 'सिस्टम डाउन' है?)।