कुल लटका के कारण की जांच कैसे करें?


19

मेरी आर्क मशीन कभी-कभी लटक जाती है, अचानक माउस या कीबोर्ड पर किसी भी तरह से प्रतिक्रिया नहीं दे रही है। कर्सर जम गया है। Ctrl-Alt-Backsp X11 को बंद नहीं करेगा, और ctrl-alt-del बिल्कुल कुछ नहीं करता है। शंकु और icewm में सीपीयू, नेटवर्क और डिस्क गतिविधि भूखंड अपडेट करना बंद कर देते हैं। कुछ ही मिनटों में पंखा चालू हो जाता है। कंप्यूटर को कुछ भी करने का एकमात्र तरीका शक्ति को बंद करना है।

जब यह बूट होता है, तो सीपीयू तापमान मॉनिटर 70 से 80 सी दिखाता है। फांसी से पहले, मैं आमतौर पर कम तीव्रता वाली गतिविधि कर रहा था जैसे कि वेब सर्फिंग 50C के आसपास हो रही है।

सामान्य शटडाउन की तुलना में लॉग कुछ खास नहीं दिखाते हैं। मेमोरी चेकर शून्य दोष के साथ ठीक चलता है।

मैं कैसे जांच कर सकता हूं कि यह क्यों लटका हुआ है? क्या कोई अतिरिक्त जानकारी है जो मुझे सुराग के लिए मिल सकती है? क्या कुछ प्रकार की कार्रवाई करने के लिए पावर-ऑफ की तुलना में कुछ कम कठोर है, अगर केवल कुछ सीमित शेल या सिर्फ बीप्स हैं, लेकिन कोई सुराग दे सकता है?

मशीन एक गेटवे P6860 17 "लैपटॉप (भारी लेकिन शक्तिशाली) है और यह आर्क 64 बिट चला रहा है, तारीख तक (मार्च 2011 तक)। मेरे पास आर्क एक लंबे समय के लिए w / o इस समस्या थी, लगभग एक सप्ताह के लिए उबंटू में बदल गया। उसके बाद वापस आर्क की एक नई स्थापना के लिए पीछे हट गया।

अद्यतन: हाँ, यकीन है कि यह ज़्यादा गरम है। एक तापमान पर, माउस और कीबोर्ड काम करना बंद कर देते हैं, कभी-कभी ठंडा होने के कई मिनटों के बाद कार्यशील हो जाते हैं। उच्च तापमान पर, बदतर चीजें होती हैं, जैसे कि गैर-जवाबदेही सहित SysRq की अनदेखी करना। इस स्थिति के कुछ ही समय बाद अचानक बिजली बंद हो जाती है। मैंने एक नया कंप्यूटर 8D खरीदकर समस्या का समाधान किया है

जवाबों:


7

जादू SysRq और कर्नेल डंप से जुड़े फ्रेडरिक का जवाब काम करेगा अगर कर्नेल अभी भी चल रहा है, और वास्तव में लटका नहीं है। कर्नेल किसी कारण बस व्यस्त-लूपिंग हो सकता है।

तथ्य यह है कि यह Ctrl-Alt-Del का जवाब नहीं देता है मुझे बताता है कि शायद ऐसा नहीं है, और यह कि मशीन मुश्किल से लॉक हो रही है। इसका मतलब है कि हार्डवेयर की विफलता, या किसी करीबी ड्राइवर की तरह कुछ संबंधित।

आपकी मेमोरी चेक टेस्ट अच्छा है, अगर आप इसे लंबे समय तक चलने देते हैं। आपको सिस्टम को आज़माने और तनाव देने के लिए अन्य चीजों की भी कोशिश करनी चाहिए, जैसे StressLinux । लंबे समय तक चलने वाले बेंचमार्क भी अच्छे हैं।

कोशिश करने के लिए एक और चीज उबंटू लाइव सीडी के साथ सिस्टम को बूट कर रही है और सिस्टम को सामान्य रूप से उपयोग करने की कोशिश कर रही है। यदि उबंटू में अस्थायी रूप से लौटना जैसे समस्या का कारण नहीं है, तो यह एक अच्छा मौका है कि यह वास्तव में हार्डवेयर नहीं टूटा है, लेकिन एक खराब ड्राइवर या गलत तरीके से कॉन्फ़िगर कर्नेल जैसी संबंधित चीजों में से एक है। यह काफी संभव है कि उबंटू जैसा अधिक लोकप्रिय वितरण आर्क जैसे एक से अधिक स्थिर कर्नेल कॉन्फ़िगरेशन हो सकता है, बस इसे दूर के परीक्षण चरण के दौरान मशीनों की अधिक संख्या के कारण आजमाया गया है।


मुझे विश्वास है कि Ctrl-Alt-Delete को init द्वारा नियंत्रित किया जाता है, इसलिए यह तब भी काम नहीं कर सकता है जब कर्नेल अभी भी करता है। OTOH के बाद कर्नेल घबराहट के बाद SysRq कुंजी की प्रतीक्षा नहीं करता है।
jpc

1
यह संभव है। मामलों को भेद करने के लिए, ctrlaltdel hardअपनी /etc/rc.localफ़ाइल में रखें। जब सिस्टम लॉक हो जाता है, तो Ctrl-Alt-Del आज़माएं। यदि यह अभी भी कुछ नहीं करता है, तो आप यह सुनिश्चित करने के लिए जानते हैं कि कर्नेल अब नहीं चल रहा है; आपके पास हार्डवेयर या ड्राइवर विफलता है।
वॉरेन यंग

1
मैं kernels जादू sysRq कुंजी का जवाब दिया है, भले ही यह घबरा गया था। Kdump सेवा का उचित सेटअप सुनिश्चित करना चाहिए कि पूरी तरह से wedged सिस्टम kdump कर्नेल में बूट करता है, इसलिए इसे अंततः वापस होना चाहिए।
jsbillings

1
कर्नेल कीबोर्ड हैंडलिंग कोड के माध्यम से एक त्वरित प्रहार के बाद, यह मुझे लगता है कि Ctrl-Alt-Del और जादू SysRq को एक ही स्तर पर संभाला जाता है: यदि एक काम करता है, तो दूसरी इच्छाशक्ति। Init (1) / SIGINT समस्या अलग है, और हार्ड रिबूट करने के लिए Ctrl-Alt-Del हैंडलिंग सेट करके निपटा है, जैसा कि मेरी अन्य टिप्पणी में उल्लेख किया गया है।
वॉरेन यंग

11

फ्रीज के संबंध में, कुछ विकल्प हैं:

  • एक सीरियल पोर्ट का उपयोग करते हुए यदि आपके बॉक्स में console=ttyS0बूट विकल्प में जोड़कर वहां डंप प्राप्त करने के लिए एक है , जैसा कि यहां वर्णित है । डंप फ़ाइल को पकड़ने के लिए आपको सीरियल पोर्ट और नल मॉडेम केबल के साथ दूसरी मशीन की आवश्यकता होती है।

  • नेटवर्क पर डंप प्राप्त करने के लिए netconsole का उपयोग करना, यहां देखें

  • इस तरह से kexec / kdump का उपयोग करके आपको एक स्थानीय डंप मिलता है, यहां देखें

स्वच्छ बिजली की समस्या के बारे में, मेरा सुझाव है कि आप जादू SysRq कुंजी का उपयोग 'S'ync डिस्क', 'उन्हें' करें, और फिर बॉक्स को फिर से खोलें (अक्षर वे हैं जिन्हें आपको टाइप करना चाहिए -sysrq।

संपादित करें: यदि आप lkml में oops / ट्रेस पोस्ट करते हैं, तो आपको कर्नेल और कोई मालिकाना मॉड्यूल के हाल के (अधिमानतः नवीनतम) संस्करण का उपयोग करना चाहिए।


1
मैं बहुत सारी युवा आवाज़ों की कल्पना कर सकता हूं जो कह रही हैं "सीरियल पोर्ट, दादा?" वास्तव में, मुझे नहीं लगता कि यह मशीन एक भी है।
डैरनव

मुझे कुछ साल पहले SysReq के बारे में कुछ पढ़ना याद है। अगर केवल मैं ही इसे गूगल कर सकता था जब मशीन मर जाती है! मुझे लगता है मैं बेहतर एक दूसरी मशीन की स्थापना में व्यस्त हो जाएगा ...
डैरन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.