LInux: मैं "यादृच्छिक" हैंग और सहज रिबूट के कारण क्या है / कैसे निदान / अलग करता हूं?


19

(मूल रूप से पोस्ट पर serverfault )

इसलिए, केवल यह अनुमान लगाने के बजाय कि क्या कारण है (हालांकि मेरे पैसे की एनवीडिया ड्राइवरों पर), मैं कुछ तथ्यों को कहां से ढूंढना शुरू करूं?

मैं कई अवसरों पर / var / log के माध्यम से गया हूँ, लेकिन वहाँ सामान की एक बहुत है और मैं (अभी तक) महत्वपूर्ण बिट्स हाजिर नहीं कर सकते।


पृष्ठभूमि: लघु संस्करण

मैं WinXP से उबंटू कार्मिक में उपलब्ध होने के बाद ही चला गया।

तब से मेरे पास एक श्रृंखला है मालूम होता है यादृच्छिक दुर्घटनाओं जो या तो प्रकट होती हैं:

  • एक सहज रिबूट
  • मेरे यूएसबी कीबोर्ड और माउस के साथ एक पूर्ण लॉकअप अनुत्तरदायी हो रहा है (ठीक नीचे वह सभी एलईडी बंद कर देता है)। इसके अलावा, मैं आमतौर पर बॉक्स में ssh करने में असमर्थ हूँ जब ऐसा होता है।

मैंने बहुत खोज की है और एनवीडिया प्रमुख संदिग्ध प्रतीत होता है, लेकिन मुझे नहीं पता कि वास्तविक कारण क्या है, जहां काम करना शुरू करना है।

एक सर्वरफॉल्ट उपयोगकर्ता ने मेमटेक्स्टएक्स 86 + के साथ रैम की जांच करने का सुझाव दिया। कोई त्रुटि नहीं मिली। वीडियो कार्ड तापमान की निगरानी का भी सुझाव दिया गया है, जिसे मैं अभी देख रहा हूं।

के अलावा, किसी को सुझाव?



पृष्ठभूमि: लंबा संस्करण

कभी-कभी, मैं एक दुर्घटना के बिना पूरे सप्ताह जा सकता हूं फिर 2 दिनों में 5 हो सकते हैं।

संभावित संदिग्धों को खत्म करने की इच्छा से प्रेरित, मैंने समय के साथ बिना किसी लाभ के कुछ बदलाव किए हैं:

  • मूल रूप से मैंने वर्चुअलाइजेशन के लिए KVM का उपयोग किया है, मैं अब VirtualBox OSE का उपयोग करता हूं
  • मेरे पास NFS कर्नेल में चल रहा था लेकिन अब सांबा का उपयोग करें
  • मैं Compiz का उपयोग कर रहा था, लेकिन तब से बंद है
  • मैंने 64-बिट कार्मिक से 32-बिट (साथ ही अन्य कारणों के लिए) रोल किया है
  • मैंने उबंटू, कुबंटू और जुबांटु की कोशिश की है। हर बार एक ही परेशानी (हालांकि देर से यह XFCE की तुलना में सूक्ति में अधिक बार लगता है)।
  • मैंने एनवीडिया चालक को संस्करण 185 से वापस संस्करण 96 (NVIDIA Linux x86 कर्नेल मॉड्यूल 96.43.13 Thu Jun 25 18:42:21 PDT 2009) में रोल किया। इस लगता है त्रुटि की आवृत्ति को कम करने के लिए।


उस समय क्या चल रहा है, इसके संदर्भ में, यह अलग-अलग हो सकता है। निम्नलिखित सामान्य हैं लेकिन जरूरी नहीं कि हर दुर्घटना के लिए चल रहे हों:

  • फ़ायरफ़ॉक्स 3.5
  • वर्चुअलबॉक्स OSE 1 या 2 Windows XP VMs के साथ
  • स्काइप
  • रिदमबॉक्स या एक्साईल


मेरा हार्डवेयर 2 - 3 साल पुराना है:

  • कोर 2 डुओ 6300
  • 4 जीबी रैम
  • उस विंटेज के इंटेल मदरबोर्ड की कुछ नस्ल
  • Nvidia GeForce 7300 GS चिपसेट के साथ आसुस ड्यूल-हेड वीडियो कार्ड
  • 2 एक्स एसएटीए एचडीडी
  • दोहरे मॉनिटर (इसलिए मैं मालिकाना एनवीडिया ड्राइवरों पर भरोसा करता हूं)


मैं अपने सिस्टम अपडेट के साथ चालू रख रहा हूं।

उम्मीद है कि ऊपर दिया गया डेटा किसी को एक विशेष प्रकार के लॉग या कॉन्फ़िगरेशन का सुझाव देने के लिए संकेत दे सकता है जो जांच के लायक होगा।


अपडेट १

बस एक दुर्घटना थी जिसमें वक्ताओं पागल हो गए। क्या कुछ गुगली हुई और ऐसा लगता है कि पल्सएडियो के अतीत में कुछ मुद्दे रहे हैं। अभी तक यकीन नहीं है कि यह प्रासंगिक है, लेकिन पल्सएडियो हर बार मेरे दुर्घटनाग्रस्त होने पर चल रहा होगा।


अपडेट २

@ कार्लियन के डेबियन सिसाडमिन गाइड के लिंक के बाद मुझे मैजिक सिसरक की ओर ले गया, जिसे मैं अगले दुर्घटना में आजमाऊंगा। ऐसा नहीं है कि यह मुझे कारण के रूप में बहुत सुराग दे देंगे, लेकिन कम से कम मैं उम्मीद है कि इनायत बंद करने में सक्षम हो जाएगा।


अपडेट ३

lm-Sensors मेरे GPU को लगभग 70C / 158F - दिलचस्प पर चलने की सूचना देता है। अगर मुझे लगता था कि मैं कहूंगा कि यह एक महत्वपूर्ण सुराग है।


अद्यतन ४

मेरे अंतिम अद्यतन के तुरंत बाद एक एयर डस्टर के साथ सिस्टम के इनसाइड को मारो - शुद्ध परिणाम: तब से केवल एक दुर्घटना। मैं इसे एक थर्मल समस्या कह रहा हूँ।


3
उत्कृष्ट स्वरूपण और पृष्ठभूमि की जानकारी, काश सभी प्रश्न इस तरह होते। +1।
John T

जवाबों:


8

यहाँ डेबियन एडमिनिस्ट्रेटर गाइड से अच्छी सलाह है: http://www.debian-administration.org/articles/492


यह देखने के लिए दिलचस्प है कि गैर-सूचनात्मक लॉग के बारे में उनका क्या कहना है, जो वास्तविक हार्डवेयर परेशानी का संकेत है। मेरे पास अंतिम / var / लॉग / संदेश प्रविष्टि और रिबूट के बीच छह घंटे का अंतर है। Hmmmm।
LRE

इस आधार पर स्वीकार किया जाता है कि लिंक ने स्पष्ट कर दिया है कि लॉग में कुछ भी हार्डवेयर समस्या के बराबर नहीं है - मुझे सही दिशा में ले जाए।
LRE

4

अगर बूट के दौरान हार्डवेयर की समस्या है, तो आप पहली चीज को देखना चाहते हैं। बूटअप प्रक्रिया कर्नेल रिंग बफर से डेटा लॉग इन करेगी /var/log/boot.log। सिस्टम बूट हो जाने के बाद, नए संदेश इस बफर में फ्लश हो जाते हैं और आप देख सकते हैं कि यह वर्तमान स्थिति है dmesg आदेश। एक महत्वपूर्ण लॉग जिसे आप जांचना चाहते हैं वह है /var/log/messages। इसमें टाइमस्टैम्प, सुविधाएं और त्रुटियों की प्राथमिकता और उन्हें उत्पन्न करने वाले अनुप्रयोग शामिल होंगे। त्रुटियों को डीबग करते समय उपलब्ध समय स्टैम्प एक अमूल्य संपत्ति है।

यादृच्छिक लॉकअप निश्चित रूप से हार्डवेयर से संबंधित है, हालांकि। मदरबोर्ड पर सभी हार्डवेयर को फिर से शुरू करने का प्रयास करें और इसे दें Memtest86 + चलाते हैं।


मुझे / var / log / संदेशों में एक पंक्ति दिखाई देती है जो कहती है "imklog 4.2.0, log source = / var / run / rsyslog / kmsg start"। क्या यह सिस्टम बूट का एक अच्छा संकेतक है? यदि ऐसा है तो मैं लॉग के एक क्षेत्र को इंगित करने के लिए उस का उपयोग कर सकता हूं जिसे मैं वापस स्कैन कर सकता हूं।
LRE

हां, मेरा मानना ​​है कि यह पहले में से एक है, अगर बूट के बाद पहली पंक्ति नहीं है। यह कर्नेल लॉग इनपुट मॉड्यूल है।
John T

2

क्या आपने अपनी मेमोरी, प्रोसेसर और अन्य चिप्स को फिर से बैठने की कोशिश की है? इसके अलावा, आप कुछ संभावनाओं को खत्म करने के लिए एक और ओएस (फ्रीडोस) चलाने की कोशिश कर सकते हैं।

एक टिप के रूप में, आपको एनवीडिया ड्राइवरों का उपयोग किए बिना गनोम के माध्यम से दो मॉनिटरों का उपयोग करने में भी सक्षम होना चाहिए।


सबसे अच्छा मैं यह बताने में सक्षम हूं कि मुझे निश्चित रूप से दोहरे मॉनिटर का उपयोग करने के लिए एनवीडिया मालिकाना ड्राइवरों की आवश्यकता है। आप मुझे सही दिशा में उनकी आवश्यकता न होने की ओर संकेत कर सकते हैं?
LRE

मैं गलत हो सकता हूं। मैंने थोड़ा सा आसन किया है, और xinerama (जो मुझे लगता है कि ड्राइवर के लिए एक्सटेंशन है) के संदर्भ देखें, लेकिन गैर-मालिकाना चालक से संबंधित कुछ भी नहीं। दुर्भाग्य से, मेरे पास आसपास खेलने के लिए nVidia कार्ड वाली मशीन नहीं है।
Nerdfest
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.