क्या यह किसी कर्नेल कीड़े के कारण हो सकता है? विशेष रूप से स्पिन लॉक


-1

हम Intel (R) Xeon (R) CPU E5620 @ 2.40GHz पर हार्डवेयर RAID के साथ 48 GB RAM समर्पित सर्वर के साथ 2.6.38-13-13-जेनरिक कर्नेल के साथ ubuntu 11.04 चला रहे हैं ।

शीर्ष कमांड आउटपुट कई कर्नेल थ्रेड को विभिन्न कोर पर चल रहा है।

धागा संख्या

  • ksoftirqd - 16 (प्रत्येक कोर पर एक)

  • कर्मकार - ३५

  • प्रवासन - 16 (प्रत्येक कोर पर एक)

हमने पहले से ही दो फ्रीज़ का अनुभव किया और मशीन को फिर से शुरू करने के लिए मजबूर किया, दोनों तब हुए जब हमने .htaccess में संशोधन किया और फिर अपाचे को पुनः लोड किया।

Syslog पर General Security Fault अंतिम लॉग लॉग था।

पुनः आरंभ करने के बाद हार्डक पर अधिकांश डेटा 0 बाइट्स बन गए। पुनः आरंभ करने के तुरंत बाद 2.5 जीबी डाटा 30 एमबी में बदल गया। :(

क्या यह किसी कर्नेल बग के कारण है। kernel.org पर 2.6.38-13 को एक स्थिर रिलीज के रूप में सूचीबद्ध नहीं किया गया है। क्या इसका मतलब यह है कि हमें वर्तमान कर्नेल से किसी भी स्थिर संस्करण में बदलने की आवश्यकता है ?? यदि ऐसा है तो हमें किस कर्नेल का चयन करना चाहिए?

syslog उत्पादन

यह एक कर्नेल स्पिनलॉक मामला नहीं है

2 मई 22:34:01 416831 CRON [19206]: (रूट) CMD (मार / घर / व्यवस्थापक / लॉग-बच्चे)

2 मई 22:34:11 416831 कर्नेल: [3715446.033031] सामान्य सुरक्षा दोष: 0000 [# 1] एसएमपी

2 मई 22:34:11 416831 कर्नेल: [3715446.054726] अंतिम sysfs फ़ाइल: / sys / devices / system / cpu / cpu15 / cache / index2 / share_cpu_map

2 मई 22:34:11 416831 कर्नेल: [3715446.097404] सीपीयू 5

2 मई 22:34:11 416,831 गिरी: [३७,१५,४४६.०,९७,८६९] में जुड़े हुए मॉड्यूल: nf_conntrack_ipv6 nf_defrag_ipv6 ip6t_LOG xt_tcpudp ipt_REDIRECT xt_conntrack iptable_mangle nf_conntrack_ftp ipt_REJECT ipt_LOG xt_limit xt_multiport xt_state ip6table_filter ip6_tables iptable_nat nf_nat nf_conntrack_ipv4 nf_conntrack nf_defrag_ipv4 iptable_filter ip_tables x_tables vesafb snd_hda_intel snd_hda_codec psmouse ioatdma snd_hwdep i7core_edac ghes edac_core एल.पी. hed dca joydev snd_pcm serio_raw parport snd_timer snd soundcore snd_page_alloc usbhid hid e1000e

2 मई 22:34:11 416831 कर्नेल: [3715446.279465]

2 मई 22:34:11 416831 कर्नेल: [3715446.303429] Pid: 19118, comm: apache2 Not दागी 2.6.38-13-जेनेरिक # 56-उबंटू सुपरमाइक्रो X8DTL / X8DTL

2 मई 22:34:11 416831 कर्नेल: [3715446.355544] RIP: 0010: [] [] task_rq_lock + 0x4a / 0xa0

2 मई 22:34:11 416831 कर्नेल: [3715446.411635] RSP: 0018: ffff88060b853da8 EFLAGS: 00010082

2 मई 22:34:11 416831 कर्नेल: [3715446.440241] RAX: 010021b86505c7ff RBX: 0000000000013d00 RCX: 00000001162d8937

2 मई 22:34:11 416831 कर्नेल: [3715446.497492] RDX: 0000000000000282 RSI: ffff88060b853df0 RDI: 00007fdac0088880

2 मई 22:34:11 416831 कर्नेल: [3715446.559362] RBP: ffff88060b853dc8 R08: 0000000000000040 R09: 001fc000000000

2 मई 22:34:11 416831 कर्नेल: [3715446.625144] R10: 0000000000000000 R11: dead000000100100 R12: 00007fdac0088280

2 मई 22:34:11 416831 कर्नेल: [3715446.695569] R13: ffff88060b853df0 R14: 0000000000013d00 R15: 0000000000000005

2 मई 22:34:11 416831 कर्नेल: [3715446.770654] FS: 00007fdac0023760 (0000) जीएस: ffff880c3fc20000 (0000) knlGS: 0000000000000000

2 मई 22:34:11 416831 कर्नेल: [3715446.849786] सीएस: 0010 डीएस: 0000 ES: 0000 CR0: 0000000080050033

2 मई 22:34:11 416831 कर्नेल: [3715446.889882] CR2: 00007fdac187ca80 CR3: 000000058cda1000 CR4: 00000000000006e0

2 मई 22:34:11 416831 कर्नेल: [3715446.968627] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000

2 मई 22:34:11 416831 कर्नेल: [3715447.049676] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400

2 मई 22:34:11 416831 कर्नेल: [3715447.130842] प्रक्रिया अपाचे 2 (पीआईडी: 19118, थ्रेडिनो एफएफएफ 88060 बी 852000, टास्क ffff88058ccc4a0)

2 मई 22:34:11 416831 कर्नेल: [3715447.212160] ढेर:

2 मई 22:34:11 416831 कर्नेल: [3715447.251311] 00007fdac0088280 ffff880be1ca5ec8 000000000000000f 0000000000000000

2 मई 22:34:11 416831 कर्नेल: [3715447.331017] ffff88060b853e28 ffffffff8105f2e1 0000000000000000 0000000081a4c270

2 मई 22:34:11 416831 कर्नेल: [3715447.412179] ffff88060b853e38 0000000000000282 0000000000000021 ffff880b92505ec8

2 मई 22:34:11 416831 कर्नेल: [3715447.493302] कॉल ट्रेस:

2 मई 22:34:11 416831 कर्नेल: [3715447.533014] [] try_to_wake_up + 0x31 / 0x3e0

2 मई 22:34:11 416831 कर्नेल: [3715447.573262] [] वेक_अप_प्रोसेस + 0x15 / 0x20

2 मई 22:34:11 416831 कर्नेल: [3715447.612669] [] aw_up_sem_queue_do + 0x37 / 0x60

2 मई 22:34:11 416831 कर्नेल: [3715447.651327] [] फ्रीयर + 0x1c6 / 0x200

2 मई 22:34:11 416831 कर्नेल: [3715447.689083] [] semctl_down.clone.5 + 0xbb / 0x110

2 मई 22:34:11 416831 कर्नेल: [3715447.726360] []? sys_kill + 0x7E / 0x90

2 मई 22:34:11 416831 कर्नेल: [3715447.762833] []? fput + 0x25 / 0x30

2 मई 22:34:11 416831 कर्नेल: [3715447.798362] [] sys_semctl + 0x7e / 0xd0

2 मई 22:34:11 416831 कर्नेल: [3715447.833126] [] system_call_fastpath + 0x16 / 0x1b

2 मई 22:34:11 416831 कर्नेल: [3715447.867350] कोड: 00 48 c7 c3 00 3 डी 01 00 49 89 fc 49 89 f5 9c 58 0f 1f 44 00 00 48 89 c2 66 66f 1f 44 00 49 49 55 00 49 8 बी 44 24 08 49 89 डी <8 बी> 40 18 4 सी 03 34 सी 5 80 सी 8 ए 81 81 सी 4 एफ 7 ई 8 53 4e 57 00 49 8 बी

2 मई 22:34:11 416831 कर्नेल: [3715447.970388] RIP [] task_rq_lock + 0x4a / 0xa0

2 मई 22:34:11 416831 कर्नेल: [3715448.004042] आरएसपी

2 मई 22:34:11 416831 कर्नेल: [3715448.083219] --- [अंत का पता लगाने 244a1ec2d6f912fa] ---

2 मई 22:35:01 416831 CRON [19243]: (रूट) CMD (मार / घर / व्यवस्थापक / लॉग-बच्चे)

जवाबों:


4

यह एक हार्डवेयर बग जैसा लगता है। आज के लिनक्स में गंभीरता के स्तर के कीड़े नहीं हैं "मैंने अपाचे को फिर से लोड किया, मेरा सर्वर क्रैश हो गया और मैंने अपना डेटा खो दिया" बाएं - आपको किसी प्रकार की हार्डवेयर समस्या है। ओवरहीटिंग, खराब रैम / सीपीयू / मदरबोर्ड / RAID कंट्रोलर / एचडीडी / कुछ और।

आपके पोस्ट को डाउनवोट होने के कारण प्राप्त हुआ है क्योंकि आपके पोस्ट में विवरण नहीं है। हम संभवतः अनुमान नहीं लगा सकते कि क्या गलत है (एचडब्ल्यू समस्या के बारे में मेरे अनुमान के अलावा)।


जिस कर्नेल का हम उपयोग कर रहे हैं वह कर्नेल में सूचीबद्ध नहीं है। स्थिर रिलीज के तहत यह इंगित करता है कि हम जिस कर्नेल का उपयोग कर रहे हैं वह स्थिर नहीं है
अनंत

1
... आप उत्पादन सर्वर पर अस्थिर कर्नेल का उपयोग क्यों कर रहे हैं? यदि आपको गलती पर कर्नेल पर संदेह है, तो एक पुराने संस्करण पर वापस जाएं, देखें कि क्या आप त्रुटि को पुन: उत्पन्न कर सकते हैं।
बार्ट सिल्वरस्ट्रिम

तथ्य यह है कि कर्नेल एक स्थिर रिलीज नहीं है इसका मतलब यह नहीं है कि यह दुर्घटनाग्रस्त हो जाएगा। आम तौर पर इसका मतलब है कि कुछ नई सुविधाएँ काम नहीं कर सकती हैं या उनमें अभी भी कीड़े हैं। यह अविश्वसनीय रूप से संभावना नहीं है कि उस परिमाण का एक बग इसे किसी भी रिलीज में स्थिर या स्थिर बना देगा।
अनुदान

यह डिफ़ॉल्ट संस्करण है जो ubuntu 11.4.does के साथ आता है। यह कर्नेल थ्रेड्स एक समस्या का संकेत देता है। त्वरित Google से पता चलता है कि कुछ बाधा हैंडलर हैं। मुझे ऐसा महसूस नहीं होता है कि ये बहुत अधिक बाधित हैंडलर हैं।
अनंथन

हमने इस मुद्दे से निपटने के लिए एक कर्नेल डेवलपर से सलाह ली, और उसके अवलोकन के आधार पर एक स्पिन लॉक की स्थिति, जो वास्तव में एक कर्नेल बग है ..
अनंथन

1

यह कर्नेल बग के कारण होने की संभावना नहीं है। जैसा कि जैने कहते हैं, हार्डवेयर दोष अधिक होने की संभावना है। रेमेडियेशन के लिए आपका सबसे तेज़ मार्ग दोषपूर्ण हार्डवेयर को बदलने और बैकअप से डेटा को पुनर्स्थापित / पुनर्प्राप्त करने की संभावना है।


जिस कर्नेल का हम उपयोग कर रहे हैं वह कर्नेल में सूचीबद्ध नहीं है। स्थिर रिलीज के तहत यह इंगित करता है कि हम जिस कर्नेल का उपयोग कर रहे हैं वह स्थिर नहीं है
अनंत

क्या पूछते हैं? यदि आप अपने डेटा हानि का मूल कारण खोजने की कोशिश कर रहे हैं, तो आपको अपने क्रैश डंप को देखना होगा। क्या कर्नेल बग के कारण आपका डेटा लॉस है? यह संभव है, यद्यपि अविश्वसनीय रूप से संभावना नहीं है। एक हार्डवेयर फॉल्ट की संभावना अधिक होती है।
१४:३२ पर सर

यह डिफ़ॉल्ट संस्करण है जो ubuntu 11.4.does के साथ आता है। यह कर्नेल थ्रेड्स एक समस्या का संकेत देता है। त्वरित Google से पता चलता है कि कुछ बाधा हैंडलर हैं। मुझे ऐसा महसूस नहीं होता है कि ये बहुत अधिक बाधित हैंडलर हैं।
अनंथन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.