मैं एक कर्नेल मॉड्यूल को डिबग कैसे करता हूं जिसमें एक NULL पॉइंटर दिखाई देता है?


9

मेरे पास एक कस्टम कर्नेल मॉड्यूल है जो मैंने इस पैच से संकलित किया है जो logitech G19अन्य जी श्रृंखला उपकरणों के बीच कीबोर्ड के लिए समर्थन जोड़ता है। मैंने इसे उबंटू के मावरिक कर्नेल की मास्टर शाखा (2.6.35) के खिलाफ ठीक संकलित किया।

मैं मॉड्यूल को बूट और लोड कर सकता हूं, लेकिन मैं वास्तव में अजीब स्थिति में चल रहा हूं। जैसे ही मैं मॉड्यूल को लोड करता हूं (या तो बूट पर या modprobe के माध्यम से), मुझे एक काली स्क्रीन मिलती है और मेरा कंसोल लॉक हो जाता है।

अजीब बात यह है कि यह मेरे सिस्टम को बंद नहीं करता है, यह सिर्फ वर्तमान कंसोल सत्र है। मैं अपने बॉक्स में एसएसएच कर सकता हूं, और यह मुझे एक टर्मिनल और एक सत्र देता है। और मैं टाइप कर सकता हूं, और मैं एक कमांड भी चला सकता हूं और यह मुझे आउटपुट देता है। यह तब मेरा अगला संकेत बनाता है और तुरंत लॉक हो जाता है।

मुझे लगता है dmesgकि वहाँ एक अशक्त सूचक है, और मुझे निम्नलिखित स्टैकट्रेस मिलता है:

[  956.215836] input: Logitech G19 Gaming Keyboard as /devices/pci0000:00/0000:00:1d.7/usb1/1-2/1-2.1/1-2.1.2/1-2.1.2:1.1/input/input5
[  956.216023] hid-g19 0003:046D:C229.0004: input,hiddev97,hidraw3: USB HID v1.11 Keypad [Logitech G19 Gaming Keyboard] on usb-0000:00:1d.7-2.1.2/input1
[  956.216065] input: Logitech G19 as /devices/pci0000:00/0000:00:1d.7/usb1/1-2/1-2.1/1-2.1.2/1-2.1.2:1.1/input/input6
[  956.216128] Registered led device: g19_97:orange:m1
[  956.216146] Registered led device: g19_97:orange:m2
[  956.216178] Registered led device: g19_97:orange:m3
[  956.216198] Registered led device: g19_97:red:mr
[  956.216216] Registered led device: g19_97:red:bl
[  956.216235] Registered led device: g19_97:green:bl
[  956.216259] Registered led device: g19_97:blue:bl
[  956.216872] Console: switching to colour frame buffer device 40x30
[  956.216899] BUG: unable to handle kernel NULL pointer dereference at 000000000000001c
[  956.216903] IP: [<ffffffffa040b21b>] sys_imageblit+0x21b/0x4ec [sysimgblt]
[  956.216911] PGD 273554067 PUD 2726ca067 PMD 0 
[  956.216914] Oops: 0000 [#1] SMP 
[  956.216917] last sysfs file: /sys/devices/pci0000:00/0000:00:1d.7/usb1/1-2/1-2.1/1-2.1.2/1-2.1.2:1.1/usb/hiddev1/uevent
[  956.216921] CPU 5 
[  956.216922] Modules linked in: hid_g19(+) led_class hid_gfb fb_sys_fops sysimgblt sysfillrect syscopyarea btrfs zlib_deflate crc32c libcrc32c ufs qnx4 hfsplus hfs minix ntfs vfat msdos fat jfs xfs exportfs reiserfs snd_hda_codec_atihdmi snd_hda_intel snd_hda_codec snd_hwdep snd_pcm snd_seq_midi snd_rawmidi snd_seq_midi_event snd_seq snd_timer snd_seq_device ioatdma snd i5000_edac soundcore snd_page_alloc psmouse edac_core i5k_amb shpchp serio_raw dca ppdev parport_pc lp parport usbhid hid floppy e1000e
[  956.216953] 
[  956.216956] Pid: 3147, comm: modprobe Not tainted 2.6.35-26-generic #46 DSBF-DE/System Product Name
[  956.216959] RIP: 0010:[<ffffffffa040b21b>]  [<ffffffffa040b21b>] sys_imageblit+0x21b/0x4ec [sysimgblt]
[  956.216963] RSP: 0018:ffff8802766db738  EFLAGS: 00010246
[  956.216965] RAX: 0000000000000000 RBX: ffff880273e71000 RCX: ffff880272e93b40
[  956.216968] RDX: 0000000000000007 RSI: 0000000000000010 RDI: ffff880272e93b40
[  956.216970] RBP: ffff8802766db7d8 R08: 0000000000000000 R09: ffff880272e93b98
[  956.216972] R10: 0000000000000000 R11: 0000000000000001 R12: 0000000000000000
[  956.216974] R13: 0000000000000010 R14: 0000000000000008 R15: ffff8802766db8c8
[  956.216977] FS:  00007fcae7725700(0000) GS:ffff880001f40000(0000) knlGS:0000000000000000
[  956.216979] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
[  956.216981] CR2: 000000000000001c CR3: 000000026ba26000 CR4: 00000000000006e0
[  956.216983] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[  956.216986] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[  956.216988] Process modprobe (pid: 3147, threadinfo ffff8802766da000, task ffff8802696a16e0)
[  956.216990] Stack:
[  956.216991]  ffff8802766db778 ffffffff810746ae ffff8802766db700 ffff88026b2cadc0
[  956.216994] <0> ffff8802766db778 ffffffff812beef9 ffff8802f66db947 ffff8802766db94f
[  956.216998] <0> ffff8802766db848 00000000812bf22e ffff880272e93b40 ffffffff812feb40
[  956.217001] Call Trace:
[  956.217011]  [<ffffffff810746ae>] ? send_signal+0x3e/0x90
[  956.217018]  [<ffffffff812beef9>] ? put_dec+0x59/0x60
[  956.217023]  [<ffffffff812feb40>] ? fbcon_resize+0xd0/0x230
[  956.217027]  [<ffffffffa04175da>] gfb_fb_imageblit+0x1a/0x30 [hid_gfb]
[  956.217031]  [<ffffffff813051b9>] soft_cursor+0x1c9/0x270
[  956.217034]  [<ffffffff81304e8b>] bit_cursor+0x65b/0x6c0
[  956.217037]  [<ffffffff812c1796>] ? vsnprintf+0x316/0x5a0
[  956.217043]  [<ffffffff81061045>] ? try_acquire_console_sem+0x15/0x60
[  956.217046]  [<ffffffff81300ca8>] fbcon_cursor+0x1d8/0x340
[  956.217049]  [<ffffffff81304830>] ? bit_cursor+0x0/0x6c0
[  956.217054]  [<ffffffff81368139>] hide_cursor+0x29/0x90
[  956.217057]  [<ffffffff8136b078>] redraw_screen+0x148/0x240
[  956.217060]  [<ffffffff8136b42e>] bind_con_driver+0x2be/0x3b0
[  956.217063]  [<ffffffff8136b569>] take_over_console+0x49/0x70
[  956.217066]  [<ffffffff812ff7fb>] fbcon_takeover+0x5b/0xb0
[  956.217069]  [<ffffffff81303ca5>] fbcon_event_notify+0x5c5/0x650
[  956.217076]  [<ffffffff8158e7f6>] notifier_call_chain+0x56/0x80
[  956.217080]  [<ffffffff8108510a>] __blocking_notifier_call_chain+0x5a/0x80
[  956.217084]  [<ffffffff81085146>] blocking_notifier_call_chain+0x16/0x20
[  956.217089]  [<ffffffff812f366b>] fb_notifier_call_chain+0x1b/0x20
[  956.217092]  [<ffffffff812f4c8c>] register_framebuffer+0x1ec/0x2e0
[  956.217098]  [<ffffffff814084f8>] ? usb_init_urb+0x28/0x40
[  956.217101]  [<ffffffffa041790f>] gfb_probe+0x21f/0x4f0 [hid_gfb]
[  956.217107]  [<ffffffffa0425778>] g19_probe+0x558/0xedc [hid_g19]
[  956.217115]  [<ffffffff811c059c>] ? sysfs_do_create_link+0xec/0x210
[  956.217128]  [<ffffffffa00330c7>] hid_device_probe+0x77/0xf0 [hid]
[  956.217131]  [<ffffffff81388aa2>] ? driver_sysfs_add+0x62/0x90
[  956.217134]  [<ffffffff81388bc8>] really_probe+0x68/0x190
[  956.217138]  [<ffffffff81388d35>] driver_probe_device+0x45/0x70
[  956.217140]  [<ffffffff81388dfb>] __driver_attach+0x9b/0xa0
[  956.217143]  [<ffffffff81388d60>] ? __driver_attach+0x0/0xa0
[  956.217146]  [<ffffffff81388008>] bus_for_each_dev+0x68/0x90
[  956.217149]  [<ffffffff81388a3e>] driver_attach+0x1e/0x20
[  956.217151]  [<ffffffff813882fe>] bus_add_driver+0xde/0x280
[  956.217154]  [<ffffffff81389140>] driver_register+0x80/0x150
[  956.217157]  [<ffffffff8158e7f6>] ? notifier_call_chain+0x56/0x80
[  956.217161]  [<ffffffffa042a000>] ? g19_init+0x0/0x20 [hid_g19]
[  956.217166]  [<ffffffffa0032913>] __hid_register_driver+0x53/0x90 [hid]
[  956.217169]  [<ffffffff81085115>] ? __blocking_notifier_call_chain+0x65/0x80
[  956.217173]  [<ffffffffa042a01e>] g19_init+0x1e/0x20 [hid_g19]
[  956.217178]  [<ffffffff8100204c>] do_one_initcall+0x3c/0x1a0
[  956.217184]  [<ffffffff8109bd9b>] sys_init_module+0xbb/0x200
[  956.217192]  [<ffffffff8100a0f2>] system_call_fastpath+0x16/0x1b
[  956.217195] Code: 83 e1 fc 48 89 4d c8 eb d3 8b 83 14 01 00 00 83 f8 04 74 09 83 f8 02 0f 85 7b 01 00 00 48 8b 4d b0 48 8b 83 00 04 00 00 8b 51 10 <44> 8b 04 90 8b 51 14 8b 3c 90 44 8b 4d ac 45 85 c9 75 16 41 b9 
[  956.217218] RIP  [<ffffffffa040b21b>] sys_imageblit+0x21b/0x4ec [sysimgblt]
[  956.217221]  RSP <ffff8802766db738>
[  956.217223] CR2: 000000000000001c
[  956.217227] ---[ end trace 95d6c6d6913ccc79 ]---

क्या कोई मुझे सही दिशा में इंगित कर सकता है कि इसे डिबगिंग के बारे में कैसे जाना जाए?

स्टैकट्रेस मुझे विश्वास दिलाता है कि यह hid-g15 ड्राइवर नहीं है, बल्कि hid-gfb ड्राइवर है, जो कीबोर्ड पर एलसीडी के लिए एक फ्रेम बफर बनाता है। यह समझ में आता है क्योंकि यह मेरे डिस्प्ले / कंसोल को लॉक कर रहा है, लेकिन कर्नेल कोड में खोदना वास्तव में कहीं नहीं जा रहा है। तो यह बहुत विधानसभा और मैक्रो फ़ंक्शन है।

स्टैकट्रेस पर अंतिम फ़ंक्शन जिसमें मेरा नया कोड शामिल है gfb_fb_imageblit। उस फ़ंक्शन की संपूर्णता है

   struct gfb_data *par = info->par;
   sys_imageblit(info, image);
   gfb_fb_update(par);

क्या मैं स्टैक्ट्रेस को गलत पढ़ रहा हूं? क्या मैं कुछ भूल रहा हूँ? यह कैसे डिबग करने के लिए कोई सुझाव?


कुछ साल पहले, मैंने pl2303मॉड्यूल में एक समान बग को केवल कोड को ध्यान से पढ़ने और NULL पॉइंटर के लिए स्रोत खोजने के द्वारा हल किया । (तब इस छोटे से सुधार को ग्रेगकेएच, अनुरक्षक द्वारा लिया गया था।) शायद, आप आपकी मदद करने के लिए डिबगर का उपयोग कर सकते हैं, पूछ सकते हैं कि कर्नेल के साथ डिबगर का उपयोग कैसे करें। कोड के अनुरक्षकों से भी संपर्क करें, उनके पास विचार हो सकते हैं।
इम्ज़ - इवान ज़खरीशेव

3
अच्छी बात यह है कि मैं ऐसे अन्य लोगों के बारे में जानता हूं, जिनके पास जाहिर तौर पर काम करने वाले मॉड्यूल हैं। और मुझे यकीन नहीं है कि लेखक अभी भी आसपास है। मुझे लगता है कि कर्नेल के साथ डिबगर का उपयोग करने के बारे में यह एक अच्छा बिंदु है। क्या मुझे यह पूछना चाहिए कि एक नए प्रश्न के रूप में या जब तक मुझे यहां और उत्तर नहीं मिलते हैं, तब तक प्रतीक्षा करें?
फल्मरी

यदि आप केवल मॉड्यूल के उपयोग करने योग्य होने के बारे में परवाह करते हैं (और जरूरी नहीं कि अपने कर्नेल के साथ काम करने के लिए मॉड्यूल को ठीक करके खुद को और समुदाय की मदद करें), तो इसे "अन्य लोगों" के उपयोग के समान कर्नेल संस्करण और कॉन्फ़िगरेशन के साथ आज़माएं।
इम्ज़ - इवान ज़खरीशेव

@imz: वैसे मैंने केवल इसका एक उल्लेख देखा है जिसका वास्तव में उपयोग किया जा रहा है, और मुझे पता नहीं है कि सटीक कर्नेल और कॉन्फ़िगरेशन जो उन्होंने उपयोग किया था, केवल यह कि इसे मीरकैट कर्नेल के साथ बनाया गया था। मैं सीखना चाहता हूँ, हालांकि मैं शायद यह डिबगिंग तब शुरू करूँगा जब मेरे पास कुछ समय होगा।
फाल्मरी फेरी

यदि आप अपने आप को डिबगिंग के माध्यम से जाते हैं, तो आप अंततः अपने प्रश्न का सबसे अच्छा उत्तर यहां पोस्ट करने में सक्षम होंगे!
imz -

जवाबों:


10

पहली चीजें पहले, मॉड्यूल को डीबग करें? बस यह देखें कि क्या आप इसे gdb में लोड कर सकते हैं यह आपको सीधे उस पंक्ति पर इंगित कर सकता है जो संबंधित चर (या इसके करीब) का उपयोग करता है।

ओह, और आपको यह लेख उपयोगी लग सकता है


खैर मैं कुछ डिबगिंग चरणों के माध्यम से चला गया और स्टैकट्रेस का पालन किया। लेकिन जब मैंने अपने कंप्यूटर को रिबूट किया और मॉड्यूल को फिर से लोड किया तो बस काम किया। इसलिए, मुझे नहीं पता कि क्या गलत था।
फल्मरी फेरी

अच्छा सौदा। खुशी है कि यह जो भी कारण के लिए काम कर रहा है
रोबॉटहैंस

1
क्या यह केवल डिबगर के साथ काम करता है? क्या आपने कुछ और बदल दिया?
वॉनब्रांड

7

मैं उस पैच के लेखकों में से एक हूँ, क्षमा करें यह बहुत छोटी है :)

सामान्य रूप से इस तरह के अशक्त बिंदुओं को खोजने के लिए मैं सिर्फ प्रिंट सम्मिलित करता हूं जब तक कि मैं सूचक को अशक्त (= 0) नहीं पाता हूं, तब तक मैं स्रोत कोड पढ़ता हूं जब तक मुझे पता नहीं क्यों।

हालाँकि इस मामले में मुझे पता है कि आपको फ़्रेमबफ़र कंसोल को निष्क्रिय करना होगा या आपको यह गंदा बग मिलेगा, जो केवल कंसोल के दिखाई देने पर ट्रिगर होता है। या जब आप कीबोर्ड को अनप्लग करते हैं तो यह बग ट्रिगर हो सकता है, और मॉड्यूल अभी भी अमान्य बफर को लिखने की कोशिश करता है।

आपको जीथब पर नए कोड की जांच करनी चाहिए , जिसे मैं अभी साफ करने का प्रयास कर रहा हूं, ताकि मनमानी गुठली के खिलाफ संकलन करना आसान हो सके, और जिसमें कुछ बग फिक्स हैं।

इसके अलावा, हमारे आईआरसी, # lg4l द्वारा freenode पर ड्रॉप करें।


अरे, जवाब देने के लिए धन्यवाद। मुझे उम्मीद नहीं थी कि पैच बग फ्री होगा। वास्तव में, मैं उम्मीद कर रहा था कि मैं इसके लिए सार्थक योगदान दे सकता हूं। वास्तव में, मुझे लगता है कि मेरे पास आप लोगों के लिए कुछ अच्छी जानकारी है, भले ही यह पुराना हो सकता है क्योंकि मुझे इस समय इस पर ज्यादा काम करने का मौका नहीं मिला है। मौका मिलते ही मैं irc से रुक जाता हूँ।
फाल्मरी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.