NVIDIA-SMI विफल हो गया है क्योंकि यह NVIDIA ड्राइवर के साथ संवाद नहीं कर सका। सुनिश्चित करें कि नवीनतम NVIDIA ड्राइवर स्थापित और चल रहा है


23

मैंने सिर्फ CUDA को इस तरह एक नोटबुक में स्थापित किया है:

sudo apt-get install cuda

जैसा यहां कहा गया है

संकलन ठीक है, लेकिन जब मैं चलाने की कोशिश करता हूं तो मुझे फॉलोइन की समस्या हो जाती है: फ़ाइल पर CUDA त्रुटि। Cu:128 कोड = 35 (cudaErrorInsufficDriver) "cudaStreamCreate (& ([[]]))"

मेरा nvcc संस्करण:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

ग्राफिक्स कार्ड की जानकारी:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

मैंने VirtualGL, भौंरा-एनवीडिया, प्राइमस, फ्रीग्लूट 3-देव भी स्थापित किया। के बाद यह

जब मैं भौंरा पर कुछ चलाने की कोशिश करता हूं तो मुझे यह मिला है: Optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

एनवीडिया ड्राइवर काम नहीं कर रहा है।

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

यह एनवीडिया 375 संस्करण की तरह दिखता है, लेकिन मैं इसे काम नहीं कर सकता।

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

और कुछ ड्राइवर जानकारी।

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

मुझे लगता है कि यह कुछ ड्राइवर संस्करण समस्या हो सकती है:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

मुझे किसकी याद आ रही है?


आप ड्राइवर कैसे स्थापित करते हैं?
चार्ली पार्कर

एक ही त्रुटि का सामना करना पड़ा, और किसी भी जवाब ने काम नहीं किया। क्या काम किया एक सरल था $ reboot now:।
darthbhyrava

जवाबों:


14

यदि आपका nvidia-smiसंचार करने में विफल रहा है लेकिन आपने ड्राइवर को कई बार स्थापित किया है, तो जांचें prime-select

  1. prime-select queryसभी संभव विकल्प प्राप्त करने के लिए चलाएँ । आपको कम से कम देखना चाहिए nvidia | intel
  2. चुनें prime-select nvidia
  3. यदि यह कहता है nvidia is already selected, एक अलग का चयन करें, उदाहरण के लिए prime-select intel, फिर एनवीडिया पर वापस जाएंprime-select nvidia
  4. रिबूट और जाँच करें nvidia-smi

मेरी मदद की। धन्यवाद!
यरोस्लाव शुबर्ट

1
उह ओह, prime-select queryइंटेल की भी सूची नहीं है, मुझे लगता है कि मुझे अब 2 समस्याएं हैं ...
इंसपे

11

आप कोडा टूलकिट स्थापित करना चाह सकते हैं। इसे स्थापित करने के लिए निम्न कमांड का उपयोग करना।

sudo apt install nvidia-cuda-toolkit

एक बार स्थापना हो जाने के बाद, मशीन को रिबूट करें। nvidia-smiकार्य करना चाहिए।


मेरे लिये कार्य करता है !!
x0v

यह मेरे लिए काम करता है
सुंदरदीप

6
यहाँ काम नहीं किया
बिल Kotsias

2
अगर आपके पास cuda> = 10. है तो ऐसा न करें, यह आपके cuda को 9 पर डाउनग्रेड करेगा, जो कि CUDA PPA के बिना ubuntu पर वर्तमान में उपलब्ध है।
लोरेटोपरसी

sudo apt-get purge nvidia-*पहले कर , फिर उपरोक्त लाइन ने मेरे लिए सब कुछ CUDA से संबंधित तय कर दिया, CUDA 10.1 के साथ 430 ड्राइवर स्थापित किया
दीनारी

6

मैंने सिक्योर बूट को निष्क्रिय कर दिया और इसने बहुत अच्छा काम किया।

@ रॉड-स्मिथ ने एक और प्रश्न को और अधिक विशिष्ट बताया कि यह कैसे करना है, मूल रूप से एक सेटअप कॉन्फिग है, लेकिन वह यहां कैसे करें, इसके बारे में एक अच्छा लेख भी लिखते हैं


2
इसने मुझे nvidia ड्राइवर 390 के साथ भी मदद की! मैंने कभी नहीं सोचा था कि यह सुरक्षित बूट के कारण हो सकता है, thx :)
samutamm

सुरक्षित बूट के साथ यूईएफआई मोड पहले से ही यहां किया गया है। =) ऐसा लगता है कि यह दुर्भाग्य से सभी के लिए काम नहीं करता है।
रेनन विलियन प्राडो

3

चूँकि मैं @ रोडोल्फो के उत्तर पर टिप्पणी नहीं कर सकता (पर्याप्त प्रतिष्ठा नहीं), मैं एक नया उत्तर जोड़ रहा हूँ।

अपनी मशीन पर मुझे अपने OS के अनुसार सिक्योर बूट को कॉन्फ़िगर करना था । मेरे पास एक ASUS मेनबोर्ड है जो Ubuntu 18.04 पर चल रहा है और पैक किए गए NVIDIA ड्राइवर के साथ NVIDIA CUDA 10.1 अपडेट 2 को स्थापित करने का प्रयास किया गया है। मुझे उसी मुद्दे का सामना करना पड़ा जैसा कि ऊपर वर्णित है। जैसा कि यह निकला, सिक्योर बूट विंडोज यूईएफआई मोड में सेट किया गया था। इसे दूसरे OS में बदलना मेरे लिए इसे तय करता है।


1
धन्यवाद, मुझे अक्षम करना पड़ा Secure Bootजो कि विंडोज / BIOS ऑटो-अपडेट के दौरान स्वचालित रूप से पुन: सक्षम हो गया था !!! अब एनवीडिया ठीक काम करता है।
बिल कोत्सियास

क्या आप यह बताना चाहेंगे कि आपने सुरक्षित बूट को अन्य OS में कैसे बदला ?
inspi

1
@BillKotsias धन्यवाद! : डी
मारेक

0

भविष्य के पाठकों के लिए:

मैं एक वर्चुअल मशीन उदाहरण (Google क्लाउड प्लेटफ़ॉर्म) पर हूं

और मैं अनुसरण कर रहा हूं इस सार स्थापित करने के लिए Cudaऔर CuDNnमेरी वी एम पर।

मुझे मैन्युअल रूप से CuDNnभाग अपलोड करना था। (इसे केवल वहां रखना।)

अब, त्रुटि होने पर:

मैं इस मुद्दे पर था, लेकिन उदाहरण के एक पूर्ण पुनरारंभ काम किया था। और पूर्ण पुनः आरंभ करने से मेरा मतलब है कि उदाहरण को रोकना और इसे फिर से चालू करना।

मुझे उम्मीद है इससे किसी को सहायता मिलेगी।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.