英伟达
直播中

李培珠

7年用户 217经验值
私信 关注
[问答]

错误:无法加载内核模块'nvidia.ko'

在运行Ubuntu Server 14.04 LTS的新Amazon EC2 g2.2xlarge GPU实例上,我无法安装最新的NVIDIA GRID驱动程序。
尝试安装驱动程序时,遇到以下错误:
错误:无法加载内核模块'nvidia.ko'。
这种情况最发生
经常在这个内核模块是针对错误的或
配置不正确的内核源代码,使用的是gcc版本
与用于构建目标内核的驱动程序或驱动程序不同
例如rivafb,nvidiafb或nouveau存在并阻止了
NVIDIA内核模块获得NVIDIA显卡的所有权
设备,或者不支持在此系统中安装的NVIDIA GPU
这款NVIDIA Linux显卡驱动程序发布。
请参阅日志条目'内核模块加载错误'和'内核
消息'在文件'/var/log/nvidia-installer.log'的末尾
更多信息。
如何解决此错误并继续安装驱动程序?
以下输出显示EC2实例上的操作系统版本。
$ l***_release -a
没有LSB模块可用。
分销商ID:Ubuntu
描述:Ubuntu 14.04.2 LTS
发布:14.04
代号:值得信赖

以上来自于谷歌翻译


以下为原文

On a new Amazon EC2 g2.2xlarge GPU instance running Ubuntu Server 14.04 LTS, I cannot install the latest NVIDIA GRID driver. When trying to install the driver, I encounter the following error:

  ERROR: Unable to load the kernel module 'nvidia.ko'.  This happens most
         frequently when this kernel module was built against the wrong or
         improperly configured kernel sources, with a version of gcc that
         differs from the one used to build the target kernel, or if a driver
         such as rivafb, nvidiafb, or nouveau is present and prevents the
         NVIDIA kernel module from obtaining ownership of the NVIDIA graphics
         device(s), or no NVIDIA GPU installed in this system is supported by
         this NVIDIA Linux graphics driver release.

         Please see the log entries 'Kernel module load error' and 'Kernel
         messages' at the end of the file '/var/log/nvidia-installer.log' for
         more information.


How can I resolve this error and proceed with installing the driver? The output below shows the OS version on the EC2 instance.

$ l***_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 14.04.2 LTS
Release:        14.04
Codename:       trusty

回帖(2)

车熊鹤

2018-9-5 09:47:35
这是错误消息中提到的nvidia-installer.log。

以上来自于谷歌翻译


以下为原文

Here's the nvidia-installer.log mentioned in the error message.
举报

萧治维

2018-9-5 10:03:24
无法读取.log连接超时。
你是否禁用了nouveau司机?
你检查过驱动程序包(安装在服务器上)使用的gcc版本是否与用于创建服务器内核的版本相同?
您可能需要更改VM中的gcc版本以进行匹配。
你也可能觉得这很有用
http://tleyden.github.io/blog/2014/10/25/cuda-6-dot-5-on-aws-gpu-instance-running-ubuntu-14-dot-04/

以上来自于谷歌翻译


以下为原文

Can't read the .log the connection times out.

Have you disabled the nouveau driver?

have you checked the gcc version used by the driver package (installed on the Server)  is the same one used to create the server kernel?

You may need to change the version of gcc in the VM to match.

You may also find this useful

http://tleyden.github.io/blog/2014/10/25/cuda-6-dot-5-on-aws-gpu-instance-running-ubuntu-14-dot-04/
举报

更多回帖

发帖
×
20
完善资料,
赚取积分