0


Linux安装Nvidia驱动和CUDA的正确方法(详细)

Linux安装Nvidia driver和Cuda的详细步骤

一、安装Nvidia驱动

1、准备工作

1)查看显卡型号

lspci |grep -i nvidia

在这里插入图片描述
2)禁用nouveau并重启(安装Nvidia显卡的官方驱动和系统自带的nouveau驱动冲突)

lsmod |grep nouveau

如果有输出说明nouveau正在加载
打开禁用列表/etc/modprobe.d/blacklist-nouveau.conf
在最后一行加上

blacklist nouveau
options nouveau modset=0

然后更新,并重启机器

sudo update-initramfs -u
reboot

查看是否禁用成功,输入

lsmod |grep nouveau

若没有输出,则表示禁用成功

3)安装基础依赖环境

yum -y install gcc kernel-devel kernel-headers

2、安装驱动

1)在Nvidia官网下载相应驱动
官网下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
在这里插入图片描述
下载成功后上传至Linux服务起,如/opt目录下,进入下载的驱动所在目录执行安装

cd /opt
chmod +x NVIDIA-Linux-x86_64-470.94.run
sh NVIDIA-Linux-x86_64-470.94.run -no-opengl-files -no-nouveau-check

安装过程中选择accept
如果提示要修改xorg.conf,选择yes

如果报此错: WARNING: You do not appear to have an NVIDIA GPU supported by the 430.34 NVIDIA Linux graph
加上:–add-this-kernel 参数

如果报此错: unable to find the kernel source tree for the currently running kernel…
加上:–kernel-source-path=/usr/src/kernels/内核号(2+Tab键 自动出现)

如果报此错:unable to load the kernel module ‘nvidia.ko’ …
执行:./NVIDIA-XXXX.run --kernel-source-path=/usr/src/kernels/内核号 -k $(uname -r)
回车!
在这里插入图片描述
显示上图,说明安装成功
检查是否安装成功

nvidia-smi

在这里插入图片描述

二、安装CUDA

1、准备工作

1)确认已成功安装 显卡驱动
2)nouveau已经禁用
3)系统已经安装了gcc

2、安装CUDA

1)下载CUDA文件
下载地址-https://developer.nvidia.cn/cuda-toolkit-archive
比如我下载的版本是cuda_11.4.4_470.82.01_linux.run
2)安装CUDA
首先给cuda可执行权限:

chmod +x cuda_11.4.4_470.82.01_linux.run

运行cuda文件:
sh cuda_11.4.4_470.82.01_linux.run

cuda主要有以下参数:
–no-opengl-libs:表示只安装驱动文件,不安装OpenGL文件。必需参数,原因同上。注意:不是-no-opengl-files。
–toolkit:表示只安装CUDA Toolkit,不安装Driver和Samples
–help:查看更多高级选项。
安装过程的选项选择:
(1). 会先有个阅读声明,一直按D即可,然后accept。
(2). 选项install nvidia accelerated Graphics Driver,输入n,因为我们已经安装了nvidia的驱动。
(3). 选项install the OpenGL libraries,如果双显卡(集显+独显)选择n,如果只有独显可以选择y,如果双显卡选择y的话,会出现黑屏或者循环登录的问题,如果加了上面的参数就不会出现这个选项了。
(4). 后面的可以都选择yes,最后一个选项我们可以选择n,也就是不复制Samples,因为安装目录下有samples。
安装过程结束后会有以下信息:

Driver:   Not Selected
Toolkit:  Installed in /usr/local/cuda-11.4/
Samples:  Installed in /root/

代表安装完成,但是不代表成功。这时需要重启。
3)验证cuda是否安装成功
将cuda的bin文件和lib导出到系统环境中:

exportPATH="/usr/local/cuda-11.4/bin:$PATH"exportLD_LIBRARY_PATH="/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH"

终端输入:

nvcc -V

如果有CUDA的版本信息代表正常:
在这里插入图片描述
译samples例子:

#编译并测试设备 deviceQuery:cd /usr/local/cuda-9.2/samples/1_Utilities/deviceQuery
sudomake
./deviceQuery
#编译并测试带宽 bandwidthTest:cd../bandwidthTest
sudomake
./bandwidthTest

如果这两个测试的最后结果都是Result = PASS,说明CUDA安装成功。

三、卸载CUDA和Nvidia驱动

1、卸载CUDA

sudo /usr/local/cuda-11.4/bin/cuda-uninstaller

选择要卸载的模块,然后点击回车
在这里插入图片描述

2、卸载Nvidia驱动

sudo /usr/bin/nvidia-uninstall

卸载过程一路都是yes

END

标签: linux 服务器 运维

本文转载自: https://blog.csdn.net/weixin_43656336/article/details/125851441
版权归原作者 Eddy yue 所有, 如有侵权,请联系我们删除。

“Linux安装Nvidia驱动和CUDA的正确方法(详细)”的评论:

还没有评论