0


使用AWS EC2进行AI训练进行显卡驱动配置

首先创建EC2实例选择P类型或者G类型

以下是EC2实例对应的N卡产品类型和系列,可以通过这个在官网上找到对应的驱动进行手动驱动安装

官方链接:官方驱动 | NVIDIA

创建完成登录远程ssh连接至服务器

连接以后安装gcc和make

sudo apt-get install gcc make -y

更新软件包缓存并获取实例软件包更新

sudo apt-get update -y

升级

linux-aws

程序包以接收最新版本

sud重启实例以加载最新内核版本

重启实例以加载最新内核版本

sudo reboot

重新连接实例

添加NVIDIA PPA

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

为当前运行的内核版本安装 gcc 编译器和内核标头软件包

sudo apt-get install -y gcc make linux-headers-$(uname -r)

禁用 NVIDIA 显卡的

nouveau

开源驱动程序以免与NVIDIA官方驱动可能不兼容

nouveau

添加到

/etc/modprobe.d/blacklist.conf

黑名单文件。

cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
EOF

编辑/etc/default/grub 文件并且添加下面的代码

GRUB_CMDLINE_LINUX="rdblacklist=nouveau"

重新生成 Grub 配置

sudo update-grub

更新initramfs,确保新的配置生效

sudo update-initramfs -u

重启系统以应用更改

sudo reboot

确认Nouveau已被禁用

lsmod | grep nouveau

如果没有输出,表示Nouveau已成功被禁用

安装推荐的或者特定功能的显卡驱动

安装 ubuntu-drivers-common

sudo apt update
sudo apt install ubuntu-drivers-common

检测推荐的驱动

ubuntu-drivers devices

可以使用ubuntu-drivers工具自动选择推荐的驱动程序

sudo ubuntu-drivers autoinstall

如果需要安装特定的N卡驱动可以先搜索可用的N卡包

apt search nvidia-driver

然后使用apt安装推荐合适的或者特定的版本

sudo apt install <package-name>

安装完成以后重启实例并且重新连接

sudo reboot

安装完成以后输入命令查看详细信息

nvidia-smi

以下是安装好的效果图

如需要手动安装指定版本或者官方驱动手动安装,点赞评论后续出教程


本文转载自: https://blog.csdn.net/qq_73910914/article/details/136740417
版权归原作者 AWS 废材 所有, 如有侵权,请联系我们删除。

“使用AWS EC2进行AI训练进行显卡驱动配置”的评论:

还没有评论