1.nvidia驱动下载地址:https://www.nvidia.cn/geforce/drivers/
查看驱动:
nvidia-smi
安装驱动:
禁用nouveau:
sudo gedit /etc/modprobe.d/blacklist.conf
找到最后一行,在末尾加入下列内容,将nouveau列入黑名单:
blacklist nouveau
options nouveau modeset=0
应用刚才修改的配置:
sudo update-initramfs -u
reboot
重启后验证更改是否生效:
lsmod | grep nouveau
关闭图形化界面(非必要操作,有时不关闭无法完成旧驱动卸载):
sudo telinit 3
卸载旧版本nvidia驱动:
sudo apt-get remove --purge nvidia*
安装驱动nvidia上下载的驱动run文件:
sudo sh NVIDIA-Linux-x86_64-535.113.01.run
2.卸载cuda:进入cuda安装文件夹:
cd /usr/local/cuda/bin
执行
sudo ./cuda-uninstaller
选中全部选项删除
3.查看cuda版本:
nvcc -V
4.卸载cudnn:
sudo dpkg -l | grep cudnn #查看现存cudnn文件
#按顺序执行三个包
sudo dpkg -r libcudnn8-samples
sudo dpkg -r libcudnn8-dev
sudo dpkg -r libcudnn8
sudo dpkg -l | grep cudnn #查看现存cudnn文件
ii cudnn-local-repo-ubuntu2004-8.5.0.961.0-1 amd64 cudnn-local repository configuration files
#这个包和上述三个的删除不一样,需要执行以下语句删除:
sudo apt-get purge cudnn-local-repo-ubuntu2004-8.5.0.96
#再次查看还有什么cudnn存在
sudo dpkg -l | grep cudnn
#没有输出即为卸载成功
5.安装cuda:https://developer.nvidia.com/cuda-toolkit-archive下载需要的版本
按照Installation Instructions安装(安装时选项注意不要重复安装驱动driver,其他选上)
环境变量配置(用vim编辑。或者在主目录下Ctrl+H查看隐藏文件,找到.bashrc文件,直接打开编辑):
vim ~/.bashrc
在文件的末尾加入下面三行:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
随后命令行输入以下命令保存并退出:
:wq!
在添加完环境变量后,需要更新一下环境变量,命令行输入以下命令进行环境变量的更新:
source ~/.bashrc
6.安装cudnn:https://developer.nvidia.com/rdp/cudnn-download
进入到cudnn下载的安装路径下,命令行输入以下命令进行解压操作:
tar -xzvf cudnn-11.1-linux-x64-v8.0.5.39.tgz //这里cudnn-11.1-linux-x64-v8.0.5.39.tgz是我们下载的cudnn的压缩包
随后在当前路径的命令行终端输入以下三条命令进行cudnn的安装:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn*/usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
7.安装多个cuda,进行版本切换的方法
此种安装方式,是将/usr/local的cuda文件链接到了对应cuda版本的根目录。输入以下命令可以查看当前cuda文件的链接情况
cd /usr/local/
stat cuda
命令行输入以下命令,断开cuda文件与cuda-11.1的符号链接:
sudo rm -rf cuda
命令行输入以下命令,建立cuda文件与cuda-11.6的符号链接:
sudo ln -s /usr/local/cuda-11.6/usr/local/cuda
8.查看conda当前设置:
conda config --show channels
重置默认镜像源:
conda config --remove-key channels
删除单个镜像源:
conda config --remove channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/peterjc123/
增加镜像(清华):
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --add channels https://pypi.tuna.tsinghua.edu.cn/simple/
临时使用:
pip install torch==1.8.0-i https://pypi.tuna.tsinghua.edu.cn/simple/
9.查看pytorch和cuda版本对应关系:https://pytorch.org/get-started/previous-versions/
要根据自己的显卡算力选择合适的cuda版本和pytorch版本
版权归原作者 似是星辰非昨夜 所有, 如有侵权,请联系我们删除。