tensorflow1和2的安装部署
windows和linux用法一致,我是在win10和ubuntu2204下都手动测试过的
本文使用的conda的方式,2023年8月17日更新
链接:tensorflow官网
注意:如果因为网络问题出现错误或卡住,请取消后多次尝试,我这里面都是默认网络环境就可以安装的。大部分时间很快
一、基本配置
1.需要安装anaconda
如果没有安装,按照我的这个教程(windows和linux都有):
因为notebook使用很方便,所以不要用miniconda,那样就没有notebook!
链接: anaconda安装
初学者建议用cpu版本,gpu配置相对复杂,坑多
我这里的教程是直接装完包括依赖的,无需手动编译
2.gpu版本需要cuda和cudnn
在gpu的conda环境里面安装即可,建议也在系统环境中安装
cuda11.8,cudnn 8.6
cuda安装(linux)
cuda安装(windows)
cuDNN安装
3.windows用户想使用linux的
可以参考我的linux安装图解(详细)
unbuntu:ubuntu2204安装
debian: debian 11 12安装
二、安装tensorflow1.15(1的最后一个cpu版本)
在windows和linux下一致。
由于现在主要用2了,1就用cpu版本吧,要不还要降低cuda的版本(或者多版本cuda并存)。
1.15是tensorflow1的最后一个版本。
1.安装python3.6环境
conda create -n tensorflow python=3.6
2.激活环境
conda activate tensorflow
3.安装tensorflow1.15
通过国内源安装
pip installtensorflow==1.15.0 -i https://pypi.tuna.tsinghua.edu.cn/simple/
4.方便在notebook中使用
通过国内源安装
pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simple/
python -m ipykernel install--name tensorflow
5.打开notebook后,可以看到tensorflow的环境了
6.验证
打开notebook,输入以下并运行,显示版本号即可
import tensorflow as tf
print(tf.__version__)
三、安装tensorflow2.13.0(cpu版本)(2023年7月更新)
更新这篇时(2023.7),最新版为2.13.0,以此为演示
官方给的兼容性:tensorflow兼容性
1.安装python3.10环境(3.8-3.11之间)
这里选用3.10的python
conda create -n tensorflow2_cpu python=3.10
激活环境
conda activate tensorflow2_cpu
2.安装tensorflow2.13.0
pip install tensorflow-cpu==2.13.0 -i https://pypi.tuna.tsinghua.edu.cn/simple/
3.适配notebook
pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simple/
python -m ipykernel install--name tensorflow2_cpu
4.验证
打开notebook,输入以下并运行,显示版本号即可
import tensorflow as tf
print(tf.__version__)
四、安装tensorflow2.13(gpu版本,仅限于linux)(2023年7月更新)
2.12版本后,没有tensorflow-gpu这个分支了
由于一直在linux上部署安装,没注意到新gpu版本的变化,新版本gpu版对于windows用户相对麻烦,建议安装wsl2(linux在windows的子系统,然后当作linux用,或者安装老版本的gpu版)
可以不看兼容性:官方兼容性网址
1.安装python3.10环境(3.8-3.11之间)
这里选用3.10的python
conda create -n tensorflow2_gpu python=3.10
激活环境
conda activate tensorflow2_gpu
2.在环境里安装cuda和cudnn
conda install-c conda-forge cudatoolkit=11.8.0
pip install nvidia-cudnn-cu11==8.6.0.163 -i https://pypi.tuna.tsinghua.edu.cn/simple/
3.配置环境变量(自动激活方式)
这种方式不需要每次手动配置这个环境下的环境变量
创建配置文件
mkdir-p$CONDA_PREFIX/etc/conda/activate.d
使用命令写入环境变量
echo'CUDNN_PATH=$(dirname $(python -c "import nvidia.cudnn;print(nvidia.cudnn.__file__)"))'>>$CONDA_PREFIX/etc/conda/activate.d/env_vars.sh
echo'export LD_LIBRARY_PATH=$CONDA_PREFIX/lib/:$CUDNN_PATH/lib:$LD_LIBRARY_PATH'>>$CONDA_PREFIX/etc/conda/activate.d/env_vars.sh
刷新环境变量(上面的操作会在每次进入conda环境后自动加载,下面这条是首次加载)
source$CONDA_PREFIX/etc/conda/activate.d/env_vars.sh
4.升级pip
pip install--upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple/
5.安装tensorflow2.13
pip installtensorflow==2.13.0 -i https://pypi.tuna.tsinghua.edu.cn/simple/
6.适配notebook
gpu版不推荐使用notebook,容易报错
pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simple/
python -m ipykernel install--name tensorflow2_gpu
7.验证cpu和gpu部分
如果报错,参考下面的五,有解决方案
cpu测试
python3 -c"import tensorflow as tf; print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
gpu测试
python3 -c"import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"
五、其它问题和解决
1.如何使用指定的环境
方法一:在notebook中写(较方便,但是gpu版本可能会出错)
方法二:进入conda的指定环境,然后使用命令行
方法三(推荐):使用远程开发,本地安装开发工具,同时远程连接命令行
2.cpu优化使用avx2
使用的时候可能会提示开启avx2的字样(可以不管他)
avx2能够加速cpu,需要cpu的支持和在bios中开启,开启avx2可能会显著增加功耗
3.successful NUMA node read from SysFS had negative value (-1)
报错如下
successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
链接:解决numa报错
解决思路就是指定gpu,完成后不会报错,根据上面的链接的方法,可以有效的解决问题
4.Cannot dlopen some GPU libraries
cuddn没有装好的问题
如果命令行没问题则说明没问题。
版权归原作者 ziqibit 所有, 如有侵权,请联系我们删除。