服务器配置深度学习环境:Tensorflow2.4.1+Keras2.4.3+Cuda11.2+Cudnn8.0,记录了配置过程中一些坑,希望帮助到大家
文章目录
- 开端
* - 选择自己需要的环境
- 查询显卡支持的Cuda版本
- Anaconda使用
* - 1.安装Anaconda
- 2.创建新环境
- 3. 激活环境
- 4.列出指定环境下安装的包
- 5.删除指定环境
- 安装Cuda与Cudnn
- 安装Tensorflow-gpu
- 总结
开端
linux服务器虚拟环境安装tensorflow-gpu 2.4.1 + Keras2.4.3 + cuda11.2 + cudnn8.0的踩坑记录:
折腾了近个把月(似乎来回差不多七次),在各大浏览器寻找配置环境的线索,去解决版本匹配带来的很多问题。在安装好Tensorflow后,有了这个教程,但它只是一个方法,并非万能的解答。
选择自己需要的环境
查询TensorFlow-GPU与CUDA cudnn Python版本关系:https://tensorflow.google.cn/install/source_windows?hl=en#gpu
; 查询显卡支持的Cuda版本
驱动版本可以通过命令查询:
nvidia-smi
注意事项:
- Cuda的选择根据自己的显卡要求,不能高于硬件支持的版本。
- 服务器是RTX3090系列,很矫情,不支持Cuda11以下的版本,因此选择前应该查询清楚。
- Tensorflow2.4以下也不支持Cuda11以上,需要严格适配。
- 如果在服务器上跑实验,一定是只安装Tensorflow-gpu版本的,如果安装了Tenesorflow就会出现实验运行在内存上的乌龙。
- 个人一些心得:因为本次实验需要Tensorflow2.3.0的环境,但是服务器的显卡要求Cuda版本过高,无法适配。为了实验正常运转,选择了高一点点的Tensorflow2.4.1的版本,改动应该不会很大。有一些赌的成分,配环境也是一种实验过程。
根据以上条件选择了Tensorflow2.4.1 + Keras2.4.3 + Cuda11.2 + Cudnn8.0,该环境目前没有问题。
Anaconda使用
1.安装Anaconda
选择Anaconda对每个项目所需环境进行管理,是一个很好的习惯。安装步骤可以参考如下教程:
2.创建新环境
创建一个名为py38的新环境,并且指定python版本是3.8 不用管是3.8.x,conda会为我们自动寻找3.6.x中的最新版本,当然也可以自己指定具体版本。
打开Anaconda Prompt,开始创建新环
conda create -n py38 python=3.8
这里安装的速度比较快是因为之前安装Anaconda时设置了Anaconda仓库的镜像,因为Anaconda.org的服务器在国外,所以需要安装packages时,会发现conda下载的速度经常很慢,可以使用清华TUNA镜像源,需要将其加入conda的配置即可。
conda config --add channels https : //mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
3. 激活环境
conda activate + 需要激活环境的名称,就进入该环境了
conda activate py38
退出当前环境是
conda deactivate
4.列出指定环境下安装的包
conda list
5.删除指定环境
conda env remove -n py38
安装Cuda与Cudnn
安装cuda11.2
conda install cudatoolkit=11.2
安装cudnn8.0
conda install cudnn=8.0
安装Tensorflow-gpu
安装tensorflow2.4.1直接使用pip install的方式,不过tensorflow包一般比较大,直接安装比较慢,可以添加镜像
pip install tensorflow-gpu==2.4.1 -i https://pypi.douban.com/simple/
再次强调:如果安装了tensorflow-gpu就不用再安装tensorflow,否则程序会再cpu上运行。
总结
很多错误都是自己尝试出来的,在这个过程中,和搜索引擎建立了深厚的友谊。
希望该文章能够帮助到您,如果没有,我也不接受指责与批评,因为我脾气不是很好。
Original: https://blog.csdn.net/Jeremy_Deng/article/details/124845112
Author: onePoetry
Title: 服务器配置深度学习环境:Tensorflow2.4.1 + Keras2.4.3 + Cuda11.2 + Cudnn8.0