用GPU加速神经网络训练

人工智能68

前言

本文记录了做毕设过程中,为了加速神经网络的训练,如何让tf能识别到GPU并加速,加速前resnet架构一个epoch需要跑40分钟,使用mx150(一个laptop的极普通显卡,cuda核心仅有384个)可以加速到4分钟以内,极大的缩短了训练时间,感谢悉心指导我的刘学姐。

电脑配置:dell 灵越7580

用GPU加速神经网络训练

;用GPU加速神经网络训练

解决过程:

工具:anaconda3 pycharm2021.3.3

1、 包版本

Python:3.7
tensorflow:2.1.0
cudatoolkit:10.1
cudnn:7.6
Tensorflow-gpu:2.3.0
以上对应关系见表(学姐发我的,出处不详)——
用GPU加速神经网络训练
用GPU加速神经网络训练

; 2、cmd安装包

以管理员身份启动cmd命令行
conda activate “name of env”(进入环境)
pip install –user tensorflow-gpu==2.3.0(保证安装成功,不加—user可能会报OSError的错)

3、检测是否安装成功

import tensorflow as tf
print(tf.test.is_gpu_available())

输出true则代表是GPU版本,说明安装成功
或:

gpus = tf.config.list_physical_devices(device_type='GPU')
cpus = tf.config.list_physical_devices(device_type='CPU')
print(gpus, cpus)

检查tensorflow可使用的设备情况
多GPU分配使用的方法参见博客:

https://www.cnblogs.com/Renyi-Fan/p/13461855.html

最后放一张成功安装的截图

用GPU加速神经网络训练

Original: https://blog.csdn.net/DesertGuest/article/details/124631028
Author: 奥本海猴子
Title: 用GPU加速神经网络训练