用GPU加速神经网络训练
前言
本文记录了做毕设过程中,为了加速神经网络的训练,如何让tf能识别到GPU并加速,加速前resnet架构一个epoch需要跑40分钟,使用mx150(一个laptop的极普通显卡,cuda核心仅有384个)可以加速到4分钟以内,极大的缩短了训练时间,感谢悉心指导我的刘学姐。
电脑配置:dell 灵越7580
解决过程:
工具:anaconda3 pycharm2021.3.3
1、 包版本
Python:3.7
tensorflow:2.1.0
cudatoolkit:10.1
cudnn:7.6
Tensorflow-gpu:2.3.0
以上对应关系见表(学姐发我的,出处不详)——
2、cmd安装包
以管理员身份启动cmd命令行
conda activate “name of env”
(进入环境)
pip install –user tensorflow-gpu==2.3.0
(保证安装成功,不加—user可能会报OSError的错)
3、检测是否安装成功
import tensorflow as tf
print(tf.test.is_gpu_available())
输出true则代表是GPU版本,说明安装成功
或:
gpus = tf.config.list_physical_devices(device_type='GPU')
cpus = tf.config.list_physical_devices(device_type='CPU')
print(gpus, cpus)
检查tensorflow可使用的设备情况
多GPU分配使用的方法参见博客:
https://www.cnblogs.com/Renyi-Fan/p/13461855.html
最后放一张成功安装的截图
用GPU加速神经网络训练相关推荐
- 机器学习笔记 - 加速神经网络训练的 7 个技巧
更快地训练神经网络是深度学习的重要因素之一.我们通常发现神经网络的这些困难在于其复杂的架构和使用的大量参数.随着数据量.网络和权重的增加,模型的训练时间也会增加,这对建模者和从业者来说都是不利的.在本 ...
- 利用gpu加速神经网络算法,外接gpu 训练神经网络
神经网络做图像分类一定要用到gpu吗? GPU最大的价值一直是"accelerating"(加速),GPU不是取代CPU,而是利用GPU的并行计算架构,来将并行计算的负载放到GPU ...
- 利用gpu加速神经网络算法,为什么用gpu 模型训练
为什么tensorflow训练用GPU比CPU更慢了 谷歌人工智能写作项目:神经网络伪原创 深度学习用cpu训练和用gpu训练有什么区别 1.深度学习用cpu训练和用gpu训练的区别(1)CPU主要用 ...
- 在Pytorch中使用GPU加速模型训练
CPU->GPU 当我们需要训练一个复杂模型的时候,使用CPU来进行训练往往会花费非常多的时间.因此,一般情况下,我们都会选择在GPU (Graphics Process Unit)环境下进行训 ...
- 学界 | 数据并行化对神经网络训练有何影响?谷歌大脑进行了实证研究
选自arXiv 作者:Christopher J. Shallue 等 机器之心编译 参与:路.张倩 近期的硬件发展实现了前所未有的数据并行化,从而加速神经网络训练.利用下一代加速器的最简单方法是增加 ...
- 影响神经网络训练速度的因素使得神经网络训练速度加快的方法
在深度学习任务中,虽然可以通过堆叠参数.设计更复杂的结构来提高模型的表征能力,但这也会导致模型的计算量增加,训练时间延长.所以,模型的预测有多好并不是唯一的考虑因素,训练时间长会导致成本的上升. 一. ...
- [Python人工智能] 七.加速神经网络、激励函数和过拟合
从本系列文章开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前六篇文章讲解了神经网络基础概念.Theano库的安装过程及基础用法.theano实现回归神经网络.theano实现 ...
- 加速神经网络训练方法及不同Optimizer优化器性能比较
本篇博客主要介绍几种加速神经网络训练的方法. 我们知道,在训练样本非常多的情况下,如果一次性把所有的样本送入神经网络,每迭代一次更新网络参数,这样的效率是很低的.为什么?因为梯度下降法参数更新的公式一 ...
- 技术新进展!谷歌AI部门宣布发现新技术以加速AI神经网络训练
https://t.qianzhan.com/caijing/detail/190716-73349ac9.html 谷歌的张量处理器(TPU)和英特尔的Nervana神经网络处理器等人工智能加速器硬 ...
最新文章
- Windows系统下安装Thrift的方法
- 智源博士后合作导师专访 | 曾毅:面向可持续发展的人工智能
- axi ps读写pl_PL读写DDR:Datamover能干什么
- 江西事业单位计算机管理岗怎么样,江西省直事业单位招聘出现不少冷门岗
- editor编辑器为什么头部信息会不见_简单聊一聊一个前端编辑器的性能优化
- 港股打新之卖出策略(暗盘和首日)
- 20190825:(leetcode习题)最长公共前缀
- 狂神设计模式笔记-工厂模式
- 全网首发:VS编译的文件不在指定位置,怎么办
- 常用的linux命令-vim
- Proteus仿真:行列式键盘
- Tomcat8卸载+重装
- Java学习day07-认识类和对象(单元测试Test)
- HLW8032功率计+esp8266WiFi插座 mixly blynk
- Android sn 号修改
- 怎么调用html调色板,JS实现的系统调色板完整实例
- 在线广告结算方式与ecpm估计关系
- 着眼产业合作、情报分享 网易云易盾加入云清联盟
- 北斗短报文的工作原理及作用
- Materials - 剑网3地形材质若干