1.batchsize越大 是不是训练越快?

GPU :一块2080Ti
平台:pytorch cuda
图片数量:2700

batchsize 一个图片处理时间 GPU内存占用 GPU算力使用 一个epoch 所用时间
1 0.117s 2.5G 20% 2700 * 0.0117 = 318s
5 0.516s 8G 90% 2700 * 0.516/5 = 279s

batchsize大了之后,占用的资源多了,算力多了,但是速度没有提升,这样是不是太坑了
我们其实可以把 batchsize设置小点,然后把剩余的内存跑其他实验,而且再在同一张卡上跑一个新的实验,对之前的速度也没有影响。

结论:
1.本人实验 batchsize越大,训练速度提升不大
2.bachsize小点,多跑几个实验真香

完成每个epoch运算的所需的全部时间主要卡在:

  1. load数据的时间,
  2. 每个epoch的iter数量。
  3. 因此对于每个epoch,不管是纯计算时间还是全部时间,大体上还是大batch能够更节约时间一点,但随着batch增大,iter次数减小,完成每个epoch的时间更取决于加载数据所需的时间,此时也不见得大batch能带来多少的速度增益了。

2.batchsize大了,是不是结果会变好?

收集资料发现,确实是这样的,但是也不能太大了

  1. Batch_Size 太小,算法在 200 epoches 内不收敛。
  2. 随着 Batch_Size 增大,处理相同数据量的速度越快。
  3. 随着 Batch_Size 增大,达到相同精度所需要的 epoch 数量越来越多。
  4. 由于上述两种因素的矛盾, Batch_Size增大到某个时候,达到时间上的最优。
  5. 由于最终收敛精度会陷入不同的局部极值,因此 Batch_Size增大到某些时候,达到最终收敛精度上的最优。

batchsize大小对训练速度的影响相关推荐

  1. 浅析深度学习中Batch Size大小对训练过程的影响

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨陈志远@知乎(已授权) 来源丨https://zhuanlan ...

  2. batch size 训练时间_深度学习 | Batch Size大小对训练过程的影响

    转自:面试中问你 Batch Size大小对训练过程的影响​mp.weixin.qq.com 先看两个问题: (1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可 ...

  3. 深入剖析深度学习中Batch Size大小对训练过程的影响

    点击上方"AI算法与图像处理",选择加"星标"或"置顶" 重磅干货,第一时间送达 推荐文章[点击下面可直接跳转]: 来源:https://z ...

  4. 深度学习中 Batch Size 对训练过程的影响

    作者 | 陈志远 编辑丨极市平台 之前面试过程中被问到过两个问题: (1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可避免地要用超大batch,比如人脸识别,可 ...

  5. 影响神经网络训练速度的因素使得神经网络训练速度加快的方法

    在深度学习任务中,虽然可以通过堆叠参数.设计更复杂的结构来提高模型的表征能力,但这也会导致模型的计算量增加,训练时间延长.所以,模型的预测有多好并不是唯一的考虑因素,训练时间长会导致成本的上升. 一. ...

  6. 影响神经网络训练速度的因素

    一.GPU和CPU CPU:中央处理器(英文Central Processing Unit)是一台计算机的运算核心和控制核心.CPU.内部存储器和输入/输出设备是电子计算机三大核心部件.其功能主要是解 ...

  7. 不止GPU!这些硬件也影响着深度学习训练速度

    有志于投身人工智能研究的青年,在关注计算机专业选择时,也不妨先了解一下影响深度学习训练速度的种种因素. 本文实验数据来源:知乎@Justin ho 工程师之于计算机就相当于赛车手对待跑车一样,必须十分 ...

  8. 深度机器学习中的batch的大小对学习效果有何影响?

    深度机器学习中的batch的大小对学习效果有何影响? 如题,在深度学习中,刚入门的小弟一直听闻一个batch中同时训练多个数据可以得到较好的效果,于是小弟在caffe上跑deepID的网络时对如何选取 ...

  9. 【阅读笔记】针对PyTorch提高神经网络训练速度的方法—《Here are 17 ways of making PyTorch training faster – what did I miss?》

    原文连接:https://efficientdl.com/faster-deep-learning-in-pytorch-a-guide/ 目录 写在开头 1. 考虑使用不同的学习率变化策略(Cons ...

最新文章

  1. 北京大学,签约这个省份!
  2. Java关键字及其作用
  3. java中引用一个文件数据_JAVA-基础-引用数据类型(类)
  4. 50行的python游戏代码_50行代码实现贪吃蛇(具体思路及代码)
  5. 谈谈重要的TCP、UDP
  6. SpringBoot_入门-springboot-helloworld
  7. 【原】unity shader(3)反射贴图
  8. Haproxy负载均衡详解,与keepalived的搭配
  9. C/C++[codeup 2026]日期类
  10. 在linux服务器上安装sublime编辑器
  11. 如何用计算机打出下划线,电脑下划线怎么打?下划线怎么输入出来
  12. 二类电商网页设计_用类设计网页
  13. BigDecimal 保留小数位
  14. System Design笔记:在线售票系统设计
  15. 2016中欧绿色和智慧城市奖正式启动
  16. 吴恩达新动向揭晓:加入精神健康领域的人工智能Woebot
  17. df磁盘容量>>du磁盘容量——磁盘容量告警排查与解决
  18. NumPy个人学习笔记【持续更新】
  19. 答读者问(18):一个大四学生有关专业发展的相关疑问
  20. 3GP/MP4 视频文件格式解析及其播放原理(转)

热门文章

  1. 监控linux内存,linux 监控系统资源-内存
  2. java并发执行一个方法_JAVA的执行并发原理
  3. java 向上转型_java向上转型和向下转型
  4. 判断单链表是否带环?若带环,求环的长度?求环的入口点?(C语言)
  5. oracletns中不存在名称为_关于数据库:向SQL Developer添加新连接时未显示Oracle TNS名称...
  6. 祖孙俩人是什么关系_一个人生活也挺好,为什么还需要亲密关系?
  7. mysql连接代替子查询_MySQL优化之使用连接(join)代替子查询
  8. clion 引用dll_用CLion实现本地方法并给java调用
  9. bigdecimal 保留两位小数_Python的保留小数及对齐
  10. php mysql query 行数_如何在PHP中获取MYSQL数据库返回的数据的行数?