1、同步更新

在同步更新的时候, 每次梯度更新,要等所有分发出去的数据计算完成后,返回回来结果之后,把梯度累加算了均值之后,再更新参数。这样的好处是loss的下降比较稳定, 但是这个的坏处也很明显, 处理的速度取决于最慢的那个分片计算的时间。

2、异步更新

在异步更新的时候, 所有的计算节点,各自算自己的, 更新参数也是自己更新自己计算的结果, 这样的优点就是计算速度快,计算资源能得到充分利用,但是缺点是loss的下降不稳定,抖动大。

3、如何选择

在数据量小的情况下,各个节点的计算能力比较均衡的情况下,推荐使用同步模式。数据量很大,各个机器的计算性能掺差不齐的情况下,推荐使用异步的方式。

tensorflow分布式训练之同步更新和异步更新相关推荐

  1. 深度学习(五十五)tensorflow分布式训练

    tensorflow分布式训练 博客:http://blog.csdn.net/hjimce 微博:黄锦池-hjimce   qq:1393852684 情况一.单机单卡 单机单卡是最普通的情况,当然 ...

  2. Tensorflow分布式训练原理

    以下文章摘录自: <机器学习观止--核心原理与实践> 京东: https://item.jd.com/13166960.html 当当:http://product.dangdang.co ...

  3. 阿里云高性能AI服务 -- 基于Docker和EGS一键创建高性能Tensorflow分布式训练

    一. 概述 Tensorflow是目前使用最为广泛的深度学习框架之一,但是目前搭建分布式多机多卡训练比较困难,而且Tensorflow原生的分布式的性能很差,特别在云计算虚拟化环境下并行的挑战更大. ...

  4. Tensorflow分布式训练的调度方案

    背景 随着机器学习和人工智能的迅猛发展,业界出现了许多开源的机器学习平台.由于机器学习与大数据天然的紧密结合,基于 Hadoop Yarn 的分布式任务调度仍是业界主流,但是随着容器化的发展,Dock ...

  5. tensowflow 训练 远程提交_一文说清楚Tensorflow分布式训练必备知识

    Note: 原文发表于我的知乎专栏:算法工程师的自我修养,欢迎关注! Methods that scale with computation are the future of AI. -Rich S ...

  6. 如何像用MNIST一样来用ImageNet?这里有一份加速TensorFlow分布式训练的梯度压缩指南

    作者 | 王佐 今年的 NIPS 出现 "Imagenet is the new MNIST" 口号,宣告使用 MNIST 数据集检验网络模型性能已经成为过去式.算法工程师们早就意 ...

  7. 阿里云深度学习实验室(DL-Lab) -- 基于Docker和EGS一键创建高性能Tensorflow分布式训练

    原文链接:点击打开链接 摘要: ## 一. 概述 Tensorflow是目前使用最为广泛的深度学习框架之一,但是目前搭建分布式多机多卡训练比较困难,而且Tensorflow原生的分布式的性能很差. 为 ...

  8. TensorNet——基于TensorFlow的大规模稀疏特征模型分布式训练框架

    女主宣言 今天小编为大家分享一篇有关于TensorNet的文章.TensorNet是一个构建在TensorFlow之上针对广告推荐等大规模稀疏场景优化的分布式训练框架.希望能对大家有所帮助. PS:丰 ...

  9. 使用 TensorFlow 2.0 进行分布式训练

    TensorFlow官方最新翻译:https://www.tensorflow.org/guide/distributed_training?hl=zh-cn,本文的翻译过时了 概览 tf.distr ...

最新文章

  1. LeSS is More - 大规模敏捷开发框架LeSS实践(一)
  2. acm算法模板(1)
  3. iphone11返回上一级手势怎么设置_苹果iphone12怎么关闭程序appp 怎么返回上一步
  4. 标准程序的Parameter id 并不一定准确
  5. 常见优化算法批量梯度下降、小批量梯度下降、随机梯度下降的对比
  6. [LeetCode] Majority Element II
  7. 17ー03ー20 日本語勉強
  8. Sibelius 8 for Mac(西贝柳斯打谱软件)中文破解版
  9. 【算法学堂】字符串基础算法
  10. Maven clean基本命令
  11. 计算机连接拒绝无法连接失败,打印机拒绝访问,教您打印机拒绝访问无法连接怎么解决...
  12. RFC1191 路径MTU发现
  13. matlab trapz二重积分函数_「matlab 积分」使用Matlab求解定积分/不定积分 - seo实验室...
  14. 人脸表情系列:论文阅读——Facial Expression Recognition by De-expression Residue Learning
  15. IT运维管理的服务内容包括哪些
  16. JeecgBoot 2.4.6 版本发布,基于代码生成器的企业级低代码平台
  17. MSR165数据记录仪让运输透明化
  18. 中南民族大学计算机图像处理实验报告,中南民族大学数字图像处理实验报告.docx...
  19. 值得收藏的6个OCR文字识别软件,帮你提升10倍工作效率
  20. ❤️数据可视化❤️:基于Echarts + GeoJson实现的地图视觉映射散点(气泡)组件【15】 - 江西省

热门文章

  1. JavaScript创建或填充任意长度的数组
  2. 2021-05-21 matlab 傅里叶变换后恢复信号
  3. OpenCV中图像的BGR格式 Img对象的属性说明
  4. Python tensorflow ModuleNotFoundError: No module named ‘tensorflow.contrib‘
  5. python中的gui界面编程_python应用系列教程——python的GUI界面编程Tkinter全解
  6. 1.大数据处理架构Hadoop
  7. VS2010 断点无效肿么办?
  8. R-CNN和SPP-net
  9. JVM实用参数(四)内存调优
  10. 如何正确遍历删除List中的元素,你会吗?