DistributedDataParallel (既可单机多卡又可多机多卡)

先奉上官网nn.DistributedDataParallel(model)链接

https://pytorch.org/docs/stable/generated/torch.nn.parallel.DistributedDataParallel.html#torch.nn.parallel.DistributedDataParallel​pytorch.org

  1. CLASS torch.nn.parallel.DistributedDataParallel(module, device_ids=None, output_device=None,

  2. dim=0, broadcast_buffers=True, process_group=None, bucket_cap_mb=25,

  3. find_unused_parameters=False, check_reduction=False)

  • 参数定义

module是要放到多卡训练的模型;

device_ids数据类型是一个列表, 表示可用的gpu卡号;

output_devices数据类型也是列表,表示模型输出结果存放的卡号(如果不指定的话,默认放在0卡,这也是为什么多gpu训练并不是负载均衡的,一般0卡会占用的多,这里还涉及到一个小知识点——如果程序开始加os.environ["CUDA_VISIBLE_DEVICES"] = "2, 3", 那么0卡(逻辑卡号)指的是2卡(物理卡号))。

dim

torch distributed 多GPU训练笔记相关推荐

  1. 笔记:caffe安装编译,并用ssd gpu训练自己的数据集

    caffe ssd GPU训练自己的数据集 一.caffe环境搭建 二.数据集 三.训练和测试 一.caffe环境搭建 环境搭建过程网上有很多教程,可能要踩些坑吧,正常,这里不多赘述,主要是我当时也没 ...

  2. 笔记:caffe ssd gpu训练自己的数据集

    caffe ssd GPU训练自己的数据集 一.caffe环境搭建 二.数据集 三.训练和测试 一.caffe环境搭建 环境搭建过程网上有很多教程,可能要踩些坑吧,正常,这里不多赘述,主要是我当时也没 ...

  3. Pytorch中多GPU训练指北

    前言 在数据越来越多的时代,随着模型规模参数的增多,以及数据量的不断提升,使用多GPU去训练是不可避免的事情.Pytorch在0.4.0及以后的版本中已经提供了多GPU训练的方式,本文简单讲解下使用P ...

  4. insightface 切换GPU训练报错解决

    insightface代码: https://github.com/deepinsight/insightface 在pytorch训练时,先用gpu1训练,再用gpu2训练,加载gpu1的预训练时报 ...

  5. pytorch指定用多张显卡训练_Pytorch中多GPU训练指北

    前言 在数据越来越多的时代,随着模型规模参数的增多,以及数据量的不断提升,使用多GPU去训练是不可避免的事情.Pytorch在0.4.0及以后的版本中已经提供了多GPU训练的方式,本文简单讲解下使用P ...

  6. pytorch使用GPU炼丹笔记

    如何使用GPU训练/测试模型 使用单GPU 设置设备 将数据转换成CUDA张量 将模型参数转换成CUDA张量 使用指定GPU 1.使用CUDA_VISIBLE_DEVICES. 1.1 直接在终端或s ...

  7. PyTorch 1.0 中文文档:torch.distributed

    译者:univeryinli 后端 torch.distributed 支持三个后端,每个后端具有不同的功能.下表显示哪些功能可用于CPU/CUDA张量.仅当用于构建PyTorch的实现支持时,MPI ...

  8. Pytorch DDP分布式数据合并通信 torch.distributed.all_gather()

    文章目录 1. 官网介绍 2. all_gather()不进行梯度传播,用于模型test或eval状态 3. all_gather()需要进行梯度传播,用于模型train状态 4. 相关链接 1. 官 ...

  9. pytorch 多GPU训练总结(DataParallel的使用)

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/weixin_40087578/arti ...

最新文章

  1. 开源项目:windows下使用MinGW+msys编译ffmpeg
  2. 直线宽度2 points wide_OpenGL 绘图实例二之直线和圆弧的绘制
  3. 【网络爬虫】BeautfulSoup爬百度百科(真の能看懂~!)
  4. 使用 VS2005 编译 directshow sample 时链接错误
  5. boost::foreach模块右值 const_r的测试程序
  6. c 结构体转byte_C中结构体和字节流的互换及内存对齐
  7. HDU 4143 A Simple Problem 分解因式
  8. Flutter之_slot 插槽属性详解
  9. 6月读书《有效的管理者》笔记
  10. 2022全国大学生数学建模竞赛获奖难么?国赛求解过程技巧及方案
  11. python绘制中文柱状图+显示数字
  12. 软件开发相关书籍看这些就够了
  13. 2016-07-09Cpp_jianjie
  14. 冰冻三尺,非一日之寒!
  15. 银耳椰椰——Alpha冲刺Day08
  16. java 日期加7天_java – 如何检查日期是否超过七天
  17. 写作人的福音——obsidian非官方插件之senGener
  18. 【维生素C语言】第十一章 - 字符串函数与内存函数
  19. Wallis formula(华里士/沃利斯公式)
  20. SAP MM批次管理(1)物料与批次--大海

热门文章

  1. NtQueryInformationProcess用法
  2. UNIX中的restrict
  3. Android开发--PreferenceActivity中打开子PreferenceScreen黑屏的解决办法
  4. 深入理解Spark Streaming执行模型
  5. django oracle数据库配置,django连接oracle时setting 配置方法
  6. 计算机中丢失UID.MR.DLL,计算机中丢失.dll如何解决 大师来详解
  7. 南通专转本计算机考试几级,江苏专转本考试了解多少?
  8. golang runtime.findrunnable epoll_wait lock 占用CPU 过多排查
  9. java大文件 索引_JAVA 大文件上传解决方案(500M以上)
  10. 写一个不能被继承的类(友元的不可继承性)