torch distributed 多GPU训练笔记
DistributedDataParallel
(既可单机多卡又可多机多卡)
先奉上官网nn.DistributedDataParallel(model)链接
https://pytorch.org/docs/stable/generated/torch.nn.parallel.DistributedDataParallel.html#torch.nn.parallel.DistributedDataParallelpytorch.org
CLASS torch.nn.parallel.DistributedDataParallel(module, device_ids=None, output_device=None,
dim=0, broadcast_buffers=True, process_group=None, bucket_cap_mb=25,
find_unused_parameters=False, check_reduction=False)
- 参数定义
module是要放到多卡训练的模型;
device_ids数据类型是一个列表, 表示可用的gpu卡号;
output_devices数据类型也是列表,表示模型输出结果存放的卡号(如果不指定的话,默认放在0卡,这也是为什么多gpu训练并不是负载均衡的,一般0卡会占用的多,这里还涉及到一个小知识点——如果程序开始加os.environ["CUDA_VISIBLE_DEVICES"] = "2, 3", 那么0卡(逻辑卡号)指的是2卡(物理卡号))。
dim
torch distributed 多GPU训练笔记相关推荐
- 笔记:caffe安装编译,并用ssd gpu训练自己的数据集
caffe ssd GPU训练自己的数据集 一.caffe环境搭建 二.数据集 三.训练和测试 一.caffe环境搭建 环境搭建过程网上有很多教程,可能要踩些坑吧,正常,这里不多赘述,主要是我当时也没 ...
- 笔记:caffe ssd gpu训练自己的数据集
caffe ssd GPU训练自己的数据集 一.caffe环境搭建 二.数据集 三.训练和测试 一.caffe环境搭建 环境搭建过程网上有很多教程,可能要踩些坑吧,正常,这里不多赘述,主要是我当时也没 ...
- Pytorch中多GPU训练指北
前言 在数据越来越多的时代,随着模型规模参数的增多,以及数据量的不断提升,使用多GPU去训练是不可避免的事情.Pytorch在0.4.0及以后的版本中已经提供了多GPU训练的方式,本文简单讲解下使用P ...
- insightface 切换GPU训练报错解决
insightface代码: https://github.com/deepinsight/insightface 在pytorch训练时,先用gpu1训练,再用gpu2训练,加载gpu1的预训练时报 ...
- pytorch指定用多张显卡训练_Pytorch中多GPU训练指北
前言 在数据越来越多的时代,随着模型规模参数的增多,以及数据量的不断提升,使用多GPU去训练是不可避免的事情.Pytorch在0.4.0及以后的版本中已经提供了多GPU训练的方式,本文简单讲解下使用P ...
- pytorch使用GPU炼丹笔记
如何使用GPU训练/测试模型 使用单GPU 设置设备 将数据转换成CUDA张量 将模型参数转换成CUDA张量 使用指定GPU 1.使用CUDA_VISIBLE_DEVICES. 1.1 直接在终端或s ...
- PyTorch 1.0 中文文档:torch.distributed
译者:univeryinli 后端 torch.distributed 支持三个后端,每个后端具有不同的功能.下表显示哪些功能可用于CPU/CUDA张量.仅当用于构建PyTorch的实现支持时,MPI ...
- Pytorch DDP分布式数据合并通信 torch.distributed.all_gather()
文章目录 1. 官网介绍 2. all_gather()不进行梯度传播,用于模型test或eval状态 3. all_gather()需要进行梯度传播,用于模型train状态 4. 相关链接 1. 官 ...
- pytorch 多GPU训练总结(DataParallel的使用)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/weixin_40087578/arti ...
最新文章
- 开源项目:windows下使用MinGW+msys编译ffmpeg
- 直线宽度2 points wide_OpenGL 绘图实例二之直线和圆弧的绘制
- 【网络爬虫】BeautfulSoup爬百度百科(真の能看懂~!)
- 使用 VS2005 编译 directshow sample 时链接错误
- boost::foreach模块右值 const_r的测试程序
- c 结构体转byte_C中结构体和字节流的互换及内存对齐
- HDU 4143 A Simple Problem 分解因式
- Flutter之_slot 插槽属性详解
- 6月读书《有效的管理者》笔记
- 2022全国大学生数学建模竞赛获奖难么?国赛求解过程技巧及方案
- python绘制中文柱状图+显示数字
- 软件开发相关书籍看这些就够了
- 2016-07-09Cpp_jianjie
- 冰冻三尺,非一日之寒!
- 银耳椰椰——Alpha冲刺Day08
- java 日期加7天_java – 如何检查日期是否超过七天
- 写作人的福音——obsidian非官方插件之senGener
- 【维生素C语言】第十一章 - 字符串函数与内存函数
- Wallis formula(华里士/沃利斯公式)
- SAP MM批次管理(1)物料与批次--大海
热门文章
- NtQueryInformationProcess用法
- UNIX中的restrict
- Android开发--PreferenceActivity中打开子PreferenceScreen黑屏的解决办法
- 深入理解Spark Streaming执行模型
- django oracle数据库配置,django连接oracle时setting 配置方法
- 计算机中丢失UID.MR.DLL,计算机中丢失.dll如何解决 大师来详解
- 南通专转本计算机考试几级,江苏专转本考试了解多少?
- golang runtime.findrunnable epoll_wait lock 占用CPU 过多排查
- java大文件 索引_JAVA 大文件上传解决方案(500M以上)
- 写一个不能被继承的类(友元的不可继承性)