MindSpore单卡GPU训练竟然报NCCL的错
在训练MAE模型,GitHub上有有人实现好的代码https://github.com/yangyucheng000/mae,他是在Asecnd上多卡训练的,但是我只有单卡GPU,因此我把其中的代码都改成单卡GPU训练的模式了,在进行finetune的时候竟然报NCCL的错,但是在代码中我并没有配置分布式训练。请问这是怎么回事呢?应该怎么解决呢?是不是我在改单卡的时候漏掉了哪里呢,还是说我需要再配其他的东西?求指教!!!
解答:
根据报错信息,一定是脚本里面某个地方用到了通信,具体需要您再仔细检查一下您的运行脚本,如果确实找不到的话,您可以将对应修改后的脚本上传到gitee仓库并将仓库权限提交公开审核设置为公开后留言。
MindSpore单卡GPU训练竟然报NCCL的错相关推荐
- pytorch-多卡GPU训练
一.cuda和cpu张量 记录cpu张量.cuda张量.list和array之间的转换关系. import torch import numpy as np # int -> tensor -& ...
- 黑苹果cpu支持列表_单卡gpu直通,黑苹果,amd_cpu教程
本文github地址: Bebove/macos-kvmgithub.com 适用: amd cpu(intel 也行?) nvidia 显卡,单卡. 安装黑苹果,(qemu虚拟机),通过pcie硬 ...
- 使用GPU训练yolo_v2报错:RuntimeError: CUDA out of memory. Tried to allocate XXX MiB
报错内容: RuntimeError: CUDA out of memory. Tried to allocate 200.00 MiB (GPU 0; 8.00 GiB total capacity ...
- CPM-2细节发布!10大技术打通大模型「任督二脉」,单卡单机跑「千亿模型」不再是梦...
智源导读:最近两年,预训练模型的参数量以每年 10 倍的速度迅猛增长,然而其计算效率的瓶颈也日渐显现. 例如以单块NVIDIA V100 GPU训练,GPT-1的计算时间是 3 天,到GPT-2 计算 ...
- pytorch GPU分布式训练 单机单卡、单机多卡
可以用"watch -n 0.1 nvidia-smi"来查看gpu状态,我用的是3块12G的GPU进行实验 本实验将使用一个简单的瞎写的网络进行,网络训练一个分类任务,当然这个不 ...
- 设置GPU实现深度学习单卡、多卡 训练
任务背景:在使用YOLOv5的过程中,使用DDP模式时,对其相关操作记录如下 一.查看服务器显卡使用情况 nvidia-smi 怎么看呢?具体参数含义如下: GPU:GPU 编号: Name:GPU ...
- 单机单卡,单机多卡,多机多卡训练代码
单机多卡------>多机多卡:相当于把单进程的代码改成多进行的. 数据并行 PyTorch默认使用从0开始的GPU,且默认只使用0号GPU.如果要使用其他编号的GPU或者使用多块GPU,则要设 ...
- 深度估计自监督模型monodepth2在自己数据集的实战——单卡/多卡训练、推理、Onnx转换和量化指标评估
本文详细介绍monodepth2模型在自己数据集的实战方法,包括单卡/多卡训练.推理.Onnx转换和量化评估等,关于理论部分请参见另一篇博客:深度估计自监督模型monodepth2论文总结和源码分析 ...
- 收藏 | GPU多卡并行训练总结
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:记忆的迷谷@ ...
最新文章
- C++ 笔记(02)— 程序结构(头文件说明、命名空间、函数返回值、函数参数、注释、语句结束符、cin/cout)
- C#利用SQLDMO备份与还原数据库
- 记录一下(session共享的文章,wcf记录一下学习地址,Firebug)
- 数据结构之自建算法库——链栈
- 摄像头图像分析目标物体大小位置_摄像头的原理、组成、选型及应用
- 鼠标经过超链接文字变色
- java遍历删除原理,Java 垃圾回收机制实现原理
- 小记 cin/get/getline
- php spl函数,PHP SPL标准库中的常用函数介绍
- SQL基本语句1——创建、添加、删除
- 一个朋友的精彩BLOG
- Excel如何快速根据身份证号码计算周岁?
- 远程教育英语和计算机难吗,网络教育英语统考难么?
- java基础面试题(二)附答案
- 【哈利波特】Sherbert Lemon对HP的解读之14
- 计算机硬盘属于主机还是外部设备,计算机主机的外部连接分别是什么?
- 饥荒联机版Centos下自动更新教程
- bash实现10进制,16进制等等相互之间转化(转)
- 时滞/延迟微分方程(delay-differential equation)
- android开发笔记之APK大小优化