在训练MAE模型,GitHub上有有人实现好的代码https://github.com/yangyucheng000/mae,他是在Asecnd上多卡训练的,但是我只有单卡GPU,因此我把其中的代码都改成单卡GPU训练的模式了,在进行finetune的时候竟然报NCCL的错,但是在代码中我并没有配置分布式训练。请问这是怎么回事呢?应该怎么解决呢?是不是我在改单卡的时候漏掉了哪里呢,还是说我需要再配其他的东西?求指教!!!

解答:

根据报错信息,一定是脚本里面某个地方用到了通信,具体需要您再仔细检查一下您的运行脚本,如果确实找不到的话,您可以将对应修改后的脚本上传到gitee仓库并将仓库权限提交公开审核设置为公开后留言。

MindSpore单卡GPU训练竟然报NCCL的错相关推荐

  1. pytorch-多卡GPU训练

    一.cuda和cpu张量 记录cpu张量.cuda张量.list和array之间的转换关系. import torch import numpy as np # int -> tensor -& ...

  2. 黑苹果cpu支持列表_单卡gpu直通,黑苹果,amd_cpu教程

    本文github地址: Bebove/macos-kvm​github.com 适用: amd cpu(intel 也行?) nvidia 显卡,单卡. 安装黑苹果,(qemu虚拟机),通过pcie硬 ...

  3. 使用GPU训练yolo_v2报错:RuntimeError: CUDA out of memory. Tried to allocate XXX MiB

    报错内容: RuntimeError: CUDA out of memory. Tried to allocate 200.00 MiB (GPU 0; 8.00 GiB total capacity ...

  4. CPM-2细节发布!10大技术打通大模型「任督二脉」,单卡单机跑「千亿模型」不再是梦...

    智源导读:最近两年,预训练模型的参数量以每年 10 倍的速度迅猛增长,然而其计算效率的瓶颈也日渐显现. 例如以单块NVIDIA V100 GPU训练,GPT-1的计算时间是 3 天,到GPT-2 计算 ...

  5. pytorch GPU分布式训练 单机单卡、单机多卡

    可以用"watch -n 0.1 nvidia-smi"来查看gpu状态,我用的是3块12G的GPU进行实验 本实验将使用一个简单的瞎写的网络进行,网络训练一个分类任务,当然这个不 ...

  6. 设置GPU实现深度学习单卡、多卡 训练

    任务背景:在使用YOLOv5的过程中,使用DDP模式时,对其相关操作记录如下 一.查看服务器显卡使用情况 nvidia-smi 怎么看呢?具体参数含义如下: GPU:GPU 编号: Name:GPU ...

  7. 单机单卡,单机多卡,多机多卡训练代码

    单机多卡------>多机多卡:相当于把单进程的代码改成多进行的. 数据并行 PyTorch默认使用从0开始的GPU,且默认只使用0号GPU.如果要使用其他编号的GPU或者使用多块GPU,则要设 ...

  8. 深度估计自监督模型monodepth2在自己数据集的实战——单卡/多卡训练、推理、Onnx转换和量化指标评估

    本文详细介绍monodepth2模型在自己数据集的实战方法,包括单卡/多卡训练.推理.Onnx转换和量化评估等,关于理论部分请参见另一篇博客:深度估计自监督模型monodepth2论文总结和源码分析 ...

  9. 收藏 | GPU多卡并行训练总结

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:记忆的迷谷@ ...

最新文章

  1. C++ 笔记(02)— 程序结构(头文件说明、命名空间、函数返回值、函数参数、注释、语句结束符、cin/cout)
  2. C#利用SQLDMO备份与还原数据库
  3. 记录一下(session共享的文章,wcf记录一下学习地址,Firebug)
  4. 数据结构之自建算法库——链栈
  5. 摄像头图像分析目标物体大小位置_摄像头的原理、组成、选型及应用
  6. 鼠标经过超链接文字变色
  7. java遍历删除原理,Java 垃圾回收机制实现原理
  8. 小记 cin/get/getline
  9. php spl函数,PHP SPL标准库中的常用函数介绍
  10. SQL基本语句1——创建、添加、删除
  11. 一个朋友的精彩BLOG
  12. Excel如何快速根据身份证号码计算周岁?
  13. 远程教育英语和计算机难吗,网络教育英语统考难么?
  14. java基础面试题(二)附答案
  15. 【哈利波特】Sherbert Lemon对HP的解读之14
  16. 计算机硬盘属于主机还是外部设备,计算机主机的外部连接分别是什么?
  17. 饥荒联机版Centos下自动更新教程
  18. bash实现10进制,16进制等等相互之间转化(转)
  19. 时滞/延迟微分方程(delay-differential equation)
  20. android开发笔记之APK大小优化

热门文章

  1. matlab中数据格式转换
  2. 最容易理解的月薪除税Java计算器
  3. dac0832控制电机驱动流程图_dac0832锯齿波流程图
  4. 攻防世界wth.sh
  5. 关于Web网页的搜索方法
  6. 第五天 继续SQL多表查询
  7. Announcing Windows Template Studio in UWP
  8. 无法写入预编译头文件,由于 IO 设备错误,无法运行此项请求的错误的解决
  9. hao123简介【百度百科】
  10. 七天七夜,终于实现了实时的实例分割算法部署TensorRT,40FPS!