在docker中pytorch显卡利用率过低的问题

​ 刚刚在用docker利用用pytorch训练模型的时候报了一个错:RuntimeError: DataLoader worker (pid 493) is killed by signal: Bus error. Details are lost due to multiprocessing. Rerunning with num_workers=0 may give better error trace.

​ 一开始是因为在训练的时候发现显卡的利用率太低了,显卡有一半的时间处于空闲状态,这不行啊,这得训练到何年何月去了,猜测应该是CPU预处理数据耗费了太多时间导致的,于是把DataLoader的num_workers参数设置为8,然后就报了上面那个错误,于是google查了一下,这应该是设置了num_works不为0的时候,导致docker和宿主计算机的共享内存不够了,于是就报了这个错,怎么解决呢?在创建docker的时候加上–shm-size=16G这个参数就ok啦。于是显卡利用率基本都能保持在99%这样了,当然会有点波动,训练速度提升了不少。

pythorch显卡利用率过低的问题相关推荐

  1. 显卡利用率低可能的原因汇总

    1. 确定是否用到GPU 运行下面命令动态查看GPU使用情况. watch -n 0.1 nvidia-smi 如果程序运行时,Processes栏有自己的程序名字,说明使用到了GPU.请仔细观察显存 ...

  2. 强化学习技巧四:模型训练速度过慢、GPU利用率较低,CPU利用率很低问题总结与分析。

    1.PyTorchGPU利用率较低问题原因: 在服务器端或者本地pc端, 输入nvidia-smi 来观察显卡的GPU内存占用率(Memory-Usage),显卡的GPU利用率(GPU-util),然 ...

  3. 深度学习PyTorch,TensorFlow中GPU利用率较低,CPU利用率很低,且模型训练速度很慢的问题总结与分析

    在深度学习模型训练过程中,在服务器端或者本地pc端,输入nvidia-smi来观察显卡的GPU内存占用率(Memory-Usage),显卡的GPU利用率(GPU-util),然后采用top来查看CPU ...

  4. Nvidia GPU信息nvidia-smi(Persistence-M持久性内存、Volatile Uncorr. ECC显存错误校正、GPU-Util显卡利用率、Compute M.显卡计算模式)

    文章目录 ubuntu20.04 nvidia-smi指令信息 C:\Users\SIQI>cd C:\Program Files\NVIDIA Corporation\NVSMIC:\Prog ...

  5. Surface book2 1060显卡性能较低的解决方法

    安装微软官方book2的专属镜像 闲着无聊,电脑重置了一下,结果显卡性能贼低,吃鸡只有30多帧,显卡驱动是461.40. 这是我的电脑跑分 这是别人电脑跑分 可以看出来,我的book2性能损失十分严重 ...

  6. 14.Linux rpm,brew软件安装包命令,zsh和bash,内置命令和外部命令,ps命令,top命令解析,swp,为什么cpu利用率很低,负载却很高?

    解释一下rpm, opt,opt-get, brew,brewhome rpm,apt,apt-get,brew,和homebrew都是与软件包管理有关的术语.它们分别用于不同的操作系统. rpm是一 ...

  7. python显卡利用率_GPU Memory Problems in PyTorch(显卡爆炸与利用率不足)

    如今研究人工智能,跑深度学习算法,显卡/GPU绝对是第一大门槛,所以不管您是1080Ti还是V100,如果不能发挥出GPU的最大能力,那它可能就是不是显卡而是块普通的砖头了吧. 显卡爆炸 显卡爆炸和内 ...

  8. amd锐龙笔记本cpu怎么样_AMD锐龙处理器+GTX 16XX显卡或拉低游戏本价格

    根据目前掌握的消息,搭载AMD锐龙7 3750H.锐龙5 3550H处理器的游戏本预计很快就要上市了,宏碁Nitro.华硕TUF Gaming.惠普Pavilion/OMEN等都会在第一时间推出.作为 ...

  9. 查看显卡利用率 python_既然大家都说装了win10,就不用鲁大师监测显卡温度,为什么呢?...

    提到鲁大师软件,相信大家多多少少都有听过和用过,尤其是在需要检测硬件温度,维持电脑运行稳定的时候. 电脑需要运行较为大型的软件或者游戏的时候,比如使用CAD.绝地等等,往往需要进行大量的运算,如果电脑 ...

最新文章

  1. R语言单变量分析实战:汇总统计(Summary Statistics)、频率表(Frequency Table)、图表(charts: boxplot、histogram、density)
  2. Metadata GC Threshold导致的full gc分析
  3. Chrome 正在测试标签页的预览功能
  4. 算法题指南书_分类算法指南
  5. 短信认证方案,用手机短信进行上网认证如何实现?
  6. 数据类型、常量、变量
  7. 【转】 VC MFC 钩子 实现 自绘 窗体 标题栏 非客户区
  8. super(Net,self).__init__() 的含义
  9. GO开发 -- could not launch process: decoding dwarf section info at offset 0x0: too short
  10. 技术总监夸我“索引”用的溜,我飘了......
  11. 使用深度学习进行表检测、信息提取和构建
  12. Mujoco安装 最简单方法
  13. 在线客服系统可以帮助企业解决哪些问题?
  14. html文档怎么设置默认浏览器打开,win10系统如何设置HTML文件指定浏览器打开?...
  15. Lowe‘s EDI 855 采购订单确认报文详解
  16. 有哪些好用的视频录制工具?
  17. mysql 参数嗅探_一次存储过程参数嗅探定位流程总结
  18. 怎么用u盘重装系统?石大师u盘重装win10系统步骤
  19. 新员工碰到新问题 公司论坛帮解决
  20. JS实现二级、三级、四级联动效果。详细

热门文章

  1. Android 中 vector 反汇编示例
  2. php7帝国CMS报错Deprecated: Function get_magic_quotes_gpc()
  3. Python安装numpy,matplotlib
  4. java jdk 有几个版本_JDK各个版本比较 JDK5~JDK10
  5. 数字图像处理--平滑滤波
  6. 西门子PLC S7-200cn和S7-200 smart 。 设备锁机程序
  7. 覆盖libc.so.6的惨痛教训
  8. java使用for循环打印出所有的水仙花数
  9. 扫地机器人哪个牌子好
  10. Redis研究(十四)—管理工具