如上图。
但是有显存占用说明模型应该是在跑的。后来既然GPU利用不起来,我干脆同时跑多个模型,想充分利用,但是效果还不是很明显,速度依然都很慢。
查了查资料发现可以在Dataloader里加pin_memory=True, num_workers=8,这样能将数据放入显存,并且通过多线程减少数据读入的时间,模型训练速度会快一些。但是我试了试也没有明显的效果,就很奇怪。
当然也试过增大batch size,但是治标不治本。

问题原因
所以到底为什么导致了这个原因呢?
后来我偶然为了减小最后的tensorboard log文件,我把一些用不到的tensorboard的写入比如直方图给删掉了,发现速度瞬间提上来了,然后再减小训练时的输出间隔,速度也有提升。立刻明白了,是因为训练的主要时间都花在了写日志上,文件IO耗时特别多,尤其是我设置的写入间隔还很小,所以GPU计算一瞬间,然后写很久的记录,计算一瞬间,再写很久的记录,最终导致速度特别慢。这也正是为了速度和我笔记本的GTX1050一样,因为大家比的都是写文件的速度。
最后的效果还是很好的,不愧是Tesla V100。ResNet50从最初跑一个epoch12分钟提升到四十多秒,如果删掉日志写入还能更快。而VG

GPU显存占满利用率GPU-util奇低相关推荐

  1. GPU显存占满利用率GPU-util为0

    文章目录 1.

  2. 解决Ubuntu系统找不到进程,但是GPU显存占满问题

    Ubuntu系统有时候会出现GPU显存显示占满,但是使用top命令和nvidia-smi命令都查找不到进程. fuser -v /dev/nvidia* 通过上条命令查找进程,然后使用 sudo ki ...

  3. GPU显存占满但利用率却很低

    来帕多瓦联培已经一个多月了,最近调代码跑实验又发现了这个问题.这里提供另外一个解决思路.一个原因还是 cpu没跟上gpu节奏. 通常我们都会用尽可能大的 batch 来占满显存.但是如果cpu的读取和 ...

  4. 关于GPU显存占满(即memory usage 很大),但GPU-util很小,导致模型训练很慢

    以下两个参数都可以使用nvidia-smi进行查看 GPU内存占用率: GPU内存的占用率往往是由模型大小和batchsize决定的,如果发现GPU占用率很小,比如40%,70%等等.如果此时网络结构 ...

  5. TensorFlow 显存占用率高 GPU利用率低

    文章目录 nvidia-smi指令 动态刷新GPU信息 显存占用高,但是CPU使用率低 回头再看 nvidia-smi指令 命令位置: 所以Path中添加环境变量: C:\Program Files\ ...

  6. GPU释放显存-----无进程但显存占满解决方法

    记录自己在学习中遇到的问题 在训练模型时打断训练进程,之后再想进行其他的训练或者验证步骤时,会提示显存已满 out of memory 使用 nvidia-smi 查看gpu使用情况,无法看见正在进行 ...

  7. 获取指定进程所占用内存、指定GPU显存信息、所有GPU型号和驱动

    ######################################################### # 获取指定进程所占用内存 ############################ ...

  8. GPU显存 - 深度学习中 GPU 和显存分析

    深度学习中 GPU 和显存分析 原文作者陈云. 本文原载于知乎专栏--人工智障的深度瞎学之路 深度学习最吃机器,耗资源,在本文,我将来科普一下在深度学习中: 何为"资源" 不同操作 ...

  9. 【tensorflow】 GPU 显存分配设置

    import osimport tensorflow as tfconfig = tf.ConfigProto()config.gpu_options.per_process_gpu_memory_f ...

最新文章

  1. grep零宽断言正则表达式
  2. python新手教程 从零开始-Python零基础从零开始学习Python十分钟快速入门
  3. 功能Java示例 第7部分–将失败也视为数据
  4. php的可变函数,php之可变函数的实例详解
  5. udp组播的应用场景
  6. Apache模块管理
  7. Proxy实现MySQL读写分离
  8. ios 系统提示框_二个消息:关于iOS12.2和iOS13 beta 1系统功能
  9. Eclipse ADT插件和主题
  10. Windows实现内外网同时使用
  11. 【基带】手机外设之SIM卡槽电路及其变化
  12. 毕设必备:Python采集全球疫情数据并做可视化分析
  13. vios配置的自动采集_VIOS共享存储池和精简配置
  14. 快进来看看!!!C语言——扫雷小游戏(递归展开无雷区)
  15. RuntimeError: mat1 and mat2 shapes cannot be multiplied
  16. DGraph的安装与使用
  17. 衡量风控模型优劣的曲线-PR曲线、ROC曲线、K-S曲线、Lift曲线
  18. 电销卡在哪里办理,有用过的没
  19. LVDS、FPD-Link/GMSL、MIPI的区别
  20. ubuntu20.04卸载virtualbox失败,“if your system is using efi secure boot you may need to sign the kernel “

热门文章

  1. GitHub怎么用?GitHub是什么?新手怎么用GitHub?图文并茂,不看都不行
  2. r6400 usb android,网件R6400路由器USB接口速率测试与总结
  3. 111. Minimum Depth of Binary Tree
  4. 计算机内存不能为read,电脑弹出窗口显示该内存不能为read的两种解决方法
  5. 销售中提问的技巧 PPT培训资料
  6. 樊登读书会终身成长读后感_(完整版)《终身成长》读后感
  7. 解决办法:Ubuntu 16.04 【缺少依赖】导致出现该错误——ERROR: the following packages/stacks could not have their
  8. 解决no matching host key type found. Their offer: ssh-rsa报错信息具体方法
  9. 智能卡操作系统COS概述(可以顺带了解下)
  10. 【LeetCode】825. Friends Of Appropriate Ages 解题报告(Python)