最近需要使用 nvprof 此时cuda 程序运行的性能,下面对使用过程进行简要记录,进行备忘:

  • 常用使用命令:nvprof --unified-memory-profiling off python run.py (这是因为某块内存被设置了不允许分析,导致)参考:https://docs.nvidia.com/cuda/profiler-users-guide/index.html#unified-memory-profiling
  • nvprof --unified-memory-profiling off python run.py (2>run.txt 1>out.txt)
  • nvprof --unified-memory-profiling off --print-gpu-trace python run.py
  • nvprof --unified-memory-profiling off --print-gpu-trace -o prof.nvvp python run.py
  • nvvp prof.nvvp (使用 x11 forwarding)
  • ./run.sh 2>runsh_out.txt

Non-Visual Profiler 和 Visual Profiler  的使用:

# nvprof
nvprof python train_mnist.py
nvprof --print-gpu-trace python train_mnist.py #nvvp (可以使用x11 forwarding 使用,当然更适合在本机使用)
nvprof -o prof.nvvp python train_mnist.py (在GPU集群上生成 .nvvp文件)
scp your_gpu_machine:/path/to/prof.nvvp . (scp 拷贝文件到本地)
nvvp prof.nvvp (在本地机器上进行可视化分析)

参考链接:

https://blog.csdn.net/yinhuier/article/details/80551268 (简单使用教程)

https://docs.nvidia.com/cuda/profiler-users-guide/index.html (nvidia 官网教程)

https://gist.github.com/sonots/5abc0bccec2010ac69ff74788b265086 (一个日本工程师写的文档,不错,本文大多命令摘自此文档,文档中有较为详细的实例截图,可以参考)

https://blog.csdn.net/haoqimao_hard/article/details/80557740 (CSDN 上较为简洁的博客,可以参考使用)

https://indico-jsc.fz-juelich.de/event/32/material/0/5.pdf (德国一个简单介绍的资料)

保持更新,更多内容请关注 cnblogs.com/xuyaowen; 如果对您有帮助,还请点击推荐或关注~!

nvprof 使用记录; 以及使用 nvprof 查看tensorflow-gpu 核函数运行记录相关推荐

  1. tensorflow学习笔记:查看tensorflow可配置运算资源以及配置使用GPU运算

    查看tensorflow可配置运算资源以及配置使用GPU运算 因为还用不到分布式的tensorflow,自己没有尝试过所以就不写分布式tensorflow的使用了(等自己用上了再说),这里记录一下在跑 ...

  2. 查看tensorflow安装版本

    参考https://blog.csdn.net/qq_40614981/article/details/83035783 自己实操 由于tensorflow版本不同,可能一些函数的调用也有变换,这时候 ...

  3. 查看tensorflow pb模型文件的节点信息

    查看tensorflow pb模型文件的节点信息: import tensorflow as tf with tf.Session() as sess:with open('./quantized_m ...

  4. 如何查看tensorflow源代码

    刚入门机器学习相关的软件包时,里面好多函数参数不知道应该怎么填,很茫然,这就需要看他自己的函数是怎么实现的,最起码知道调用的函数需要什么参数,报错了也不知道为什么会报错,如果只是依赖网上查,出错了就去 ...

  5. Tensorflow Summary: 查看Tensorflow Model pb格式模型的信息

    参考文链:如何查看Tensorflow SavedModel格式模型的信息; 参考:summary方法--小酒窝的博客; 参考:tensorflow中输出参数的方法--详细; tensorflow生成 ...

  6. linux 查看cuda版本_Ubuntu18.04+Tensorflow GPU版本环境搭建

    硬件平台:笔记本 处理器:I7 显卡:GTX960 系统:Ubuntu18.04 64位 步骤1.安装CUDA(无显卡不必安装) 去NVIDIA官网:CUDA Toolkit Archive 下载CU ...

  7. 查看tensorflow版本以及路径:

    查看tensorflow版本以及路径: import tensorflow as tf print(tf.__version__) print(tf.__path__) 运行后如下所示:

  8. 查看安装的tensorflow是哪个版本,查看Tensorflow是GPU还是CPU

    >>>import tensorflow as tf >>>tf.__version__ '2.1.0' >>> tf.__path__ ['C: ...

  9. mysql查看当前库所有表记录数_mysql中查看数据库中所有表的记录数

    我们继续我们的博客创建.           在一个项目日常的运行中,常常会为服务过慢而导致用户体验不好,在这一点上,常常需要进行性能优化,而如果没有针对性的对某一个 模块进行优化,那么效果往往是不理 ...

  10. MAC如何查看Tensorflow版本号

    详细教程:MAC如何查看Tensorflow版本号 #首先打开MAC终端(terminal) 1.激活tensorflow: 2.然后进入python(根据版本不同输入自带版本号) 3.输入pytho ...

最新文章

  1. 【c语言】蓝桥杯算法提高 算术运算
  2. SQVI和SAP查询QUERY的区别和使用注意事项
  3. 3.type关键字.rs
  4. python解析http数据包_如何在python中嗅探HTTP数据包?
  5. JMM模型到并发编程
  6. 风格化图像_【开源】图像风格化和目标检测
  7. sklearn及gensim下lda模型的训练
  8. IE和Firefox浏览器下javascript、CSS兼容性研究
  9. windows10一右击就转圈圈,假死状态解决了
  10. 全面替代Microsoft Office、Microsoft visio和WPS的优秀开源文档编辑器LibreOffice
  11. PySimpleGUI经典实践之:这个汉字怎么读?
  12. Davinci的异构多核间通信基础组件SysLink
  13. 51单片机交通灯(定时器+38译码器+中断)
  14. php微信手机端上传图片,手机Wap微信端上传单图和上传多图的DEMO
  15. 【Mysql笔试】-常见笔试题汇总
  16. 星起航:跨境电商行业卖家可利用新技术打造成熟供应链
  17. python 播放本地音乐_python本地音乐播放器
  18. 与项目管理专家就软件项目管理专题探讨实录
  19. 【Elasticsearch实践】(六)ES搜索
  20. 为什么显示芒果tv服务器异常怎么办,芒果TV显示MAC认证状态异常怎么办?

热门文章

  1. Shopify 入门 (英文)
  2. 20个有用的 PHP + jQuery 组件和教程
  3. docker之使用supervisor管理多个进程
  4. RabbitMQ实现RPC
  5. SpringBoot—整合log4j2入门和log4j2.xml配置详解
  6. TCP连接三次握手和四次挥手
  7. 课程目标 线程 java 1615387415
  8. 前端开发 表单控件高级 0303
  9. 前端开发 网络图片的下载与切图操作 0228 需操作
  10. celery-03-操作a-发布人一方