ubuntu环境上,安装cuda,会自动安装一些工具nvcc ,nvprof nvcc-gdb....

1.编译生成可执行文件

2.nvprof ./test

可以把性能分析数据输出到文件中

nvprof ./test -o test.nvvp

可以把在nvidia visual profiler现实更加直观

一些常用的配置参数:

  1. achieved_occupancy参数:每个sm在每个cycle能够达到的最大activewarp 占总warp的比例。

    nvprof --metrics achieved_occupancy ./a.out
    
  2. gld_throughput: global load throughput (查看memory 的throughput)

     nvprof --metrics gld_throughput ./a.out
    
  3. gld_efficiency: global memory loadefficiency: device memory bandwidth的使用率

     nvprof –metrics gld_efficiency ./a.out
    
  4. 查看运行时候的信息:IPC(instruction per cycle)

     nvprof --metrics ipc ./a.out
    
  5. 查看所有的以上信息:

     nvprof --metrics all ./a.out
    

cuda编程性能 分析工具 nvprof的使用相关推荐

  1. .NET 11 个 Visual Studio 代码性能分析工具

    原文地址 软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行 ...

  2. 11个Visual Studio代码性能分析工具

    软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...

  3. 11 个 Visual Studio 代码性能分析工具

    软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...

  4. Windows phone 7应用之代码性能分析工具——Profile.

    前端时间断断续续的写了几篇关于Windows phone 7本地数据库访问文章. 最近在Window phone 7 APPStore上注册Apphub账号看到很多很有意思的小应用, 也结识几个专职做 ...

  5. 前端性能分析工具-Lighthouse

    1.前言 对于前端开发人员来说,除了实现页面功能外,那就是页面的性能响应问题也要关注.同样对于测试人员在进行性能测试时,也要关注前端页面的性能指标.测试前端性能市面上可以用到的工具也比较多,比如可以用 ...

  6. C++ 性能分析工具调研

    文章目录 0. 前言 1. gprof 3. valgrind 4. gperftools 5. perf 0. 前言 目标:性能分析(profile)包含的内容特别多,但目前我只关注运行时间. 详细 ...

  7. 正确使用 Android 性能分析工具——TraceView

    前面唠叨 最近公司app中有些列表在滑动的时候会有卡顿现象,我就开始着手解决这些问题,解决问题之前首先要分析列表滑动的性能瓶颈在什么地方.因为之前不会正确使用TraceView这个工具,主要是看不懂T ...

  8. php性能分析工具 - xhprof的安装使用

    一.前言 有用的东西还是记录下来吧,也方便以后的查询:这次记录一下xhprof的安装使用: xhprof是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低, ...

  9. 系统级性能分析工具perf的介绍与使用

    测试环境:Ubuntu16.04 + Kernel:4.4.0-31 apt-get install linux-source cd /usr/src/tools/perf make &&am ...

最新文章

  1. python二元函数如何编写,如何用Python和sklearn编写多元对数回归?
  2. BD-09 GCJ-02 WGS84 坐标之间的转换
  3. wince6.0驱动开发
  4. 一款好看的提示框-------记录一下地址
  5. python基础教程免费视频-零基础小白python从入门到精通视频(全60集)
  6. Logic Pro for Mac(音频制作软件)V10.6.2中文版 支持M1芯片版mac
  7. 【Android】Android--Dialog
  8. IP地址归属地和手机号码归属地批量查询(单次支持500个以内,支持结果导出xls)
  9. JUnit5学习之一:基本操作
  10. 公司官网建站笔记(四):从阿里云将域名转出,并将域名转入腾讯云
  11. Element-ui中form组件的校验规则
  12. ipad服务器响应超时,iPad Air连接iTunes设备超时
  13. 开心庄园html的代码,HTML第五章(示例代码)
  14. 西部之旅之------相机的选择
  15. Pycurl的简单使用与对比 - 一只橘子的异想世界
  16. 关于win7 出现两个本地连接不能上网的问题?
  17. FPGA与CPLD的概念及其区别
  18. 完全重映射和部分重映射分析(超详细)
  19. H3C 交换机DRNI特性使用介绍
  20. 使用word插入无法编辑的对象

热门文章

  1. 列举python中可变数据类型_python 可变数据类型 和 不可变数据类型
  2. Java技术学习笔记:C/S 与B/S 区别
  3. long mode 分页_在Spring Boot中使用Spring-data-jpa实现分页查询(转)
  4. bigdecimal 判断是否为数字_C语言判断字符串是否为回文
  5. 转换背景色 html,html – CSS转换:淡化背景颜色,重置后
  6. java文件学生_文件存储学生信息(JavaIO流)
  7. php curl header_PHP中的yield与协程(二十一节)
  8. 如何修改ant-input的高度_水质自动采样器的流量计功能如何应用?
  9. ios 捕抓crash_ios crash的原因与抓取crash日志的方法
  10. php如何检测键盘按键,js键盘事件,判断按下的是哪个键