cuda编程性能 分析工具 nvprof的使用
ubuntu环境上,安装cuda,会自动安装一些工具nvcc ,nvprof nvcc-gdb....
1.编译生成可执行文件
2.nvprof ./test
可以把性能分析数据输出到文件中
nvprof ./test -o test.nvvp
可以把在nvidia visual profiler现实更加直观
一些常用的配置参数:
achieved_occupancy参数:每个sm在每个cycle能够达到的最大activewarp 占总warp的比例。
nvprof --metrics achieved_occupancy ./a.out
gld_throughput: global load throughput (查看memory 的throughput)
nvprof --metrics gld_throughput ./a.out
gld_efficiency: global memory loadefficiency: device memory bandwidth的使用率
nvprof –metrics gld_efficiency ./a.out
查看运行时候的信息:IPC(instruction per cycle)
nvprof --metrics ipc ./a.out
查看所有的以上信息:
nvprof --metrics all ./a.out
cuda编程性能 分析工具 nvprof的使用相关推荐
- .NET 11 个 Visual Studio 代码性能分析工具
原文地址 软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行 ...
- 11个Visual Studio代码性能分析工具
软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...
- 11 个 Visual Studio 代码性能分析工具
软件开发中的性能优化对程序员来说是一个非常重要的问题.一个小问题可能成为一个大的系统的瓶颈.但是对于程序员来说,通过自身去优化代码是十分困难的.幸运的是,有一些非常棒的工具可以帮助程序员进行代码分析和 ...
- Windows phone 7应用之代码性能分析工具——Profile.
前端时间断断续续的写了几篇关于Windows phone 7本地数据库访问文章. 最近在Window phone 7 APPStore上注册Apphub账号看到很多很有意思的小应用, 也结识几个专职做 ...
- 前端性能分析工具-Lighthouse
1.前言 对于前端开发人员来说,除了实现页面功能外,那就是页面的性能响应问题也要关注.同样对于测试人员在进行性能测试时,也要关注前端页面的性能指标.测试前端性能市面上可以用到的工具也比较多,比如可以用 ...
- C++ 性能分析工具调研
文章目录 0. 前言 1. gprof 3. valgrind 4. gperftools 5. perf 0. 前言 目标:性能分析(profile)包含的内容特别多,但目前我只关注运行时间. 详细 ...
- 正确使用 Android 性能分析工具——TraceView
前面唠叨 最近公司app中有些列表在滑动的时候会有卡顿现象,我就开始着手解决这些问题,解决问题之前首先要分析列表滑动的性能瓶颈在什么地方.因为之前不会正确使用TraceView这个工具,主要是看不懂T ...
- php性能分析工具 - xhprof的安装使用
一.前言 有用的东西还是记录下来吧,也方便以后的查询:这次记录一下xhprof的安装使用: xhprof是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低, ...
- 系统级性能分析工具perf的介绍与使用
测试环境:Ubuntu16.04 + Kernel:4.4.0-31 apt-get install linux-source cd /usr/src/tools/perf make &&am ...
最新文章
- python二元函数如何编写,如何用Python和sklearn编写多元对数回归?
- BD-09 GCJ-02 WGS84 坐标之间的转换
- wince6.0驱动开发
- 一款好看的提示框-------记录一下地址
- python基础教程免费视频-零基础小白python从入门到精通视频(全60集)
- Logic Pro for Mac(音频制作软件)V10.6.2中文版 支持M1芯片版mac
- 【Android】Android--Dialog
- IP地址归属地和手机号码归属地批量查询(单次支持500个以内,支持结果导出xls)
- JUnit5学习之一:基本操作
- 公司官网建站笔记(四):从阿里云将域名转出,并将域名转入腾讯云
- Element-ui中form组件的校验规则
- ipad服务器响应超时,iPad Air连接iTunes设备超时
- 开心庄园html的代码,HTML第五章(示例代码)
- 西部之旅之------相机的选择
- Pycurl的简单使用与对比 - 一只橘子的异想世界
- 关于win7 出现两个本地连接不能上网的问题?
- FPGA与CPLD的概念及其区别
- 完全重映射和部分重映射分析(超详细)
- H3C 交换机DRNI特性使用介绍
- 使用word插入无法编辑的对象
热门文章
- 列举python中可变数据类型_python 可变数据类型 和 不可变数据类型
- Java技术学习笔记:C/S 与B/S 区别
- long mode 分页_在Spring Boot中使用Spring-data-jpa实现分页查询(转)
- bigdecimal 判断是否为数字_C语言判断字符串是否为回文
- 转换背景色 html,html – CSS转换:淡化背景颜色,重置后
- java文件学生_文件存储学生信息(JavaIO流)
- php curl header_PHP中的yield与协程(二十一节)
- 如何修改ant-input的高度_水质自动采样器的流量计功能如何应用?
- ios 捕抓crash_ios crash的原因与抓取crash日志的方法
- php如何检测键盘按键,js键盘事件,判断按下的是哪个键