Nsight Compute是一个用于CUDA应用程序的交互式内核分析器。它通过用户界面和命令行工具提供详细的性能指标和API调试。此外,它的基线特性允许用户在工具中比较结果。NVIDIA Nsight Compute提供了一个可定制的、数据驱动的用户界面和度量集合,并且可以通过分析脚本对后处理结果进行扩展。
本篇记录使用Nsight Compute图形化界面分析CUDA程序性能的步骤。
同时,NVIDIA提供命令行工具Nsight Compute Cli ,其能够完成细粒度的性能剖析,参考
Nsight Compute与nvprof metrics 对照

1.单击菜单栏上的Connet,弹出如下界面,设置要剖析的执行程序路径等运行相关参数;选择Interactive Profile模式,可以对剖析流程进行控制;所有参数设置完成后,单击Launch开始性能分析。

2.在API Stream页面控制剖析软件执行到目标核函数(Next Trigger 中添加目标核函数),然后单击菜单栏的 Profile Kernel对核函数进行剖析


3.生成性能分析结果,在结果页面可以通过切换Page选项查看重点关注的参数,如Source ,Detail等

Detail信息:展示核函数整体执行的一些性能指标

Source信息:展示源码中每行代码及汇编指令执行使用资源情况

Nsight Compute 使用相关推荐

  1. Nsight Compute Profilier 分析

    Nsight Compute Profilier 分析 profiler报告包含每次内核启动分析期间收集的所有信息.在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切 ...

  2. NSight Compute 用户手册(下)

    NSight Compute 用户手册(下) 主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 Main Menu and Toolbar Information on ...

  3. NSight Compute 用户手册(中)

    NSight Compute 用户手册(中) NVIDIA Nsight Compute支持密码和私钥身份验证方法.在此对话框中,选择身份验证方法并输入以下信息: 密码 IP/主机名:目标设备的IP地 ...

  4. NSight Compute 用户手册(上)

    NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面.单击 ...

  5. 如何使用Nsight Compute?

    如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令

  6. CUDA安装失败-Nsight compute安装失败-如何测试CUDA是否安装成功?Reason: VS** was not found

    一.安装背景 CUDA11.1版本,本人的电脑显卡是GTX 1650,显存4GB:第一次安装前下载了vs2017版本并安装成功. 二.安装过程-如何一步步地解决错误? 第一次安装:精简安装,也就是把所 ...

  7. Nsight compute ---- Memory Chart

    Nsight compute ---- Memory Chart Memory Chart Memory Table Shared Memory L1/TEX Cache L2 Cache Devic ...

  8. Nsight Compute使用出现does not have permission to profile错误如何解决

    使用了下面前两种方法都没成功,不适用于我. 方法1:针对nvprof的 解决 nvprof 报错ERR_NVGPUCTRPERM - The user 修改sudoers改了还是不行 方法2:管理员权 ...

  9. Nsight compute远程连接不上

    显示connection failed 关闭clash,vpn.

  10. 出现qt.qpa.plugin: Could not load the Qt platform plugin “xcb“,nsight computer打不开的问题

    输入nv-nsight-cu或者ncu-ui后,最开始是等待一段时间没有反应,于是我重新安装了新版本的nsight computer:在root下输入sudo apt install nsight-c ...

最新文章

  1. dataframe 转json
  2. buuctf(misc) FLAG [LSB隐写]
  3. CF819E:Mister B and Flight to the Moon(构造、归纳法)
  4. 元宇宙综观—愿景、技术和应对
  5. 【力扣】NO.13.罗马数字转整数
  6. 案例:演示PreparedStatement对象的使用
  7. 细谈getRequestDispatcher()与sendRedirect()的区别
  8. 黑马博客——详细步骤(九)项目功能的实现之mongoDB数据库添加账号
  9. android内部dex解析,DEX文件解析---1、dex文件头解析
  10. 在 Shell 脚本中调用另一个 Shell 脚本的三种方式
  11. 在自行下载的背景图片上写字
  12. js数组的多条件筛选
  13. tiktok海外抖音发视频0播放怎么办?
  14. 个人精心整理的前端学习开发实用的网站
  15. java jen部署_CSS布局:Jen Simmons的网格,区域和@Supports
  16. centos7配置tomcat环境变量
  17. Checkout和Rest的所有谜题(git reset --files是要改一下)
  18. web前端开发入门(一)
  19. 解密Linux的优势
  20. 文献阅读 2018 Deep Retinex Decomposition for low-light Enhancement

热门文章

  1. MSN:常见故障“步步通”(转)
  2. HTML5能取代Android和iOS应用程序吗?
  3. win7 64位系统HP LaserJet P1008 / HP LaserJet P1008 P1007 驱动安装成功,但无法打印的原因...
  4. 色斑图制作及后端无人值守自动出图kriging.js+chrome+html2canvas.js+DOS+BIGEMAP超低成本实现气象要素色斑图
  5. The proxy server received an invalid response from an upstream server.
  6. mysql面试通关宝典,你看你知道多少
  7. 开源的屏幕画笔工具(基于WPF InkCanvas)
  8. 推荐一个超级方便的Android 抓包工具 Chuck
  9. 创建Person接口(即“人”),它有setData()和getData()方法对“人”属性name、sex和birthday赋值和获得这些属性组成的字符串信息创建类Student实现Person接口
  10. vue实现分屏_VUE视频怎么分镜 VUE视频如何进行分镜编(图文步骤)