Nsight Compute Profilier 分析

profiler报告包含每次内核启动分析期间收集的所有信息。在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切换的控件。默认情况下,报告以选定的详细信息页面开始。

页眉

页面下拉列表可用于在可用报告页面之间切换,下一节将对此进行详细说明。
探查器报告标头

Launch下拉列表可用于在所有收集的内核启动之间切换。每个页面中显示的信息通常表示选定的启动实例。在某些页面(例如Raw),显示所有启动的信息,并突出显示所选实例。您可以输入这个下拉列表来快速过滤并找到一个内核启动。

应用过滤器按钮打开过滤器对话框。可以使用多个筛选器缩小结果范围。在“过滤器”对话框中,输入过滤器参数并按“确定”按钮。将相应地过滤“启动”下拉列表。选择箭头下拉菜单以访问“清除过滤器”按钮,该按钮将删除所有过滤器。

过滤器对话框

“添加基线”按钮可将焦点中的当前结果提升为此报告中所有其他结果的基线,以及在同一个NVIDIA Nsight Compute实例中打开的任何其他报告的基线。选择箭头下拉列表以访问“清除基线”按钮,该按钮将删除所有当前活动的基线。

“应用规则”按钮应用此报表的所有可用规则。如果以前应用过规则,这些结果将被替换。默认情况下,一旦分析了内核启动过程,就会立即应用规则。这可以在“工具”>“选项”>“配置文件”>“报表UI”>“自动应用适用规则”下的选项中进行更改。

右侧的按钮提供了可以在页面上执行的多个操作。可用操作包括:

复制为图像-将页面内容作为图像复制到剪贴板。

另存为图像-将页面内容作为图像保存到文件中。

另存为PDF-将页面内容以PDF格式保存到文件中。

导出到CSV-将页面内容导出为CSV格式。

重置为默认值-通过删除任何保留的设置将页面重置为默认状态。

请注意,并非所有的功能都在所有页面上可用。

关于所选内核的信息显示为当前的。[+]和[-]按钮可用于显示或隐藏节正文内容。信息切换按钮i改变了章节描述的可见性。

报告页数

使用页眉中的Page下拉菜单在报表页之间切换。

会话页面

此会话页包含有关报告和计算机的基本信息,以及为其分析启动的所有设备的设备属性。在启动实例之间切换时,将突出显示相应的设备属性。

摘要页

摘要页面显示此报告中收集的所有结果的列表,以及选定的重要摘要度量。它为您提供了一个快速的比较概述,涵盖了所有已分析的内核启动。您可以使用“转置”按钮来转置内核和度量表。

详细信息页

Details页面是内核启动期间收集的所有度量数据的主页面。页面被分成单独的部分。每个部分由一个标题表和一个可选的可扩展正文组成。这些部分完全是用户定义的,可以通过更新它们各自的文件轻松地进行更改。有关自定义节的详细信息,请参见《自定义手册》。有关NVIDIA Nsight Compute附带的部分列表,请参阅《内核评测指南》。

默认情况下,收集到新的概要文件结果后,将应用所有适用的规则。任何规则结果都将在此页面上显示为建议。大多数规则结果都是纯信息性的,或者有一个警告图标来指示某些性能问题。带有错误图标的结果通常表示应用规则时出错。

规则结果通常指出性能问题并指导整个分析过程。

如果启用,SOL Rooflines部分包含一个Roofline图表,它对于直观地显示内核性能特别有用。(要在报告中启用roofline图表,请确保在分析时选择了GPU Speed of Light roofline Chart部分。)有关如何使用和读取此图表的更多信息,请参阅Kernel profiling Guide。
屋顶线图样本。

可以使用下表中的控件缩放和平移屋顶线图表,以便进行更有效的数据分析。
表1屋顶线图表缩放和平移控件

如果启用,内存工作负载分析部分将包含一个内存图表,用于可视化数据传输、缓存命中率、指令和内存请求。关于如何使用和阅读这个图表的更多信息可以在内核评测指南中找到。 源计数器等部分可以包含源热点表。这些表显示了内核源代码中一个或多个度量的N个最高或最低值。选择位置链接以在源页面中直接导航到此位置。将鼠标悬停在某个值上,以查看哪些度量对该值起作用。

热点表指出源代码中的性能问题。

Nsight Compute Profilier 分析相关推荐

  1. NSight Compute 用户手册(下)

    NSight Compute 用户手册(下) 主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 Main Menu and Toolbar Information on ...

  2. NSight Compute 用户手册(中)

    NSight Compute 用户手册(中) NVIDIA Nsight Compute支持密码和私钥身份验证方法.在此对话框中,选择身份验证方法并输入以下信息: 密码 IP/主机名:目标设备的IP地 ...

  3. NSight Compute 用户手册(上)

    NSight Compute 用户手册(上) 非交互式配置文件活动 从NVIDIA Nsight Compute启动目标应用程序 启动NVIDIA Nsight Compute时,将出现欢迎页面.单击 ...

  4. Nsight Compute使用出现does not have permission to profile错误如何解决

    使用了下面前两种方法都没成功,不适用于我. 方法1:针对nvprof的 解决 nvprof 报错ERR_NVGPUCTRPERM - The user 修改sudoers改了还是不行 方法2:管理员权 ...

  5. 如何使用Nsight Compute?

    如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令

  6. CUDA安装失败-Nsight compute安装失败-如何测试CUDA是否安装成功?Reason: VS** was not found

    一.安装背景 CUDA11.1版本,本人的电脑显卡是GTX 1650,显存4GB:第一次安装前下载了vs2017版本并安装成功. 二.安装过程-如何一步步地解决错误? 第一次安装:精简安装,也就是把所 ...

  7. Nsight compute ---- Memory Chart

    Nsight compute ---- Memory Chart Memory Chart Memory Table Shared Memory L1/TEX Cache L2 Cache Devic ...

  8. Nsight compute远程连接不上

    显示connection failed 关闭clash,vpn.

  9. 图形分析之Nsight的使用

    作者:i_dovelemon 日期:2017-06-11 来源:CSDN 主题:Nsight, OpenGL 引言 最开始的时候, 我进行图形编程使用的是DX,所以那时候进行图形分析的时候,基本都是使 ...

最新文章

  1. android6.0源码分析之AMS服务源码分析
  2. 信用卡不能提额,是因为使用了招联金融吗?
  3. Nodejs正则表达式函数之match、test、exec、search、split、replace使用详解
  4. 7.Handling Missing Values
  5. 嵌入式软件开发注意事项一
  6. centos6/7 yum安装mysql客户端和rpm包方式安装方式
  7. web虚拟服务器4核32g,Web服务器配备四核的优势
  8. java经典源码 阅读_公开!阿里甩出“源码阅读指南”,原来源码才是最经典的学习范例...
  9. 20个最常用的Windows命令行
  10. 实习阶段修改的第一个bug(完成了一个需求)
  11. rasa 中文 UnsupportedLanguageError: component ‘LanguageModelTokenizer‘ does not support language ‘zh‘.
  12. 无法安装 苹方字体(萍方字体/PingFang SC)字体的解决办法/字体安装失败解决方案
  13. dax和m的区别_Power BI中的两种语言:M函数和DAX函数
  14. android原生滑块验证
  15. java 线程面试题_8道Java多线程面试题,看过后你不会后悔!
  16. Android定制实现上网限制
  17. [C语言] [游戏] 扫雷
  18. 成功解决raise TypeError(‘Unexpected feature_names type‘)TypeError: Unexpected feature_names type
  19. 原生js实现上拉加载
  20. 模式识别(八)神经网络(BPNNCNN)识别细胞数据集

热门文章

  1. .net连接mysql数据_.net连接MYSQL数据库的方法及示例!
  2. Python 将字符串转为字典
  3. 通过前序遍历和中序遍历构建二叉树 python实现
  4. python 过滤出某后缀名文件
  5. 程序员应该吃透的集合List
  6. 2021年大数据ELK(十三):Elasticsearch编程(添加职位数据)
  7. 2021年大数据常用语言Scala(二):Scala开发环境安装
  8. 2021年大数据Spark(四十六):Structured Streaming Operations 操作
  9. 2021年大数据Spark(四十五):Structured Streaming Sources 输入源
  10. Django高级管理静态文件和中间件5.1