NSight Compute 用户手册(上)

非交互式配置文件活动

从NVIDIA Nsight Compute启动目标应用程序

启动NVIDIA Nsight Compute时,将出现欢迎页面。单击快速启动打开连接对话框。如果未显示“连接”对话框,则可以使用主工具栏上的“连接”按钮打开它,只要当前未连接。从Connection下拉列表中选择左侧的目标平台和本地主机。然后,填写launch details并选择launch。在“活动”面板中,选择“概要文件”活动以启动预配置概要文件会话的会话,并启动命令行探查器以收集数据。提供输出文件名以允许使用启动按钮启动会话。

其他启动选项

有关这些选项的详细信息,请参阅命令行探查器的命令行选项。这些选项被分组到选项卡中:Filter选项卡公开选项来指定应该分析哪些内核。选项包括内核regex过滤器、要跳过的启动次数以及要评测的启动总数。Section选项卡允许您为每次内核启动选择应该收集的部分。采样选项卡允许您为每次内核启动配置采样选项。另一个选项卡包含通过–metrics选项收集NVTX信息或自定义度量的选项。

Section选项卡允许您为每次内核启动选择应该收集的部分。将鼠标悬停在某个部分上,以查看其作为工具提示的说明。要更改默认启用的节,请使用“Sections/Rules信息”工具窗口。

有关此活动中可用选项的详细说明,请参阅配置文件活动。

浏览报表

浏览报表

默认情况下,profile报告会出现在Details页面上。您可以在报表的不同报表页之间切换,报表左上角的下拉列表标记为“页”。报告可以包含任意数量的内核启动结果。启动下拉列表允许在报告中的不同结果之间切换。

区分多个结果

在“详细信息”页面上,按“添加基线”按钮以将当前结果提升为焦点,以将来自此报表的所有其他结果以及在同一个NVIDIA Nsight Compute实例中打开的任何其他报告进行比较。如果设置了基线,详细信息页面上的每个元素都会显示两个值:焦点中结果的当前值和基线的相应值或与相应基线值相比的更改百分比。

使用下拉按钮、配置文件菜单或相应工具栏按钮中的清除基线条目删除所有基线。有关更多信息,请参见基线。

执行规则

在“详细信息”页面上,某些部分可能会提供规则。按Apply按钮执行单个规则。顶部的Apply Rules按钮执行焦点中当前结果的所有可用规则。规则也可以是用户定义的。有关详细信息,请参阅《自定义指南》。

连接对话框

使用“连接”对话框启动并附加到本地和远程平台上的应用程序。首先选择要分析的目标平台。默认情况下(如果支持),将选择本地平台。选择要在其上启动目标应用程序或连接到正在运行的进程的平台。

连接对话框

使用远程平台时,将要求您在顶部下拉列表中选择或创建连接。要创建新连接,请选择+并输入连接详细信息。使用本地平台时,将选择localhost作为默认值,不需要进一步的连接设置。如果分析将在同一平台的远程系统上进行,则仍然可以创建或选择远程连接。 根据您的目标平台,选择Launch或Remote Launch来启动应用程序以在目标上进行分析。请注意,只有在目标平台支持时,远程启动才可用。

为应用程序填写以下启动详细信息:

应用程序可执行文件:指定要启动的根应用程序。请注意,这可能不是您希望评测的最终应用程序。它可以是创建其他进程的脚本或启动器。

工作目录:应用程序将在其中启动的目录。

命令行参数:指定要传递给应用程序可执行文件的参数。

环境:为启动的应用程序设置的环境变量。

选择“附加”将探查器附加到已在目标平台上运行的应用程序。此应用程序必须已使用另一个NVIDIA Nsight Compute CLI实例启动。该列表将显示目标系统上运行的所有可附加的应用程序进程。选择“刷新”按钮以重新创建此列表。

最后,为启动或附加的应用程序选择要在目标上运行的活动。请注意,并非所有活动都必须与所有目标和连接选项兼容。目前,存在以下活动:

交互式配置文件活动

配置文件活动

远程连接

支持SSH的远程设备也可以在连接对话框中配置为目标。要配置远程设备,请确保选择了支持SSH的目标平台,然后按+按钮。将显示以下配置对话框。

NSight Compute 用户手册(上)相关推荐

  1. NSight Compute 用户手册(下)

    NSight Compute 用户手册(下) 主菜单 文件 新建项目使用"新建项目"对话框创建新的分析项目 Main Menu and Toolbar Information on ...

  2. NSight Compute 用户手册(中)

    NSight Compute 用户手册(中) NVIDIA Nsight Compute支持密码和私钥身份验证方法.在此对话框中,选择身份验证方法并输入以下信息: 密码 IP/主机名:目标设备的IP地 ...

  3. Nsight Compute Profilier 分析

    Nsight Compute Profilier 分析 profiler报告包含每次内核启动分析期间收集的所有信息.在用户界面中,它包含一个包含常规信息的标题,以及用于在报告页面或单个收集的启动之间切 ...

  4. CUDA安装失败-Nsight compute安装失败-如何测试CUDA是否安装成功?Reason: VS** was not found

    一.安装背景 CUDA11.1版本,本人的电脑显卡是GTX 1650,显存4GB:第一次安装前下载了vs2017版本并安装成功. 二.安装过程-如何一步步地解决错误? 第一次安装:精简安装,也就是把所 ...

  5. Nsight compute ---- Memory Chart

    Nsight compute ---- Memory Chart Memory Chart Memory Table Shared Memory L1/TEX Cache L2 Cache Devic ...

  6. Nsight Compute使用出现does not have permission to profile错误如何解决

    使用了下面前两种方法都没成功,不适用于我. 方法1:针对nvprof的 解决 nvprof 报错ERR_NVGPUCTRPERM - The user 修改sudoers改了还是不行 方法2:管理员权 ...

  7. 如何使用Nsight Compute?

    如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令

  8. 在Openstack上部署compute节点上时,开启服务openstack-nova-compute.service无法启动的解决方法

    在Openstack上部署compute节点上时,开启服务openstack-nova-compute.service无法启动的解决方法 参考文章: (1)在Openstack上部署compute节点 ...

  9. Nsight compute远程连接不上

    显示connection failed 关闭clash,vpn.

最新文章

  1. vs2012调试中出现char类型形参与LPCTSTR类型不匹配
  2. CentOS常用环境配置(MySQL、jdk、Redis、Nginx)
  3. 2013与2014之流水
  4. 查询雇佣的所有员工_想要最好的员工? 让他们自己雇用
  5. 前端:JS/32/form对象(表单)(form对象的属性,方法和事件),受返回值影响的两个事件(onclick事件,onsubmit事件),获取表单的元素对象的三种方式,表单的提交和验证方法总结
  6. 面试官:Spring该选择哪个构造方法来进行实例化?画重点要考的
  7. python语言发展历时_编程语言十年发展史
  8. php mysql含引号报错,执行sql双引号
  9. Linux 网络基本配置
  10. 【网络编程】Socket网络编程基础
  11. CPU缓存侧信道攻击综述-Survey of CPU Cache-Based Side-Channel Attacks
  12. linux usb有线网卡驱动_基于USB设备的Linux网络驱动程序开发
  13. 【参赛作品101】充实openGauss每日一练21天学习完成大总结
  14. BLE-NRF51822教程2-工程初始化流程
  15. 大力哥谈 DALI - DALI 调光电源怎么用
  16. Beyond Compare4试用过期解决方法
  17. Silverlight资源概述
  18. matlab 实验仿真,基于MATLAB的仿真实验平台设计与研究
  19. 用代码制作小游戏:简单制作给孩子幸福童年
  20. 火力全开 思科FirePOWER下一代防火墙

热门文章

  1. mysql修改校对集_MySQL 教程之校对集问题
  2. 2022-2028年中国内衣行业研究及前瞻分析报告
  3. 2022-2028年中国热塑性聚酯PBT工程塑料行业市场全景调查及发展趋势分析报告
  4. 每个年龄段,都有每个年龄段的“好”
  5. pytorch版的bilstm+crf实现sequence label
  6. com.mchange.v2.resourcepool.BasicResourcePool$AcquireTask@4e47db1f -- Acquisition Attempt Failed!!!
  7. LeetCode简单题之“气球” 的最大数量
  8. LLVM数据流分析的理论
  9. Linux内存技术分析(下)
  10. HashMap 的长度为什么是 2 的幂次方?