目录

  • 前言
  • GENERAL OPTIONS
  • SUMMARY OPTIONS
  • QUERY OPTIONS

前言

nvidia-smi 命令(又称NVSMI)的全称是 NVIDIA System Management Interface,用于监控和管理GPU设备。

直接在终端执行 nvidia-smi 可查看所有的GPU设备及其相关信息:

root@container-14dc11ad52-9e0fd82d:~# nvidia-smi
Sun Sep 18 10:21:55 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 495.29.05    Driver Version: 495.29.05    CUDA Version: 11.5     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla V100-DGXS...  Off  | 00000000:07:00.0 Off |                    0 |
| N/A   48C    P0   175W / 300W |   5955MiB / 32508MiB |      6%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  Tesla V100-DGXS...  Off  | 00000000:08:00.0 Off |                    0 |
| N/A   58C    P0   257W / 300W |  27128MiB / 32508MiB |     93%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   2  Tesla V100-DGXS...  Off  | 00000000:0E:00.0 Off |                    0 |
| N/A   48C    P0    52W / 300W |   2768MiB / 32508MiB |     32%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   3  Tesla V100-DGXS...  Off  | 00000000:0F:00.0 Off |                    0 |
| N/A   46C    P0    40W / 300W |     13MiB / 32508MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      2151      G   /usr/lib/xorg/Xorg                 58MiB |
|    0   N/A  N/A      2255      G   /usr/bin/gnome-shell               83MiB |
|    0   N/A  N/A      7145      C   python                           2839MiB |
|    0   N/A  N/A      7364      C   python                           2755MiB |
|    0   N/A  N/A     20935      G   /usr/lib/xorg/Xorg                 24MiB |
|    0   N/A  N/A     21079      G   /usr/bin/gnome-shell              189MiB |
|    1   N/A  N/A      2151      G   /usr/lib/xorg/Xorg                  4MiB |
|    1   N/A  N/A     20935      G   /usr/lib/xorg/Xorg                  4MiB |
|    1   N/A  N/A     34676      C   python                          27115MiB |
|    2   N/A  N/A      2151      G   /usr/lib/xorg/Xorg                  4MiB |
|    2   N/A  N/A     20565      C   python                           2755MiB |
|    2   N/A  N/A     20935      G   /usr/lib/xorg/Xorg                  4MiB |
|    3   N/A  N/A      2151      G   /usr/lib/xorg/Xorg                  4MiB |
|    3   N/A  N/A     20935      G   /usr/lib/xorg/Xorg                  4MiB |
+-----------------------------------------------------------------------------+

关于该面板的解读可参考这篇文章。

GENERAL OPTIONS

输入 nvidia-smi -h 可查看该命令的帮助手册。

SUMMARY OPTIONS

输入 nvidia-smi -L 可以列出所有的GPU设备及其UUID

root@container-14dc11ad52-9e0fd82d:~# nvidia-smi -L
GPU 0: Tesla V100-DGXS-32GB (UUID: GPU-8e82d306-7c7b-b020-2847-afe95fd09f33)
GPU 1: Tesla V100-DGXS-32GB (UUID: GPU-8c4978ad-c5d1-e4d0-19ac-c659644fdb02)
GPU 2: Tesla V100-DGXS-32GB (UUID: GPU-8aec1981-46ca-fd72-376d-51d9eeaf166b)
GPU 3: Tesla V100-DGXS-32GB (UUID: GPU-b0a24c4f-6928-3ac2-7fba-a2969bbad8ba)

QUERY OPTIONS

输入 nvidia-smi -q 可以列出所有GPU设备的详细信息。如果只想列出某一GPU的详细信息,可使用 -i 选项指定。


输入 nvidia-smi -i [GPU编号] 可以只列出某一GPU设备的信息。因为该主机只有4块GPU,所以 [GPU编号] 的取值范围为 {0, 1, 2, 3}

root@container-14dc11ad52-9e0fd82d:~# nvidia-smi -i 1
Sun Sep 18 10:18:52 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 495.29.05    Driver Version: 495.29.05    CUDA Version: 11.5     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   1  Tesla V100-DGXS...  Off  | 00000000:08:00.0 Off |                    0 |
| N/A   57C    P0   229W / 300W |  27128MiB / 32508MiB |     99%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    1   N/A  N/A      2151      G   /usr/lib/xorg/Xorg                  4MiB |
|    1   N/A  N/A     20935      G   /usr/lib/xorg/Xorg                  4MiB |
|    1   N/A  N/A     34676      C   python                          27115MiB |
+-----------------------------------------------------------------------------+

-i 选项也可配合其他选项使用,例如

root@container-14dc11ad52-9e0fd82d:~# nvidia-smi -q -i 0

的作用就是列出第0块GPU的详细信息。


输入 nvidia-smi -l [second] 后会每隔 second 秒刷新一次面板。监控GPU利用率通常会选择每隔1秒刷新一次,即

root@container-14dc11ad52-9e0fd82d:~# nvidia-smi -l 1

nvidia-smi常用选项汇总相关推荐

  1. Docker常用命令汇总

    Docker常用命令汇总 帮助命令 docker version docker info docker --help 镜像命令 docker images 列出本地主机上的镜像,各个选项说明如下: R ...

  2. 史上最全的Linux常用命令汇总①收藏这一篇就够了!(超全,超详细)

    史上最全的Linux常用命令汇总①(超全面!超详细!)收藏这一篇就够了! Linux命令基础 Shell Linux命令分类 Linux命令行的格式 编辑Linux命令行的辅助操作 获取命令帮助的方法 ...

  3. HDFS常用命令汇总

    HDFS常用命令汇总 一.前言信息 二.帮助信息查看 1.查看帮助信息 2.帮助文档(附带命令的详细说明) 三.常用命令 1.创建目录 2.查看目录下的内容 3.上传文件 4.上传并删除源文件 5.查 ...

  4. Centos 8 常用指令汇总

    主要目录结构 / #根目录 ├── bin -> #(/usr/bin . /usr/local/bin) 目录存放着最经常使用的命令 ├── boot #系统启动文件 ├── dev #设备文 ...

  5. Java常用命令汇总(笔记)

    Java常用命令汇总 文章目录 Java常用命令汇总 1.javac 将文件编译成.class文件 2.java 执行 .class文件,若类中没有main函数,则不能执行. 3.jar 主要用于打包 ...

  6. JAVA常用单词汇总

    Java 常用英语汇总 abstract (关键字) access 抽象 ['.bstr.kt] vt.访问,存取 ['.kses]'(n.入口,使用权) n.算法 ['.lg.riem] algor ...

  7. JAVA程序员工作常用英语(细心整理)计算机常用英语汇总

    计算机常用英语汇总: CPU(Center Processor Unit)中央处理单元 mainboard主板 RAM(random access memory)随机存储器(内存) ROM(Read ...

  8. Java常用英语汇总

    英语不好照样可以搞定Java编程-Java常用英语汇总 尚硅谷2016-11-11 14:48 题目:Java常用英语汇总(更新升级版) abstract (关键字) 抽象['.bstr.kt] ac ...

  9. linux常用的命令shell,Linux操作系统Shell和常用命令汇总

    简述 本文主要介绍Shell和Linux常用命令. Shell Shell 是一个用 C 语言编写的应用程序,提供了用户访问Linux操作系统内核服务的界面,它可以用来启动.挂起.停止.编写程序.Sh ...

最新文章

  1. Hibernate框架第二天
  2. 代码大全读后感(二)
  3. 第二章:2.2 LTI系统解的分析
  4. 女主计算机的学霸,又一部青春网剧开机,学霸女主牵手计算机大神,另类爱情精彩上演...
  5. C#中的方法(上):
  6. 使用Java 8流遍历递归数据结构
  7. SCRUM 12.03
  8. SVN或其他网盘类软件同步图标不显示的异常
  9. 零起步教你搭建Discuz!论坛
  10. python测试用例队列_Python tornado队列示例-一个并发web爬虫代码分享
  11. 拓端tecdat|基于r语言的疾病制图中自适应核密度估计的阈值选择方法案例
  12. 堆排序python代码实现_八大排序算法的python实现(五)堆排序
  13. 如何无损把mp4视频格式转换成mp3音频格式
  14. oracle怎么查询关键字,Oracle 搜索关键字
  15. matlab mtf,MtF - MATLAB Central
  16. YbSoftwareFactory 代码生成插件【十三】:Web API 的安全性
  17. mybatis-plus过滤不查询某一字段
  18. ROS和ROS2.0到底该用哪个呢?
  19. Java集合可分成什么类_java.util包含Java中大量工具类、集合类等,例如Arrays、List、Set等。...
  20. 实现国际化(中英文切换)

热门文章

  1. 四种常见的 POST 提交数据方式对应的 content-type 取值
  2. 孙悟空java游戏棍子可以升级_上古有四只神猴,各有一把神器棍子,孙悟空的金箍棒是其中之一!...
  3. 五⼤场景玩转 Git,只要这一篇就够了!
  4. 计算机能手数据的计算教学设计,《数据计算》优秀教案.docx
  5. 专访万岁游戏 CEO 姚堃:探索 VR 游戏开发演进之路
  6. 温故知新(一)——基于 RTOS 的软件开发理论
  7. 2020扁皮筋排名_CSCC2020赛季竞赛规则
  8. html背景视频模糊效果,视频背景如何模糊效果 ae视频模糊效果怎么做
  9. java夯实基础系列:反射
  10. 安卓开发:实现调用相机拍照