slurm用户快速入门手册
2. 架构
3. 命令
3.1 sacct
3.2 sattach
3.4 sbatch
3.5 sbcast
3.6 scancel
3.7 scontrol
3.8 sinfo
3.9 smap
3.10 squeue
3.11 srun
3.12 strigger
3.13 sview
1. 概述
Slurm 是一个开源、容错、高可伸缩的集群管理和大型小型 Linux 集群作业调度系统。slurm不需要对操作系统内核进行修改,而是相对独立的。
作为集群工作负载管理器。slurm有三个关键功能:
- 首先,它在一段时间内为用户分配独占或者非独占的计算资源,以便他们能够执行工作任务
- 其次,它能提供一个框架,用于在分配的节点集上启动,执行,监视工作,通常是并行作业任务
- 最后,它通过管理挂起的工作队列,来仲裁资源争夺问题
2. 架构
如下图2.1所示,slurm构成有:
- 运行在每个计算节点上的slurmd守护进程
- 运行在管理节点上的中央slurmctld守护进程(可选的故障切换节点模式)
用户命令,包括:sacct,salloc,sattach,sbatch,sbcast,scancel,scontrol,sinfo,smap,squeue,srun,strigger,sviw,sreport等,均可以在集群的任何地方运行。
如下图所示,由这些 Slurm 守护程序管理的实体,包括:
- 计算资源node
- 计算资源组成的逻辑集partition
- 分配给用户指定的时间量的资源分配job
- 作业中的一组任务(有可能是并行任务)
这些分区可以被视为作业队列, 其中每一个都有各种约束, 如作业大小限制、工作时间限制、允许使用它的用户等。
按照优先级排序的作业,从队列中分配节点,直至该队列分资源,如节点,处理器,内存等耗尽。
一旦一个job分配了一组节点后, 用户就能够按照任何分配配置,以作业步骤形式启动并行工作。
例如, 可以启动一个作业步骤, 利用分配给作业的所有节点, 或者多个作业步骤可以独立地使用分配的一部分。
3. 命令
在部署了slurm的系统上,slurm daemons,slurm commands,和API functions均可通过帮助选择查看。
命令选择--help也能够提供一个简洁的功能选项总结。需要注意的是,命令选项都区分大小写。
3.1 sacct
sacct 用于汇总报告正在活动或者已经结束的job和job step的审计信息。
3.2 sattach
sattach用于input、output和error plus signal功能附加到当前正在运行的作业或作业步骤中。你可以多次连接和分离工作。
3.4 sbatch
sbatch用于提交作业脚本以供以后执行。脚本通常包含一个或多个 srun 命令来启动并行任务
3.5 sbcast
sbatch用于将文件从本地磁盘传输到分配给作业的节点上的本地磁盘。这可用于有效地使用无盘计算节点或提供相对于共享文件系统的改进性能
3.6 scancel
scancel用于取消挂起或正在运行的作业或作业步骤。它还可用于向与正在运行的作业或作业步骤关联的所有进程发送任意信号。
3.7 scontrol
scontrol是用于查看和/或修改 Slurm 状态的管理工具。请注意, 许多 scontrol 命令只能作为用户根执行。
3.8 sinfo
sinfo报告由 Slurm 管理的分区和节点的状态。它具有多种筛选、排序和格式设置选项。
3.9 smap
smap报告由 Slurm 管理的作业、分区和节点的状态信息, 但以图形方式显示信息以反映网络拓扑。
3.10 squeue
报告作业或作业步骤的状态。它具有多种筛选、排序和格式设置选项。
默认情况下, 它以优先级顺序报告正在运行的作业, 然后按优先级顺序报表挂起的作业。
3.11 srun
用于提交执行任务或实时启动作业步骤。
srun 有各种各样的选项来指定资源需求, 包括: 最小和最大节点数、处理器计数、要使用或不使用的特定节点以及特定节点特征 (内存、磁盘空间、某些必需的功能等)。
作业可以包含在作业节点分配中按顺序或并行执行的多个作业步骤。
3.12 strigger
strigger用于设置、获取或查看事件触发器。事件触发器包括节点下降或工作接近其时间限制等内容。
3.13 sview
是一个图形用户界面, 用于获取和更新由 Slurm 管理的作业、分区和节点的状态信息。
转载于:https://www.cnblogs.com/liwanliangblog/p/9203907.html
slurm用户快速入门手册相关推荐
- mysql rds云数据库_云数据库 RDS MySQL快速入门手册
云数据库 RDS MySQL是一款基于成熟云计算技术提供的高性能数据库服务,具有入门版.基础版.通用版.进阶版这四种,但最近有朋友表示,说自己并不会使用云数据库 RDS MySQL,为了帮助大家更好设 ...
- Medusa(美杜莎)和Hydra(九头蛇)快速入门手册:02
本文是Medusa和Hydra快速入门手册的第二部分,第一部分的传送门这两篇也是后续爆破篇的一部分,至于字典,放在最后,后续会把祖传的几十G字典准备好 Hydra入门使用手册 vanHauser Th ...
- 速卖通新手快速入门手册之一认识物流
写在帖子之前的话 最近有一大批朋友想做速卖通或者有的刚做速卖通,遇到了不少问题,都来问我,我觉得这个是一个好的趋势,说明跨境电商的市场正在走向成熟,相关配套也会越来越完善.但是也是说明竞争将会前所未有 ...
- csp虚拟专用服务器,CSP应用服务端开发快速入门手册.doc
CSP应用服务端开发快速入门手册.doc CSP应用服务端开发快速入门手册CSP应用服务端开发快速入门手册包括以下几个主题:环境搭建创建工程EO建模BO建模数据初始化部署测试1. 环境搭建JDK:1. ...
- Medusa和Hydra快速入门手册
Hydra入门使用手册 vanHauser TheHackersChoice http://www.thc.org/thc-hydra 目录 什么是Hydra? Hydra-GTK 如何安装 如何使用 ...
- Medusa(美杜莎)和Hydra(九头蛇)快速入门手册:01
今天主要是初步介绍一些Hydra和Medusa的分析和内容,旨在方便快速入门,这是第一部分Medusa,后面附带一些字典,之所以是写一起,我是觉得这两个都是不错的工具,不应该分开的,在这种思想下就汇总 ...
- 前端三大技术 HTML、CSS、JavaScript 快速入门手册
听到前端技术,不少朋友一定会感到有些陌生.但其实,前端,你每天都在接触. 你正在使用的APP,你正在浏览的网页,这些你能看到的界面,都属于前端. 而前端最重要的三大技术,HTML,CSS,JavaSc ...
- 微信小程序云开发快速入门手册-告别切图仔的时刻到了
文章很长,建议先收藏,有充分的时间再学习,没有小程序基础的,也阔以先收藏哦. 本文章会手把手带各位小伙伴入门微信小程序云开发,因为我还不是全栈工程师,所以不是特别清楚前后端分离模式下,后端工程师需 ...
- GoodSync新用户快速入门学习篇
GoodSync是一款非常好用的文件备份与文件同步软件,这款软件可以帮助我们将A中的视频.图片.音频.PDF文档及其他各类型文件以备份同步的方式传输到B中.对于刚接触GoodSync软件的用户而言,可 ...
最新文章
- 衡阳a货翡翠,南平a货翡翠
- /proc/net/tcp中各项参数说明
- pytorch搭建TextCNN与使用案例
- STM32-通用定时器-输入捕获
- ToB产品设计:用户权限系统解析
- 现代计算机是以多用户,计算机操作系统 第7章 设备管理 练习题
- Android BroadcastReceiver(三)
- centos7忘记root密码,重置
- 基于pytorch+Resnet101加GPT搭建AI玩王者荣耀
- 记vsftpd虚拟用户登录返回530 Login incorrect解决过程
- 机器人的核心——运动控制器
- 如何判断网线连接状态
- 什么是Python?Python简介
- Turbo C 2.0的下载地址
- swift uikit
- 微信小程序开发框架搭建
- 四川高考2021成绩排名查询,2020年四川高考成绩排名查询系统 四川高考位次排名表...
- 6.redis-哨兵
- 我的经历---公司破产
- 仿微信打开红包旋转动画