1、准备3台 机器 并设置 hosts

echo 192.168.108.138 m1 >> /etc/hosts
echo 192.168.108.139 s2 >> /etc/hosts

echo 192.168.108.140 s3 >> /etc/hosts

echo $hostname > /etc/hostname

hostnamectl set-hostname $hostname

2、创建slurm 用户(id 一定要是 412)

export SLURMUSER=412 
groupadd -g $SLURMUSER slurm

useradd -m -c "SLURM workload manager" -d /var/lib/slurm -u $SLURMUSER -g slurm -s /bin/bash slurm

id slurm

3、 关闭防火墙 SElinux

systemctl stop firewalld
systemctl disable firewalld
 vim /etc/selinux/config  中 SELINUX=disabled  永久需重启

setenforce 0

4、安装ohpc 源

yum install http://build.openhpc.community/OpenHPC:/1.3/CentOS_7/x86_64/ohpc-release-1.3-1.el7.x86_64.rpm

5、安装依赖

yum install openssl openssl-devel pam-devel numactl numactl-devel hwloc hwloc-devel lua lua-devel readline-devel rrdtool-devel ncurses-devel man2html libibmad libibumad -y

6、安装server 端(m1 机器)

yum -y install ohpc-slurm-server
vim  /etc/slurm/slurm.conf

ControlMachine=m1
###***  CPUs=1 = Sockets*CoresPerSocket*ThreadsPerCore
NodeName=m1,s[2-3] CPUs=1 RealMemory=1024 Sockets=1 CoresPerSocket=1 ThreadsPerCore=1 Procs=1 State=IDLE

PartitionName=clients Nodes=s[2-3] Default=YES MaxTime=INFINITE State=UP

7. 安装 client 端 (s2,s3)

yum -y  install ohpc-slurm-client

scp -pr $m1IP:/etc/slurm/slurm.conf  /etc/slurm/
scp -pr $m1IP:/etc/scp -pr $m1IP:/etc/slurm/slurm.conf  /etc/slurm/

munge/munge.keyscp -pr $m1IP:/etc/munge/munge.key /etc/munge/munge.key

8 启动服务

server 端 (m1)
systemctl start munge

systemctl start slurmctld

client 端(s2,s3)
systemctl start munge
systemctl start slurmd

9、 sinfo 查看状态

# sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE    NODELIST

normal*      up         infinite            2        drain     s[2-3]

### drain 状态修复

scontrol update NodeName=s[2-3] State=RESUME

# sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE    NODELIST

normal*      up         infinite            2        idle     s[2-3]

10、运行作业

#srun  hostname
s2

# srun -N 2 -l hostname
0: s2

1: s3

11、 其他命令

squeue -a  #查询作业

scancel <job_id>  #取消作业

# scontrol show config
# scontrol show partition
# scontrol show node

# scontrol show jobs

12 、对比 PBS(参考 https://blog.csdn.net/weixin_39497034/article/details/79100799)
Command                 PBS Pro                 SLURM
Submit batch job         qsub [job script]        sbatch [job script]
Request interactive shell qsub -I /bin/bash        srun –pty /bin/bash
Delete job                 qdel [job id]                scancel [job id]
Queue status                  qstat -q                        sinfo
Job status                 qstat -f [job id]        scontrol show job [job id]
Node status                 pbsnodes [node name] scontrol show node [node id]

slurm 安装使用(centos7)相关推荐

  1. centos系统slurm安装

    文|MESeraph 01 | 预先操作 关闭Centos界面登录.(仅适用于Centos7以上版本) systemctl get-default systemctl set-default mult ...

  2. centos losf 安装_Linux Centos7部署环境安装-CentOS

    Linux Centos7部署环境安装-CentOS Centos7部署环境安装及Linux常用命令 centos系统下各文件夹的作用 centos7修改系统默认语言 centos7安装rz/sz命令 ...

  3. 大数据学习笔记03:安装配置CentOS7虚拟机

    学习笔记<安装配置CentOS7虚拟机>下载链接:https://pan.baidu.com/s/1wxRh3ggzxZtzQshqMy_A8g 提取码:71yw

  4. 安装Linux系统后无法启动win,安装Win10 CentOS7双系统后无法启动Win10系统怎么办

    近来,有位用户反馈自己由于工作需要,不得不在已经安装了Win10系统的电脑上下载安装CentOS7系统组成双系统.可是,该用户在安装好CentOS7系统后,发现Win10系统突然无法启动.无法加载了. ...

  5. Docker离线安装教程(Centos7) 转帖

    原文:https://blog.csdn.net/hello_junz/article/details/79882602 centos离线安装docker-ce  目前越来越多的应用采用docker部 ...

  6. 安装Linux CentOS7操作系统

    目录 前言 1.安装虚拟机 1.1新建虚拟机 1.2 调整虚拟机硬件 1.3启动虚拟机 1.4创建虚拟机用户 总结 前言 本文记录学习在VMware虚拟机上,安装Linux CentOS7操作系统的全 ...

  7. SLURM 安装与配置

    SLURM 安装与配置 SLURM 介绍 SLURM 是一个可用于大型计算节点集群的高度可伸缩的集群管理器和作业调度系统.SLURM 维护着一个待处理工作的队列并管理此工作的整体资源利用.SLURM ...

  8. slurm安装配置_slurm安装血泪史

    因为比较顺利地安装好slurm,整理好了一些遇到的问题,希望能帮到大家. 我参考这篇博客安装http://blog.csdn.net/datuqiqi/article/details/50827040 ...

  9. 技嘉H370 HD3主板的物理机上安装 Linux CentOS7 解决无网卡驱动

    技嘉H370 HD3主板的物理机上安装 Linux CentOS7 解决无网卡驱动 一般的机器网卡驱动会随Linux系统一起安装,但有些奇葩的主板的网卡驱动Linux安装包没有,这就得找到它的网卡驱动 ...

最新文章

  1. java多语言标签如何动态刷新_WPF实现无刷新动态切换多语言(国际化)
  2. Android开发之ListView的全选和全不选
  3. “既然计划没有变化快,那制订计划还有个卵用啊!”
  4. 让ie8按照ie7 的方式来进行解析
  5. android+wear独立应用,谷歌更新Android Wear政策:鼓励开发可独立运行的手表应用
  6. 包管理conda操作,常用conda命令
  7. Auto CAD 批量转PDF、批量打印使用方法
  8. “你需要TrustedInstaller提供的权限才能对此文件进行更改” 解决方案
  9. 怎么制作U盘启动盘来安装系统
  10. Python制作的三个奇怪作品
  11. Python北京二手房房价数据集分析
  12. 在Java语言的if语句是什么表达式,if语句中的条件表达式中只能使用
  13. 装机注意事项:一次装机差点翻车的经历
  14. Beam Search(集束搜索)算法
  15. 如何给IBM X3650 M4 安装CentOS8.3.2011
  16. IP2188中文数据手册
  17. DB-数据库基本概念(一)
  18. 从零开始跑——《爱上跑步的十三周》
  19. nginx防火墙端口配置
  20. Git管理项目,git的基本操作语法加注释

热门文章

  1. Oracle 10g Data Pump Expdp/Impdp 详解
  2. C语言 | while语句
  3. java:@Repeatable注解使用
  4. ie打开自动切换到ie5了_您会切换到IE8吗?
  5. Linux的初试——VMware的使用和安装,CentOS6.4ISO下载
  6. 微信小程序之发送http请求(云环境)
  7. 分别使用C语言和Python实现矩阵归一化
  8. 用postman保存数据,postman调用post接口,用postman造数据,postman使用教程
  9. 纯css实现带斜角的边框样式
  10. CSP-J 2019 入门组/普及组