centos系统slurm安装
文|MESeraph
01 | 预先操作
- 关闭Centos界面登录。(仅适用于Centos7以上版本)
systemctl get-default
systemctl set-default multi-user.target
- 联网
(1) 首先查看网卡
ls /etc/sysconfig/network-scripts
(2) 编辑
vi /etc/sysconfig/network-scripts/ifcfg-ensXXXX #我的是ens33
修改该文件中配置:ONBOOT=yes
(3) 重启网络服务
service network restart
修改主机名
hostnamectl set-hostname newname
vim /etc/hosts #替换原主机名,并添加计算节点关闭防火墙
systemctl stop firewalld.service
02 | 设置ssh免密
- 生成公私密钥对
ssh-keygen -t rsa
- 拷贝公钥到计算节点
ssh-copy-id -i ~/.ssh/id_rsa.pub root@centos2
03 | 安装munge
- 新建用户(munge、slurm)
export MUNGEUSER=1001
groupadd -g $MUNGEUSER munge
useradd -m -c "MUNGE Uid 'N' Gid Emporium" -d /var/lib/munge -u $MUNGEUSER -g munge -s /sbin/nologin munge
export SLURMUSER=1002
groupadd -g $SLURMUSER slurm
useradd -m -c "SLURM workload manager" -d /var/lib/slurm -u $SLURMUSER -g slurm -s /bin/bash slurm
- 安装软件
yum install epel-release
yum install munge munge-libs munge-devel -y
yum install rng-tools -y
- 生成配置
rngd -r /dev/urandom
/usr/sbin/create-munge-key -r
dd if=/dev/urandom bs=1 count=1024 > /etc/munge/munge.key
chown munge: /etc/munge/munge.key
chmod 400 /etc/munge/munge.key
将munge.key放置到其他计算节点
scp /etc/munge/munge.key root@centos2:/etc/munge/
- 启动并配置所有节点的Munge
chown -R munge: /etc/munge/ /var/log/munge/
chmod 0700 /etc/munge/ /var/log/munge/
systemctl enable munge
systemctl start munge
- 测试Munge
munge -n
munge -n | unmunge
munge -n | ssh centos2 unmunge
remunge
04 | 安装Slurm
- 安装依赖包
yum install openssl openssl-devel pam-devel numactl numactl-devel hwloc hwloc-devel lua lua-devel readline-devel rrdtool-devel ncurses-devel man2html libibmad libibumad perl-Switch mariadb mariadb-server mariadb-devel -y
yum install perl-ExtUtils-MakeMaker
yum install gcc
systemctl start mariadb
- 构建rpm包(只在控制节点构建,然后传到各个计算节点安装)
yum install rpm-build
wget https://download.schedmd.com/slurm/slurm-20.02.3.tar.bz2
rpmbuild -ta slurm-20.02.3.tar.bz2
- 安装rmp包
cd rpmbuild/RPMS/x86_64
yum localinstall slurm-*.rpm
- 配置slurm.conf
slurm.conf
# Slurm.conf file generated by configurator easy.html.
# Put this file on all nodes of your cluster.
# See the slurm.conf man page for more information.
#
SlurmctldHost=centos1
#
#MailProg=/bin/mail
MpiDefault=none
#MpiParams=ports=#-#
ProctrackType=proctrack/cgroup
ReturnToService=1
SlurmctldPidFile=/var/run/slurmctld.pid
#SlurmctldPort=6817
SlurmdPidFile=/var/run/slurmd.pid
#SlurmdPort=6818
SlurmdSpoolDir=/var/spool/slurmd
SlurmUser=slurm
#SlurmdUser=root
StateSaveLocation=/var/spool/slurmctld
SwitchType=switch/none
TaskPlugin=task/affinity
#
#
# TIMERS
#KillWait=30
#MinJobAge=300
#SlurmctldTimeout=120
#SlurmdTimeout=300
#
#
# SCHEDULING
SchedulerType=sched/backfill
SelectType=select/cons_tres
SelectTypeParameters=CR_Core
#
#
# LOGGING AND ACCOUNTING
AccountingStorageType=accounting_storage/none
ClusterName=cluster
#JobAcctGatherFrequency=30
JobAcctGatherType=jobacct_gather/none
#SlurmctldDebug=info
SlurmctldLogFile= /var/log/slurmctld.log
#SlurmdDebug=info
SlurmdLogFile=/var/log/slurmd.log
#
#
# COMPUTE NODES
NodeName=centos[2-3] CPUs=1 RealMemory=500 Sockets=1 CoresPerSocket=1 ThreadsPerCore=1 State=UNKNOWN
PartitionName=debug Nodes=centos[2-3] Default=YES MaxTime=INFINITE State=UP
将slurm.conf拷贝至各个计算节点:
scp /etc/slurm/slurm.conf root@centos2:/etc/slurm
- 计算节点配置cgroup.conf
cgroup.conf
###
#
# Slurm cgroup support configuration file
#
# See man slurm.conf and man cgroup.conf for further
# information on cgroup configuration parameters
#--
CgroupAutomount=yes
ConstrainCores=no
ConstrainRAMSpace=no
05 | 问题
error: Unable to register: Zero Bytes were transmitted or received slurm
解决:节点时间未同步,安装NTP后,启动ntpd服务即可。
centos系统slurm安装相关推荐
- Centos系统上安装php遇到的错误解决方法集锦
Centos系统上安装php遇到的错误解决方法集锦 1.configure: error: xml2-config not found. Please check your libxml2 insta ...
- CentOS系统中安装 vmware-tools
有时候为了学习linux,需要在虚拟机上进行安装测试.但在安装完成后,会发现存在两个普遍的问题:一是时间与时钟不同步问题.这样会造成开发中很多问题,例如 Makefile 文件会造成一些不必要的重复编 ...
- 磁盘管理来安装linux,Linux_在CentOS系统中安装quota来管理磁盘配额,在网络管理的工作中,由于硬 - phpStudy...
在CentOS系统中安装quota来管理磁盘配额 在网络管理的工作中,由于硬盘的资源是有限的,常常需要为多用户的服务器设定用户的linux磁盘配额.这个功能对公用的多用户服务器(免费的或者收费的)来说 ...
- CentOS系统的安装
2.1 Windows操作系统简介 为什么学习Windows操作系统?了解Windows系统结构,可以让你快速学习Linux操作系统,通过对比学习的方法,可以更快的学会Linux. 计算机硬件组成包括 ...
- 01集群中软件的安装 共三部分 Aspera下载与安装 centos系统sratoolkit安装并添加到环境变量 wxf晓飞 肖老师 集群安装软件全过程 export tar.gz
conda卸载 Linux卸载Anaconda_易_的博客-CSDN博客_linux 卸载conda 第一部分:转录组配置方案.配置了python=3.6 r=4.1.0的transcriptome的 ...
- 在虚拟机的CentOS系统下安装pycharm的用户须知
在虚拟机的CentOS系统下安装pycharm的用户须知 一般我们在采用CentOS最小安装的时候系统往往不会安装python3,这就使得要自行安装python3以方便我们使用,毕竟python3是目 ...
- Centos系统如何安装宝塔面板
558idc.com运维教程之Centos系统如何安装宝塔面板教程 在安装宝塔面板之前你要准备好纯净好的系统, 请注意是纯净的系统,没有安装过任何环境的.这里建议使用centos 7.6系统 通过ss ...
- centos系统下安装Nginx
参考链接 CentOS 7 用 yum 安装 Nginx Nginx负载均衡配置 下载并安装 #使用以下命令 sudo yum install -y nginx #sudo表示使用管理员权限运行命令 ...
- mysql5.7安装教程centos_MySQL5.7版CentOS系统简易安装教程
这一篇教程,我们一起来完成MySQL在CentOS系统中的安装. 1.下载MySQL(Community版)RPM安装源. 如果没有安装wget,需要先执行命令安装. 执行命令: yum -y ins ...
最新文章
- 使用maven导入jar包
- 心急如焚!程序员拥有 2.2 亿美元巨款,却想不起密码
- 通俗易懂:贪心算法(三):习题练习 (力扣605种花问题、122买卖股票的最佳时机)
- 介绍JBoss BPM Suite安装程序
- 与机器学习算法有关的数据结构
- linux下进程调度模拟程序,linux认证辅导:linux进程调度模拟怎么做?
- Imagine开源图片压缩程序源码
- .NET中的跟踪与调试(TraceDebug)
- python install pip 区别_pip install和python -m pip install有什么区别?
- 华为在 Linux Kernel 5.10 中代码贡献排名第一,中国 AI 足球队夺冠 | 开发者周刊
- 将APP打包为IPA
- 大数据Hadoop学习记录(1)----HDFS目录和文件Shell操作
- msfconsole php,msfconsole从入门到放弃
- 组态王c语言延时1秒,(组态王软件详细教程第三讲让画面动起来.doc
- 毕业设计 微信小程序 音乐播放器
- 文件转换-----(类型,格式)
- 嵌入式编程中的堆栈溢出检测
- Motor Back-drive电机反驱
- Vue使用keep-alive,调用 $destory() ,页面不再被缓存的解决方法
- 记录一次Anaconda安装Spyder失败及解决方法