文|MESeraph

01 | 预先操作

  1. 关闭Centos界面登录。(仅适用于Centos7以上版本)
systemctl get-default
systemctl set-default multi-user.target
  1. 联网

(1) 首先查看网卡

ls /etc/sysconfig/network-scripts

(2) 编辑

vi /etc/sysconfig/network-scripts/ifcfg-ensXXXX  #我的是ens33

修改该文件中配置:ONBOOT=yes
(3) 重启网络服务

service network restart
  1. 修改主机名
    hostnamectl set-hostname newname
    vim /etc/hosts #替换原主机名,并添加计算节点

  2. 关闭防火墙
    systemctl stop firewalld.service

02 | 设置ssh免密

  1. 生成公私密钥对
    ssh-keygen -t rsa
  2. 拷贝公钥到计算节点
    ssh-copy-id -i ~/.ssh/id_rsa.pub root@centos2

03 | 安装munge

  1. 新建用户(munge、slurm)
export MUNGEUSER=1001
groupadd -g $MUNGEUSER munge
useradd  -m -c "MUNGE Uid 'N' Gid Emporium" -d /var/lib/munge -u $MUNGEUSER -g munge  -s /sbin/nologin munge
export SLURMUSER=1002
groupadd -g $SLURMUSER slurm
useradd  -m -c "SLURM workload manager" -d /var/lib/slurm -u $SLURMUSER -g slurm  -s /bin/bash slurm
  1. 安装软件
yum install epel-release
yum install munge munge-libs munge-devel -y
yum install rng-tools -y
  1. 生成配置
rngd -r /dev/urandom
/usr/sbin/create-munge-key -r
dd if=/dev/urandom bs=1 count=1024 > /etc/munge/munge.key
chown munge: /etc/munge/munge.key
chmod 400 /etc/munge/munge.key

将munge.key放置到其他计算节点

scp /etc/munge/munge.key root@centos2:/etc/munge/
  1. 启动并配置所有节点的Munge
chown -R munge: /etc/munge/ /var/log/munge/
chmod 0700 /etc/munge/ /var/log/munge/
systemctl enable munge
systemctl start munge
  1. 测试Munge
munge -n
munge -n | unmunge
munge -n | ssh centos2 unmunge
remunge

04 | 安装Slurm

  1. 安装依赖包
yum install openssl openssl-devel pam-devel numactl numactl-devel hwloc hwloc-devel lua lua-devel readline-devel rrdtool-devel ncurses-devel man2html libibmad libibumad perl-Switch mariadb mariadb-server mariadb-devel -y
yum install perl-ExtUtils-MakeMaker
yum install gcc
systemctl start mariadb
  1. 构建rpm包(只在控制节点构建,然后传到各个计算节点安装)
yum install rpm-build
wget https://download.schedmd.com/slurm/slurm-20.02.3.tar.bz2
rpmbuild -ta slurm-20.02.3.tar.bz2
  1. 安装rmp包
cd  rpmbuild/RPMS/x86_64
yum localinstall slurm-*.rpm
  1. 配置slurm.conf
    slurm.conf
# Slurm.conf file generated by configurator easy.html.
# Put this file on all nodes of your cluster.
# See the slurm.conf man page for more information.
#
SlurmctldHost=centos1
#
#MailProg=/bin/mail
MpiDefault=none
#MpiParams=ports=#-#
ProctrackType=proctrack/cgroup
ReturnToService=1
SlurmctldPidFile=/var/run/slurmctld.pid
#SlurmctldPort=6817
SlurmdPidFile=/var/run/slurmd.pid
#SlurmdPort=6818
SlurmdSpoolDir=/var/spool/slurmd
SlurmUser=slurm
#SlurmdUser=root
StateSaveLocation=/var/spool/slurmctld
SwitchType=switch/none
TaskPlugin=task/affinity
#
#
# TIMERS
#KillWait=30
#MinJobAge=300
#SlurmctldTimeout=120
#SlurmdTimeout=300
#
#
# SCHEDULING
SchedulerType=sched/backfill
SelectType=select/cons_tres
SelectTypeParameters=CR_Core
#
#
# LOGGING AND ACCOUNTING
AccountingStorageType=accounting_storage/none
ClusterName=cluster
#JobAcctGatherFrequency=30
JobAcctGatherType=jobacct_gather/none
#SlurmctldDebug=info
SlurmctldLogFile= /var/log/slurmctld.log
#SlurmdDebug=info
SlurmdLogFile=/var/log/slurmd.log
#
#
# COMPUTE NODES
NodeName=centos[2-3]  CPUs=1 RealMemory=500 Sockets=1 CoresPerSocket=1 ThreadsPerCore=1 State=UNKNOWN
PartitionName=debug Nodes=centos[2-3] Default=YES MaxTime=INFINITE State=UP

将slurm.conf拷贝至各个计算节点:
scp /etc/slurm/slurm.conf root@centos2:/etc/slurm

  1. 计算节点配置cgroup.conf
    cgroup.conf
###
#
# Slurm cgroup support configuration file
#
# See man slurm.conf and man cgroup.conf for further
# information on cgroup configuration parameters
#--
CgroupAutomount=yes
ConstrainCores=no
ConstrainRAMSpace=no

05 | 问题

  1. error: Unable to register: Zero Bytes were transmitted or received slurm
    解决:节点时间未同步,安装NTP后,启动ntpd服务即可。

centos系统slurm安装相关推荐

  1. Centos系统上安装php遇到的错误解决方法集锦

    Centos系统上安装php遇到的错误解决方法集锦 1.configure: error: xml2-config not found. Please check your libxml2 insta ...

  2. CentOS系统中安装 vmware-tools

    有时候为了学习linux,需要在虚拟机上进行安装测试.但在安装完成后,会发现存在两个普遍的问题:一是时间与时钟不同步问题.这样会造成开发中很多问题,例如 Makefile 文件会造成一些不必要的重复编 ...

  3. 磁盘管理来安装linux,Linux_在CentOS系统中安装quota来管理磁盘配额,在网络管理的工作中,由于硬 - phpStudy...

    在CentOS系统中安装quota来管理磁盘配额 在网络管理的工作中,由于硬盘的资源是有限的,常常需要为多用户的服务器设定用户的linux磁盘配额.这个功能对公用的多用户服务器(免费的或者收费的)来说 ...

  4. CentOS系统的安装

    2.1 Windows操作系统简介 为什么学习Windows操作系统?了解Windows系统结构,可以让你快速学习Linux操作系统,通过对比学习的方法,可以更快的学会Linux. 计算机硬件组成包括 ...

  5. 01集群中软件的安装 共三部分 Aspera下载与安装 centos系统sratoolkit安装并添加到环境变量 wxf晓飞 肖老师 集群安装软件全过程 export tar.gz

    conda卸载 Linux卸载Anaconda_易_的博客-CSDN博客_linux 卸载conda 第一部分:转录组配置方案.配置了python=3.6 r=4.1.0的transcriptome的 ...

  6. 在虚拟机的CentOS系统下安装pycharm的用户须知

    在虚拟机的CentOS系统下安装pycharm的用户须知 一般我们在采用CentOS最小安装的时候系统往往不会安装python3,这就使得要自行安装python3以方便我们使用,毕竟python3是目 ...

  7. Centos系统如何安装宝塔面板

    558idc.com运维教程之Centos系统如何安装宝塔面板教程 在安装宝塔面板之前你要准备好纯净好的系统, 请注意是纯净的系统,没有安装过任何环境的.这里建议使用centos 7.6系统 通过ss ...

  8. centos系统下安装Nginx

    参考链接 CentOS 7 用 yum 安装 Nginx Nginx负载均衡配置 下载并安装 #使用以下命令 sudo yum install -y nginx #sudo表示使用管理员权限运行命令 ...

  9. mysql5.7安装教程centos_MySQL5.7版CentOS系统简易安装教程

    这一篇教程,我们一起来完成MySQL在CentOS系统中的安装. 1.下载MySQL(Community版)RPM安装源. 如果没有安装wget,需要先执行命令安装. 执行命令: yum -y ins ...

最新文章

  1. 使用maven导入jar包
  2. 心急如焚!程序员拥有 2.2 亿美元巨款,却想不起密码
  3. 通俗易懂:贪心算法(三):习题练习 (力扣605种花问题、122买卖股票的最佳时机)
  4. 介绍JBoss BPM Suite安装程序
  5. 与机器学习算法有关的数据结构
  6. linux下进程调度模拟程序,linux认证辅导:linux进程调度模拟怎么做?
  7. Imagine开源图片压缩程序源码
  8. .NET中的跟踪与调试(TraceDebug)
  9. python install pip 区别_pip install和python -m pip install有什么区别?
  10. 华为在 Linux Kernel 5.10 中代码贡献排名第一,中国 AI 足球队夺冠 | 开发者周刊
  11. 将APP打包为IPA
  12. 大数据Hadoop学习记录(1)----HDFS目录和文件Shell操作
  13. msfconsole php,msfconsole从入门到放弃
  14. 组态王c语言延时1秒,(组态王软件详细教程第三讲让画面动起来.doc
  15. 毕业设计 微信小程序 音乐播放器
  16. 文件转换-----(类型,格式)
  17. 嵌入式编程中的堆栈溢出检测
  18. Motor Back-drive电机反驱
  19. Vue使用keep-alive,调用 $destory() ,页面不再被缓存的解决方法
  20. 记录一次Anaconda安装Spyder失败及解决方法

热门文章

  1. 2022ICPC杭州站
  2. 插值法亚像素边缘检测(拉格朗日多项式插值法)
  3. Android端直播SDK实现方案
  4. 研究一天,终于把MyBatis的一级缓存和二级缓存搞清楚了
  5. 【VUE】VUE数组更新
  6. 月亮网摘(2006.10.11)
  7. node_demo_03 一个好玩的图片处理工具gm模块小练习。
  8. 【周志华机器学习】十一、特征选择与稀疏学习
  9. RemoteFX 中的USB重定向功能_解决windows宿主机本地USB设备映射到远程桌面使用
  10. 核密度估计 Kernel Density Estimation(KDE)