sge安装 centos 安装 gridengine
centos 安装 gridengine 详细操作步骤
Installation of Son of Grid Engine(SGE) on CentOS 6.7
mgt# hostnamectl set-hostname mgt.hpc.com
mgt# vi /etc/hosts
10.1.1.1 mgt mgt.hpc.com
10.1.1.101 node01 node01.hpc.com
1)源码编译:
mgt# yum -y install ant junit openssl-devel ncurses-devel pam-devel libXmu-devel hwloc java-devel javacc ant-junit csh ksh xterm perl-XML-Simple xorg-x11-fonts-ISO8859-1-100dpi xorg-x11-fonts-ISO8859-1-75dpi
mgt# yum localinstall jemalloc-*
mgt# groupadd -g 490 sgeadmin
mgt# useradd -u 490 -g 490 -r -m -d /home/sgeadmin -s /bin/bash -c "SGE Admin" sgeadmin
mgt# visudo
%sgeadmin ALL=(ALL) NOPASSWD: ALL
mgt# tar zxvf sge-8.1.9.tar.gz && cd sge-8.1.9/source/
mgt# sh scripts/bootstrap.sh && ./aimk && ./aimk -man
mgt# export SGE_ROOT=/opt/gridengine && mkdir $SGE_ROOT
mgt# echo Y | ./scripts/distinst -local -allall -libs -noexit
mgt# chown -R sgeadmin.sgeadmin /opt/gridengine
2)设置SGE
mgt# cd $SGE_ROOT
mgt# ./install_qmaster
一直回车
.....
mgt# cp /opt/gridengine/default/common/settings.sh /etc/profile.d/
mgt# . /etc/profile.d/settings.sh
mgt# qconf -sh
mgt
mgt# qconf -ah node01
node01 added to administrative host list
添加管理节点为执行主机
mgt# cd $SGE_ROOT
mgt# ./install_execd
一直回车
....
开启服务
[root@hostname gridengine]# /etc/init.d/sgemaster start
Starting sgemaster: [ OK ]
[root@hostname gridengine]# /etc/init.d/sge_execd start
Starting sge_execd: [ OK ]
如果没有设置 “ SGE_ROOT ” 环境,执行命令就会收到这样的提示。
[root@hostname gridengine]# qhost
critical error: Please set the environment variable SGE_ROOT.
## for node
[root@mgt ~]# tar zcvf sge-bin.tgz /opt/gridengine/
mgt# pscp -r sge-bin.tgz node01:/root/
[root@mgt ~]# ssh node01 "tar zxvf /root/sge-bin.tgz -C /"
mgt# scp /etc/passwd node01:/etc; scp /etc/group node01:/etc
ssh node01
node01# export SGE_ROOT=/opt/gridengine && cd $SGE_ROOT
node01# chown -R sgeadmin.sgeadmin /opt/gridengine
node01# cd $SGE_ROOT; ./install_execd
一直回车
....
node01# cp /opt/gridengine/default/common/settings.sh /etc/profile.d/
node01# . /etc/profile.d/settings.sh
[root@node01 gridengine]# /etc/init.d/sgeexecd.p6444 start
sge_shepherd won't run -- dynamic library missing?
[root@node01 gridengine]#
ssh node01 "rm -rf /etc/yum.repos.d/*"
[root@mgt ~]# scp -r /etc/yum.repos.d/dvd.* node01:/etc/yum.repos.d/
[root@mgt ~]# scp -r sge/*.rpm node01:/root
[root@node01 ~]# yum localinstall *.rpm
node01# yum -y install ant junit openssl-devel ncurses-devel pam-devel libXmu-devel hwloc java-devel javacc ant-junit csh ksh xterm perl-XML-Simple xorg-x11-fonts-ISO8859-1-100dpi xorg-x11-fonts-ISO8859-1-75dpi hwloc-devel javacc db4-utils
node01# yum localinstall jemalloc-*
[root@node01 ~]# /etc/init.d/sgeexecd.p6444 start && chkconfig sgeexecd.p6444 on
Starting Grid Engine execution daemon
[root@node01 ~]#
[root@node01 ~]# qhost
HOSTNAME ARCH NCPU NSOC NCOR NTHR LOAD MEMTOT MEMUSE SWAPTO SWAPUS
----------------------------------------------------------------------------------------------
global - - - - - - - - - -
mgt lx-amd64 1 1 1 1 0.10 976.5M 333.9M 2.0G 4.2M
node01 lx-amd64 1 1 1 1 0.25 2.8G 232.7M 2.0G 0.0
[root@node01 ~]#
===================================================================================================================
配置队列
在执行安装master主机上,初始安装后是将执行主机添加到了默认的 “all.q” 队列中。在队列中的hostlist的那一行显示的执行主机名称是 “@allhosts”,这是一个主机组。需要用qconf命令编辑主机组。
[root@hostname gridengine]# qconf –sql 显示已经配置队列名称
all.q
[root@hostname gridengine]# qconf -mhgrp @allhosts
安装的时候使用默认的配置,主机组命名也是默认的。如果要使用这个名称,就必须编辑它,将主机名称加入主机组名称“@allhosts”。
[root@hostname gridengine]# qstat -f -u '*'
执行主机启动,主机列表中没有相应执行主机名称,执行qstat命令就不会看到有任何输出。
[root@hostname gridengine]# qstat -f
queuename qtype resv/used/tot. load_avg arch states
-------------------------------------------------------------------------------------------------------------------
all.q@hostname BIP 0/0/1 0.00 lx26-amd64
到此初步配置完成:
集群控制主机、执行主机、队列、主机组
用到的命令:
qconf 配置命令
qhost 主机状态等信息
qstat 队列状态、job状态
gridengine server 常规配置过程
队列配置:
qconf –aq all.q 新增加一个队列
qconf –mq all.q 配置(修改)一个队列
qconf –dq all.q 删除一个队列
qconf –sql 显示已存在的队列
主机组配置:
qconf –ahgrp @allhosts新增加一个主机组
qconf –mhgrp @allhosts配置(修改)一个主机组
qconf –dhgrp @allhosts删除一个主机组
qconf –shgrpl 显示已存在的主机组
用户组配置:
qconf –au opusers新增加一个用户组
qconf –mu opusers配置(修改)一个用户组
qconf –du opusers删除一个用户组
qconf –sul 显示已存在的用户组
添加提交主机:
qconf -as mgt
[root@mgt ~]# echo "sleep 60" |qsub
Unable to run job: denied: host "mgt" is not a submit host
Exiting.
[root@mgt ~]
[root@mgt ~]# echo "sleep 60" |qsub
Unable to run job: job rejected: your user id 0 is lower than minimum user id 100 of cluster configuration
Exiting.
[root@mgt ~]#
## for GPU
qconf -mc
#name shortcut type relop requestable consumable default urgency
#----------------------------------------------------------------------------------------------
gpu gpu INT <= YES YES 0 0
qconf -me node02
hostname node01
load_scaling NONE
complex_values gpu=1
user_lists NONE
xuser_lists NONE
projects NONE
xprojects NONE
usage_scaling NONE
report_variables NONE
qsub -l gpu=1
[t01@mgt ~]$ echo "sleep 60" |qsub -l gpu=1
qsub: submit error (Unknown resource type Resource_List.gpu)
sge安装 centos 安装 gridengine相关推荐
- 安装CentOS安装图形桌面
安装CentOS安装图形桌面 输入命令dnf groupinstall "Server with GUI" 启用图形模式:输入命令systemctl set-default gra ...
- python3安装-Centos 安装 Python3
Centos 的官方源默认是没有python3,所以不能直接yum安装. 下面介绍几个常用的方法在Centos下安装Python3. 一.epel 源安装 首先安装epel源: yum install ...
- centos php raphf安装,centos安装pecl
编译安装,发现本地还没有phpize,两种方法安装phpize: 第一种: 需要先下载对应的php版本包,然后包中就有phpize: 我的php版本是5.3.3 第二种: 也可以使用yum insta ...
- php最新版本的安装,centos安装新PHP版本
方法一: yum 安装默认的版本太低了,手动安装有一些麻烦,想采用Yum安装的可以使用下面的方案: 1.检查当前安装的PHP包 yum list installed | grep php 如果有安装的 ...
- rz gz linux安装,CentOS 安装 rz sz lrzsz
服务器版本: [root@node3 ~]# lsb_release -a LSB Version: :core-4.1-amd64:core-4.1-noarch:cxx-4.1-amd64:cxx ...
- python3.7 6如何安装-centos安装python3.7
准备工作 准备gcc环境和其他依赖包[python3.7以上的需要] 1.yum -y install gcc 2.yum -y install zlib-devel bzip2-devel open ...
- linux keepalived安装,CentOS安装Keepalived版本2.0.18
1.基础依赖包安装 yum install gcc yum -y install openssl-devel yum -y install libnl libnl-devel yum -y insta ...
- libpcap linux安装,CentOS安装libpcap
1.安装GCC: yum -y install gcc-c++ 2.安装flex: yum -y install flex 没有flex,直接安装libpcap会提示"Your operat ...
- 虚拟机安装CentOS以及SecureCRT设置【完美无错版】
一.CentOS简介 CentOS是Linux的发行版之一,它安全.稳定.高效,是我最喜欢的Linux发行版之一.CentOS根据Red Hat Enterprise Linux开放源代码编译而成,与 ...
最新文章
- 深度理解目标检测(MMdetection)-HOOK机制
- Devexpress Xtraform 资源文件 汉化
- python可以做什么工作好-Python入门后,想要从事自由职业可以做哪方面工作?
- 【修订】为什么OO方法是有本质缺陷的?
- 三十二、VsCode前端的开发工具介绍和使用
- 错误信息 c语言实现_全国计算机等级考试二级C语言
- atftp 在SUSE Linux中的源代码安装配置方法
- 光学字符识别 android,基于Android的光学字符识别研究与实现
- IDEA如何执行maven命令进行打包编译及常用命令
- 查看linq的生成语句
- element ui中el-image不显示图片
- C语言中报段错误(核心已转储)的常见问题
- 如何利用Django打造一款类似于链家二手房信息查询网!厉害吧!
- 传谷歌金山秘密合作研发Office软件
- 群晖DSM桌面无法删除快捷方式(无法右键)解决方法
- MyEclipse配置jdk
- 【线性代数】n阶行列式
- 访问计算机是什么意思,“CATI”是什么意思?
- xcopy 跳过已经存在的_视频课怎么区分数学一二三?考研英语怎么复习?恋练有词句子部分直接跳过?...
- java实现excel打印_java实现 excel 打印 问题
热门文章
- 陈启峰 Size Balanced Tree
- 【分享笔记】android6.0特性
- thingsboard往kafka推送数据
- for key in file_keys
- 最短路径之Bellman-Ford
- 【Word】如何设置交叉引用标注参考文献与设置上标
- linux find返回数据不一样,Linux学习笔记——find命令
- 通达信接口官网与量化交易有联系吗?
- 漏洞复现-Wordpress 4.6 PwnScriptum RCE命令执行
- 如何用深度学习生成图片(GAN, pix2pix, CycleGAN和pix2pixHD)