SGE(集群任务管理系统)常用操作命令
qhost
:显示各节点信息表
参数
-j
:显示每个节点上运行的作业信息-q
:显示每个节点接受的队列
结果(这些还需要再确定一下)
HOSTNAME
:节点名ARCH
:支持处理器架构NCPU
:已经利用的 CPU 核心数NSOC
:NCOR
:可利用的核心总数NTHR
:线程数LOAD
:当前负载,负载和核心数一致MEMTOT
:总内存MEMUSE
:当前使用内存SWAPTO
:总 SWAP 内存SWAPUS
:当前使用的 SWAP 内存
qstat
:显示作业的状态
-F
:显示每个队列的摘要信息以及作业列表-j [job_id]
:显示作业编号为job_id
的作业的状态-U [login_id]
:显示login_id
可以访问的那些队列的正在运行和等待作业的列表-u [login_id]
:显示login_id
正在运行和等待的作业的列表
qsub job.sh
:提交作业 job.sh
job.sh
文件内容样例:
#!/bin/bash
python -m task.test > log 2>&1
-N
作业名称;在使用qstat
检查作业状态时显示-q
设置队列-V
将所有环境变量传递给作业-v var[=value]
将自定义的环境变量var[=value]
传递给作业-b
允许命令是二进制文件而不是脚本-w
验证选项并在出现错误时终止-l h_vmem=size
指定所需的最大内存量(因为这是每个处理器的内存,所以如果使用 2 个处理器,则总内存需要乘 2)-l h_rt=hh:mm:ss
指定最长运行时间-l s_rt=hh:mm:ss
指定软运行时间限制(需同时设置s_rt
和h_rt
)-pe smp
:-cwd
:在当前工作目录中运行-wd
:将此作业的工作目录设置为-o <output_logfile>
:设置输出日志文件的名称-e <error_logfile>
:设置错误日志文件的名称-m
:作业结束或中止时将发送电子邮件-P
:设置作业的项目-M
:要发送电子邮件的电子邮件地址-t
:提交带有起始索引的作业数组
qdel [job_id]
:取消作业编号为 job_id
的作业
-f
:强制取消
参考资料
- https://blog.csdn.net/weixin_35866180/article/details/112805650
- https://blog.csdn.net/weixin_45503019/article/details/108100725
SGE(集群任务管理系统)常用操作命令相关推荐
- (海贼)集群监控管理系统
集群监控管理系统 设计说明 名称:集群监控管理系统 英文名:SystemMonitor 物理架构:C/S架构,即客户端,服务器型架构 开发语言:C 开发平台:CentOS 10 最新版本:v0.1 ...
- 集群任务管理系统SGE的简明教程
我用的一个服务器上装了一个集群管理工具(SGE, Sun Grid Engine), 用于从登陆节点上向计算节点进行任务投递.一开始,不太会用,但是经过一段时间的摸索学习后,终于能顺手的用起来了. 在 ...
- redis集群部署及常用的操作命令_01
简单说下自己测试搭建简单的redis集群的大体步骤: 1.首先你的有6个redis(官方说最少6个,3master,3slave),可以先在一台机器上搭建,搭建到多台上应该只需要改变启动命令即可(可能 ...
- 大数据技术之_17_Storm学习_Storm 概述+Storm 基础知识+Storm 集群搭建+Storm 常用 API+Storm 分组策略和并发度
大数据技术之_17_Storm学习 一 Storm 概述 1.1 离线计算是什么? 1.2 流式计算是什么? 1.3 Storm 是什么? 1.4 Storm 与 Hadoop 的区别 1.5 Sto ...
- Nacos 单机集群搭建及常用生产环境配置 | Spring Cloud 3
一.Nacos 概览 Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service的首字母简称,一个更易于构建云原生应用的动态服务发现.配置管理 ...
- Nginx 集群安装以及常用配置详解开机自启动
Nginx 配置文件详解 main: 全局配置 event: 配置工作模式以及连接数 http: http 模块相关配置 server 虚拟主机配置,可以有多个 location 路由规则,表达式 u ...
- Elasticsearch集群和索引常用命令
https://www.cnblogs.com/pilihaotian/p/5846173.html REST API用途 ES提供了很多全面的API,大致可以分成如下几种: 1 检查集群.节点.索引 ...
- oracle rac集群关闭和启动操作命令
一.关闭数据库的顺序 1. 关闭数据库 oracle用户执行srvctl命令: $ srvctl stop/status database -d orcl #停止/查看所有节点上的实例 2. 停止集群 ...
- 集群资源管理系统 yarn平台的配置
1. 首先找到hadoop/etc/hadoop/mapred-site.xml.template文件,重名为mapred-site.xml 修改hadoop/etc/hadoop/mapred ...
- 备战双 11!蚂蚁金服万级规模 K8s 集群管理系统如何设计?
戳蓝字"CSDN云计算"关注我们哦! 作者 | 沧漠 责编 | 阿秃 导读:Kubernetes 的出现使得广大开发同学也能运维复杂的分布式系统,它大幅降低了容器化应用部署的门 ...
最新文章
- 三十八、判断服务是否运行及定位问题
- JavaScript事件详解-jQuery的事件实现(三)
- Javascript在客户端导出multi-sheet excel
- 8分频verilog线_Verilog设计分频器(面试必看)
- django 403 错误:CSRF token missing or incorrect
- linux标准I/O——格式化输出
- javaweb解决编码问题_学习编码? 首先,学会解决问题。
- 随机抽取题目程序java_分析并实现一个简单的抽人程序
- 《如何搭建小微企业风控模型》第十一节 逻辑回归与评分卡 节选
- 不服就干!抖音要用多闪挑战微信,但官网瞬间被封
- Link Vision 打破传统视频监控模式,开启新型物联网智能视频服务
- 基于gstreamer的支持动态获取多路流的rtsp server(笔记)
- Mysql优化(出自官方文档) - 第五篇
- 企业信息化基础设施建设分析
- WordPress收费下载插件Erphpdown v11.0
- 企业服务总线ESB是什么
- 打字时全部是繁体字,如何改为简体中文?
- 测试设计点-pc端和移动端微信加入群聊
- c语言中未找到函数入口,C语言的入口函数不一定叫main
- java 获取两个List 中 不同对象
热门文章
- Samba TDB 数据库 在嵌入式中的使用
- 一文带你轻松掌握多种编程范式
- 前端学习日记day4——图文混排
- 进化的系统需要进化的系统工程
- dcdc升压电源模块可调直流HRB5v24v12v转50v120v165v110v180v350v
- excel表格打印每页都有表头_分享|1分钟学会,让打印的表格每页自带标题行
- excel表格打印每页都有表头_表格很长,如何使打印出来的每张纸上都有固定的表头?...
- ACT托管的CRM软件开发您的业务
- pytorch入门教程(一):Tensor###tensor好好好####
- android版幻灯片软件,手机幻灯片制作器