qhost:显示各节点信息表

参数
  • -j:显示每个节点上运行的作业信息
  • -q:显示每个节点接受的队列
结果(这些还需要再确定一下)
  • HOSTNAME:节点名
  • ARCH:支持处理器架构
  • NCPU:已经利用的 CPU 核心数
  • NSOC
  • NCOR:可利用的核心总数
  • NTHR:线程数
  • LOAD:当前负载,负载和核心数一致
  • MEMTOT:总内存
  • MEMUSE:当前使用内存
  • SWAPTO:总 SWAP 内存
  • SWAPUS:当前使用的 SWAP 内存

qstat:显示作业的状态

  • -F:显示每个队列的摘要信息以及作业列表
  • -j [job_id]:显示作业编号为 job_id 的作业的状态
  • -U [login_id]:显示 login_id 可以访问的那些队列的正在运行和等待作业的列表
  • -u [login_id]:显示 login_id 正在运行和等待的作业的列表

qsub job.sh:提交作业 job.sh

job.sh 文件内容样例:

#!/bin/bash
python -m task.test > log 2>&1
  • -N 作业名称;在使用 qstat 检查作业状态时显示
  • -q 设置队列
  • -V 将所有环境变量传递给作业
  • -v var[=value] 将自定义的环境变量 var[=value] 传递给作业
  • -b 允许命令是二进制文件而不是脚本
  • -w 验证选项并在出现错误时终止
  • -l h_vmem=size 指定所需的最大内存量(因为这是每个处理器的内存,所以如果使用 2 个处理器,则总内存需要乘 2)
  • -l h_rt=hh:mm:ss 指定最长运行时间
  • -l s_rt=hh:mm:ss 指定软运行时间限制(需同时设置 s_rth_rt
  • -pe smp
  • -cwd:在当前工作目录中运行
  • -wd:将此作业的工作目录设置为
  • -o <output_logfile>:设置输出日志文件的名称
  • -e <error_logfile>:设置错误日志文件的名称
  • -m:作业结束或中止时将发送电子邮件
  • -P:设置作业的项目
  • -M:要发送电子邮件的电子邮件地址
  • -t:提交带有起始索引的作业数组

qdel [job_id]:取消作业编号为 job_id 的作业

  • -f:强制取消

参考资料

  • https://blog.csdn.net/weixin_35866180/article/details/112805650
  • https://blog.csdn.net/weixin_45503019/article/details/108100725

SGE(集群任务管理系统)常用操作命令相关推荐

  1. (海贼)集群监控管理系统

    集群监控管理系统 设计说明 名称:集群监控管理系统 英文名:SystemMonitor 物理架构:C/S架构,即客户端,服务器型架构 开发语言:C 开发平台:CentOS  10 最新版本:v0.1 ...

  2. 集群任务管理系统SGE的简明教程

    我用的一个服务器上装了一个集群管理工具(SGE, Sun Grid Engine), 用于从登陆节点上向计算节点进行任务投递.一开始,不太会用,但是经过一段时间的摸索学习后,终于能顺手的用起来了. 在 ...

  3. redis集群部署及常用的操作命令_01

    简单说下自己测试搭建简单的redis集群的大体步骤: 1.首先你的有6个redis(官方说最少6个,3master,3slave),可以先在一台机器上搭建,搭建到多台上应该只需要改变启动命令即可(可能 ...

  4. 大数据技术之_17_Storm学习_Storm 概述+Storm 基础知识+Storm 集群搭建+Storm 常用 API+Storm 分组策略和并发度

    大数据技术之_17_Storm学习 一 Storm 概述 1.1 离线计算是什么? 1.2 流式计算是什么? 1.3 Storm 是什么? 1.4 Storm 与 Hadoop 的区别 1.5 Sto ...

  5. Nacos 单机集群搭建及常用生产环境配置 | Spring Cloud 3

    一.Nacos 概览 Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service的首字母简称,一个更易于构建云原生应用的动态服务发现.配置管理 ...

  6. Nginx 集群安装以及常用配置详解开机自启动

    Nginx 配置文件详解 main: 全局配置 event: 配置工作模式以及连接数 http: http 模块相关配置 server 虚拟主机配置,可以有多个 location 路由规则,表达式 u ...

  7. Elasticsearch集群和索引常用命令

    https://www.cnblogs.com/pilihaotian/p/5846173.html REST API用途 ES提供了很多全面的API,大致可以分成如下几种: 1 检查集群.节点.索引 ...

  8. oracle rac集群关闭和启动操作命令

    一.关闭数据库的顺序 1. 关闭数据库 oracle用户执行srvctl命令: $ srvctl stop/status database -d orcl #停止/查看所有节点上的实例 2. 停止集群 ...

  9. 集群资源管理系统 yarn平台的配置

    1.    首先找到hadoop/etc/hadoop/mapred-site.xml.template文件,重名为mapred-site.xml 修改hadoop/etc/hadoop/mapred ...

  10. 备战双 11!蚂蚁金服万级规模 K8s 集群管理系统如何设计?

    戳蓝字"CSDN云计算"关注我们哦! 作者 |   沧漠 责编 | 阿秃 导读:Kubernetes 的出现使得广大开发同学也能运维复杂的分布式系统,它大幅降低了容器化应用部署的门 ...

最新文章

  1. 三十八、判断服务是否运行及定位问题
  2. JavaScript事件详解-jQuery的事件实现(三)
  3. Javascript在客户端导出multi-sheet excel
  4. 8分频verilog线_Verilog设计分频器(面试必看)
  5. django 403 错误:CSRF token missing or incorrect
  6. linux标准I/O——格式化输出
  7. javaweb解决编码问题_学习编码? 首先,学会解决问题。
  8. 随机抽取题目程序java_分析并实现一个简单的抽人程序
  9. 《如何搭建小微企业风控模型》第十一节 逻辑回归与评分卡 节选
  10. 不服就干!抖音要用多闪挑战微信,但官网瞬间被封
  11. Link Vision 打破传统视频监控模式,开启新型物联网智能视频服务
  12. 基于gstreamer的支持动态获取多路流的rtsp server(笔记)
  13. Mysql优化(出自官方文档) - 第五篇
  14. 企业信息化基础设施建设分析
  15. WordPress收费下载插件Erphpdown v11.0
  16. 企业服务总线ESB是什么
  17. 打字时全部是繁体字,如何改为简体中文?
  18. 测试设计点-pc端和移动端微信加入群聊
  19. c语言中未找到函数入口,C语言的入口函数不一定叫main
  20. java 获取两个List 中 不同对象

热门文章

  1. Samba TDB 数据库 在嵌入式中的使用
  2. 一文带你轻松掌握多种编程范式
  3. 前端学习日记day4——图文混排
  4. 进化的系统需要进化的系统工程
  5. dcdc升压电源模块可调直流HRB5v24v12v转50v120v165v110v180v350v
  6. excel表格打印每页都有表头_分享|1分钟学会,让打印的表格每页自带标题行
  7. excel表格打印每页都有表头_表格很长,如何使打印出来的每张纸上都有固定的表头?...
  8. ACT托管的CRM软件开发您的业务
  9. pytorch入门教程(一):Tensor###tensor好好好####
  10. android版幻灯片软件,手机幻灯片制作器