集群-------多台设备
HPC集群----多台用于计算的设备

集群调度-LSF:LSF 是一种强大的工作负载管理平台,提供基于各种策略的智能调度功能,利用分布式的基础架构资源来提高整体的系统性能。用户通过 LSF可以实现集群间的负载均衡,扩展集群构架和资源,最大限度的提高集群的使用效率。

主要命令:

bsub             命令提交
bqueues        队列查看
bhosts          节点查看
bjobs            作业查看

运行bqueues:

QUEUE_NAME:队列名称

PRIO:优先级

NJOBS:几个作业在并行

PEND:阻塞的作业数量

RUN:正在运行的作业数量

SUSP:挂起的作业数量

提交作业:bsub < demo.sh

demo.sh:

#BSUB -J testJob
#BSUB -n 28
#BSUB -o %J.out
#BSUB -e %J.err
#BSUB -q normalecho "111"

-J 作业名称

-n 作业至少需要的CPU核数(28的倍数),也可以是范围(表示方法如[28,56])

-o 标准输出文件

-i 标准输入文件

-e 标准错误输出文件

-q 作业所提交队列名

-o -i -e 三个参数的文件名中可以包含%J用于表示JOBID;如果没有指定标准输出文件,那么系统会自动设定为 output_%J;如不想要输出文件请设置 -o /dev/null。

执行 bsub < demo.sh 后,成功加入队列将显示:

Job <175039> is submitted to queue <normal>.

查看作业运行情况:bjobs

查看作业详情:bjobs -l 作业号

终止指定的作业:bkill   作业号

查看任务日志,显示处于运行时作业的标准输出和标准错误输出信息:

bpeek  -f  作业号

显示节点当前负载:lsload

module av  查看可用软件

module load xxx  加载所需软件

lsload  -gpuload  查看gpu各个卡的信息

集群调度LSF-学习笔记相关推荐

  1. 调度框架学习笔记(3)—— 集群调度框架的架构演进过程

    本章是 The evolution of cluster scheduler architectures 文章的学习笔记.这篇文章讨论了这些年调度架构是如何发展的以及为什么会这样发展. 首先介绍一下这 ...

  2. 仓库规模操作系统的背景之集群调度

    前言 本文是Malte Schwarzkopf的博士论文<Operating system support for warehouse-scale computing>一个翻译版本,融入了 ...

  3. 集群概述及原理笔记(1)

    it你好linux学习文档之集群概述及原理笔记(1) 一 前言 目前,越来越多的网站采用Linux操作系统,提供邮件.Web.文件存储.数据库等服务.也有非常多的公司在企业内部网中利用Linux服务器 ...

  4. 快手超大规模集群调度优化实践

    导读:随着公司业务的快速发展,离线计算集群规模和提交的作业量持续增长,如何支撑超大规模集群,如何满足不同场景的调度需求成为必须要解决的问题.基于以上问题,快手大数据团队基于YARN做了大量的定制和优化 ...

  5. quartz集群调度机制调研及源码分析---转载

    quartz2.2.1集群调度机制调研及源码分析 引言 quartz集群架构 调度器实例化 调度过程 触发器的获取 触发trigger: Job执行过程: 总结: 附: 引言 quratz是目前最为成 ...

  6. 集群调度框架的架构演进之路

    http://www.infoq.com/cn/articles/scheduler-architectures 编者按 集群架构是现代数据中心非常重要的组件,在最近几年中有长足发展.架构也从单体式设 ...

  7. k8命令,pod的启动流程与资源文件书写,k8s集群调度

    目录 一.常用命令及kubect介绍 1.kubect介绍 1)语法格式: 2)命名空间的概述 3)查看命名空间 4)查看命名空间中的资源对象 2.查用排错命令 1)查询资源文件 2)查看资源详细信息 ...

  8. CNCF 沙箱项目 OCM Placement 多集群调度指南

    作者: ​邱见|红帽资深软件工程师,Open Cluster Management (OCM) 社区发起人,负责人​ ​郝青|红帽高级软件工程师,Open Cluster Management (OC ...

  9. 多代理集群调度:可伸缩性和灵活性

    今天阅读了一个berkeley学生Andrew Konwinski的有关集群资源调度的技术报告,其中对于目前现有集群调度技术的分类,我觉得说的很好,另外,它还介绍了一种模拟实验的蒙特卡洛方法,现在做一 ...

  10. 集群调度框架的架构演进过程

    原文:The evolution of cluster scheduler architectures 作者:Malte Schwarzkopf 之前组会上,有幸与大家探讨 Firmament: Fa ...

最新文章

  1. 用python设计学生管理系统_python+tkinter实现学生管理系统
  2. php 二位数组随机,PHP多维数组 php打乱数组二维数组多维数组的简单实例
  3. RBF(径向基)神经网络 非线性函数回归的实现
  4. ASP.NET MVC下的异步Action的定义和执行原理
  5. 科大星云诗社动态20210411
  6. 【nodejs笔记3】Express基本用法,和路由控制,和模板渲染ejs
  7. CSS 小结笔记之文字溢出处理
  8. 很经典的独白,搞网络的童鞋们,你们懂得
  9. 这次看到源码了,华为开源了方舟编译器
  10. c语言函数man,Linux下C语言编程有困难找man
  11. 有趣的python代码实例_Python之路:200个Python有趣的小例子一网打尽
  12. Windows下LaTeX安装教程与新手入门
  13. IE缓存文件提取器 视频,音频,图片一网打尽
  14. cad特性匹配快捷键命令_cad快捷键命令大全
  15. 第39级台阶回溯算法c语言,回溯39级台阶
  16. C语言arduino密码锁实验报告,简易密码锁的制作-Arduino中文社区 - Powered by Discuz!...
  17. Centos7.9上利用cephadm安装Ceph Octopus 15.2的采坑记录,附带K8S挂载方法
  18. 阿里研究院第三届学术委员会成立,主席曾鸣畅谈未来学术生态构建
  19. 【ShapeWorks】2. 工作流的三板斧 - How to Groom Your Dataset?
  20. i9-9980HK和i9-9880H 哪个好

热门文章

  1. 学术论文检索--搜索引擎篇
  2. win7利用映射网络驱动器功能管理网站FTP空间
  3. python中利用ARIMA模型对时间序列问题进行预测(以洗发水销售预测为例)
  4. keil更改黑色背景颜色
  5. centos7 设置网络(静态ip),联网失败,DNS解析失败(被覆盖),虚拟机
  6. python飞机大战爆炸效果实现_python飞机大战添加爆炸效果
  7. 洛谷1156 垃圾陷阱
  8. ubuntu安装搜狗输入法导致系统崩溃
  9. R 单独窗口显示绘图(plots)
  10. AI语音红外遥控配网教程