最近有个任务由于非常复杂,无法在本地运行,因此借助天河超算进行了运算。天河超算平台是一个集群,由很多结点组成,每个结点实际上就可以理解成一台计算机,网上说内存是88G,2块cpu共24核。
一般在天河超算平台上进行运算的步骤如下:

  1. 连接vpn,ssh连接天河超算平台;
  2. 登录天河超算平台,此时便是进入了登录结点,该结点只用来执行命令或执行一些较小的运算,该结点不可以执行消耗大的运算,因为一旦该结点内存或cpu占用过多,那么登录结点就会很卡,此时你在登录结点上的操作会变得很缓慢,比如切换文件夹,拉起其他命令等等。
  3. 登录登录结点后,检查自己所需要运行的脚本的环境是否配置成功,若没有可以用module命令检查超算平台上是否已安装,如果安装好了,直接module load xxx进行即可,load进来后就可以运行程序了。天河超算上如果没有事先安装好你需要的软件,那么可能需要联下外网进行安装,这个在说明书上有,不再叙述。
  4. 需要用yhrun命令拉起程序,在拉起程序前,第一需要看下当前各个结点的情况,yhi命令可以看结点使用情况,比如空闲结点有哪些,现在所在的分区是哪里等等;yhq可以看目前正在运行的结点有哪些。都确定好了之后可以使用yhrun命令拉起自己的程序。比如下面的命令就是执行了一个python脚本,需要对几个参数进行一下解释,-p是分区情况,-n是任务数(进程数),-c是线程数,-N是结点数。这个是我询问天河超算的管理人员后给的答复,似乎和说明书上写的不一样,说明书上说-c是cpu核数。但是无论如何我的理解是-c就是运行时能给同时开的线程,这个线程是真的同时运行的线程,所以我倾向于-c确实是核数,当然说是同时运行的线程数也可以。-N就是节点数,也就是给几台服务器运行你这个任务,-n是进程数,但是可能进程之间可以通信把,能把一个脚本的运行计算分成多个进程跑。这块的话由于涉及并行计算了,我也不懂,只是这样猜测了。-c最大是24,因为之前提到了一个结点最多就只有24个核,当希望脚本运行时线程并发数大于24时,就得开多于一个进程了,也就是说-n需要大于1。
yhrun -p partition_name -n 1 -N 1 -c 12 python script name

yhrun的话需要shell不能关闭,因为已关闭yhrun就停了,我之前也尝试使用过screen,但是不知道为什么,screen会自己关掉,screen关掉后,就导致yhrun也停了,所以最好还是用官方推荐的yhbatch。

  1. yhbatch的话,就是需要写一个sh文件,然后把yhrun的命令放在这个sh文件里,然后执行下列命令。其他参数和yhrun都是一样的,-o就是日志文件的输出位置。
yhbatch -N 1 -p partition name -n 1 -c 12  -o log file path xxx.sh

经过进一步的尝试,如果一个程序所需的内存大于一个结点时,设置-n大于1并没有用,似乎只是同一个程序跑了两次而已,当然这个结论还有待进一步测试,不一定正确。

天河二号一些使用注意事项相关推荐

  1. “天河二号”总工程师杜云飞谈星光超算应用平台设计

    整理 | 夕颜 出品 | AI科技大本营(ID:rgznai100) [导读]12 月 21-22 日,OpenI/O 启智开发者大会在深圳召开.在大会上, 国家超级计算广州中心总工程师." ...

  2. 天河二号 服务器 操作系统,天河二号云服务器

    天河二号云服务器 内容精选 换一换 本节介绍将Windows操作系统的KVM实例变更为擎天架构实例的操作步骤.KVM实例:参考规格清单,查询对应规格的虚拟化类型.擎天架构实例:选择"通用计算 ...

  3. 天河二号超级计算机拿来玩游戏,“天河二号超级计算机”是我国独立自主研制的超级计算机系统,...

    本题主要考核幻灯片的创建和主题的设置. 步骤 1 :在考生文件夹中新建演示文稿,并将文件名命名为"天河二号超级计算机". 步骤 2 :打开演示文稿,点击添加第一张幻灯片,切换到[设 ...

  4. 天河二号上运行ZHT(a zero-hop distributed table)

    最近做的研究室是空间信息网络中分布式元数据的管理,基于ZHT实现,需要搭建一个集群环境,老师就提供了天河二号,以下是在天河二号上运行ZHT的步骤,作为记录: 使用ZHT首先需要安装protobuf以及 ...

  5. 神威计算机英语,“神威太湖之光”取代“天河二号” 成全球最快超级计算机...

    6月20日,新一期全球超级计算机500强榜单公布,使用中国自主芯片制造的"神威太湖之光"取代"天河二号"登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第 ...

  6. 世界上最快的计算机-泰坦和天河二号

    NO.1 天河二号(TH-2,英文名:Tianhe-2.Milkyway-2): 是一组由中国国防科技大学等单位研制的异构超级计算机,为天河一号超级计算机的后继者,2013年6月起成为世界上最快的超级 ...

  7. 天河二号属于微型计算机吗,【单选题】我国的“天河二号”计算机在规模上属于( )。 A. 巨型机 B. 大型机 C. 微型机 D. 工作站...

    [单选题]我国的"天河二号"计算机在规模上属于( ). A. 巨型机 B. 大型机 C. 微型机 D. 工作站 更多相关问题 已知扇形的弧长为π,半径为1,则该扇形的面积为____ ...

  8. 天河二号超级计算机能买到吗,天河二号计算机是巨型机吗

    大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答. 天河二号计算机不是巨型机,是超级计算机."天河二号"是由国防科学技术大学研制的超级计算机系统,以峰值计算速度每 ...

  9. 天河二号计算机属于巨型计算机吗,天河二号计算机属于什么机

    语音内容: 大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答. 天河二号计算机属于超级计算机. 超级计算机是指信息处理能力比个人计算机快一到两个数量级以上的计算机,它在密集计算.海量 ...

最新文章

  1. android组件浮动在activity上_Jetpack Hilt 依赖注入框架上手指南
  2. r.java没有生成_r.java文件没有生成
  3. 两分钟彻底让你明白Android Activity生命周期(图文)!
  4. Django笔记06
  5. java源码导入eclipse_如何导入外部的源码到eclipse中
  6. CruiseControl.NET ----- mail 配置
  7. php 字符串 大括号,PHP中的字符串大括号
  8. python写crm_Python CRM项目八
  9. 最新Axure谷歌浏览器Chrome扩展程序安装方法
  10. 从零开始学统计 05 | 技术重复和生物学重复
  11. 计算机二级c语言选择题资料,计算机二级C语言重点选择题笔试复习资料
  12. html关闭广告代码,JS实现可点击展开与关闭的左侧广告代码
  13. Linux服务篇之远程访问及控制SSH
  14. 梯度及梯度下降法原理、公式推导
  15. L1-012 计算指数 (5 分) C语言
  16. safari浏览器下载中文文件名出现的乱码问题
  17. python另存为快捷键_Python学习之pycharm的快捷键大全
  18. 力扣 658. 找到 K 个最接近的元素
  19. 如何应对客户投诉,对上游部门如何投诉
  20. 产品推荐-监控网页内容变化的守夜人

热门文章

  1. 【Python中应用Winsorize缩尾处理的心得】
  2. Megaupload关闭波及Filesonic 分享功能被停
  3. 上网日志留存_中国移动5G上网日志留存系统招标:中兴通讯等
  4. go-cqhttp,QQ机器人发语音+视频+表情+接入chatgpt
  5. 桌面宠物python
  6. 网上商城Eshop综合购物平台毕业设计
  7. 免费工资总额管控系统-JXHR2016
  8. 视频教程-微信小程序开发教程(第一阶段、页面设计)(维吾尔语)-HTML5/CSS
  9. vscode之 Couldn‘t find a tree builder with the features you requested: lxml. Do you need to install a
  10. 基于netty实现一个简单的支持http和webSocket协议的的服务器(含xxl-job通信模块源码分析)