SCC(超级计算集群)简介 SCC概述 超级计算集群(Super Computing Cluster,SCC)使用高速RDMA网络互联的CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算集群服务。

SCC实例类型 类型 CPU Memory 网络 存储 适用场景 ecs.scch5.16xlarge 64核 Skylake Xeon Gold 6149 3.1GHz 192GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU主频高,单核计算能力强,适用于多数计算密集型应用场景 ecs.sccg5.24xlarge 96核 Skylake Xeon Platinum 8163 2.5GHz 384GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU核数多,内存容量大,适用于内存需求较高、扩展性好的科学计算场景以及高并发的批处理场景 使用SCC实例创建E-HPC集群 创建过程 目前配备有SCC实例的可用区主要有:华东1可用区H、华东2可用区B、华北1可用区C、华北3可用区A。考虑到库存的变化,用户在创建集群之前可以通过ECS管理控制台查看SCC实例在不同可用区的分布情况。 从E-HPC管理控制台进入集群创建页面,在计算节点下划栏中勾选SCC实例。 勾选SCC注意:上图中SCC实例的CPU核数是按照vCPU数目来显示的,而实际交付的SCC实例为超线程关闭(HT off)状态,即scch5.16xlarge和sccg5.24xlarge的CPU核数分别为32物理核和48物理核。

后续创建过程请参考E-HPC集群创建与配置 硬件信息 相比于普通ECS实例,SCC实例的核心硬件升级之一在于配备了50Gbps的RoCE(RDMA over Converged Ethernet)网络,故网络信息与普通ECS实例相比有明显差异。

网络硬件信息 相比于普通ECS实例,SCC实例同时拥有10Gbps VPC网络和50Gbps RoCE网络的网口,因此在会ECS管理控制台上会同时显示两个IP地址。 SCC IP

正常的SCC实例会显示如下网口信息,其中bond0为RoCE网口,eth0为VPC网口。 SCC网口信息

网络连通性验证 同一个E-HPC集群下的SCC实例间的VPC网络IP和RoCE网络IP均可以相互ping通 同一个E-HPC集群下的SCC实例间可以通过VPC网络IP和RoCE网络IP进行ssh登陆 RoCE网络性能测试 测试RoCE网络的峰值带宽与延迟 带宽测试样例 ##读带宽测试 ib_read_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_read_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 ##写带宽测试 ib_write_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_write_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 延迟测试样例 ##读延迟测试 ib_read_lat -a ##服务端compute0执行 ib_read_lat -F -a compute0 ##用户端compute1执行 ##写延迟测试 ib_write_lat -a ##服务端compute0执行 ib_write_lat -F -a compute0 ##用户端compute1执行 监测RoCE网络的实际带宽利用情况 在SCC实例root用户下执行rdma_monitor -s实时获取RoCE网络信息 rdma_monitor

使用E-HPC性能监控与分析引擎集谛来监测各SCC实例RoCE网络带宽随时间的变化情况。 集谛监测RoCE

在SCC集群上编译和运行MPI程序 由于SCC实例同时支持50Gbps RoCE网络和10Gbps VPC网络,用户在执行跨节点MPI程序时可能会遇到节点间数据流量默认走VPC网口的情况,这里我们推荐用户在SCC集群上使用IntelMPI来编译和运行跨节点MPI程序。

编译跨节点MPI程序 安装IntelMPI E-HPC集成了IntelMPI 2018版本,用户只需在E-HPC控制台集群创建或软件管理功能界面中勾选IntelMPI 2018进行安装即可。

intelmpi

配置MPI环境变量 方法一:使用E-HPC集成的Module管理工具 $ module avail --------------------------------- /opt/ehpcmodulefiles -------------------------------- intel-mpi/2018 $ module load intel-mpi/2018 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 方法二:执行IntelMPI自带的环境变量配置脚本 $ source /opt/intel/compilers_and_libraries/linux/bin/compilervars.sh intel64 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 设置MPI编译参数 完成MPI环境变量配置后,需要在软件Makefile或预编译脚本中指定MPI编译器的相对/绝对路径,然后执行编译过程。

-DCMAKE_C_COMPILER=mpicc -DCMAKE_CXX_COMPILER=mpicxx 运行跨节点MPI程序 对于在E-HPC软件环境中采用IntelMPI编译的软件,提交任务时无需额外指定网口参数,便可以直接通过RoCE网络进行跨节点数据通信。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= module load intel-mpi/2018 mpirun 对于在用户本地环境编译的软件或预编译的商用软件,可以在提交MPI任务时指定RoCE网卡信息来避免可能出现的数据流量不走RoCE网络或网卡设备not found等问题。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= export I_MPI_FABRICS=shm:dapl module load intel-mpi/2018 mpirun -genv I_MPI_DAPL_PROVIDER ofa-v2-mlx5_bond_0 用户可以使用集谛性能监测功能对SCC实例的CPU利用率、访存带宽、RoCE网络带宽等性能数据进行实时监测。 SCC性能

linux查看物理机cpu核数,linux 查看物理cpu核数相关推荐

  1. linux查看网卡物理编号_关于如何查看多网卡物理机中网卡序号与物理网卡的对应该关系...

    做软件开发的人都知道:接触真正底层系统驱动的的机会很少(做网络驱动的除外哦),上周和同事一起在一块物理机的办卡上安装centerOS6.5(至于为啥安装6.5版本的,只能说厂商要求的),遇到了一个持续 ...

  2. 物理机如何安装Linux centos7

    物理机如何安装centos7 首先整理工作流程: 1.下载centos7镜像文件 2.制作U盘启动盘(UltraISO) 3.进入BIOS使用U盘启动 4.基本配置选择 首先整理工作流程: 1.下载c ...

  3. linux连接本机mysql数据库,Linux中MySQL连接本机数据库客户端

    Linux中MySQL连接本机数据库客户端 Linux中MySQL连接本机数据库客户端 1.登入mysql数据库 2.找到要修改的位置 // 选定要用的数据库(用show databases;看完再u ...

  4. linux 查看本机网关地址,linux查看服务器网关地址

    弹性云服务器 ECS 弹性云服务器(Elastic Cloud Server)是一种可随时自助获取.可弹性伸缩的云服务器,帮助用户打造可靠.安全.灵活.高效的应用环境,确保服务持久稳定运行,提升运维效 ...

  5. linux物理机虚拟化xen,Linux下使用Xen搭建虚拟机心得

    本文讲解了如下内容1.xen的安装步骤:2.如何使用xen搭建自己的虚拟机:3.在安装过程中遇到的问题. 一.安装前检查 1)查看你的主机cpu是否支持虚拟化:输入命令cat /proc/cpuinf ...

  6. linux 系统 电脑,给自己电脑(物理机)安装 linux 系统

    一天心血来潮突然想装个Ubuntu系统玩玩,结果一顿操作后发现不是和安装windows系统那么简单,根据各方尝试(下各种制作工具啊啥的)终于... 先总结一下需要的东西: 一个内存足够U盘,ios镜像 ...

  7. linux服务器宕机原因排查,Linux服务器中网站数据库宕机的自动检测及重启脚本...

    最近一段时间,Linux服务器中的一个重要网站的数据库总是奔溃,导致网站无法正常访问(显示为网站正在维护中),于是就决定写个脚本来自动监控这个网站是否正常,如果发现网站宕机,则自动重启数据库和网站. ...

  8. linux 文件 跳板机_转载 linux 基于ssh创建跳板机

    做笔记用,担心原作者哪天删了,权当留个备份 -------分割线 以下正文------- 搭建基于ssh的跳板机,服务器至少2台及以上 一.在所有服务器上创建相同的跳板机用户 [root@dev ~] ...

  9. linux删除本机mysql_删除Linux本机自带的Apache/PHP/MySQL

    在Linux安装的时候有时选择安装apache.php.MySQL的话有时候我们就要删除重新安装更高的版本,很多人不希望使用Linux自带Mysql.Apache.Php软件工具,但是在安装新版本时系 ...

  10. linux冷备机怎么切换,linux – 热备用主机vs冷备用主机?

    Sobrique explains how the manual intervention causes your proposed solution to be sup-optimal和 ewwhi ...

最新文章

  1. 对于元组的访问 的优化访问方式
  2. java模拟一个军队作战_战区级联合作战仿真推演系统
  3. 运用Arc Hydro提取河网
  4. windows(win7,win8,xp)hosts文件找不到原因分析及解决方法
  5. c++ 1:非MFC工程使用MFC库时的问题及解决办法(如果要用CString或者提示windows头文件重复包含)...
  6. 【bzoj5099】[POI2018]Pionek 双指针法
  7. Syncthing vs BitTorrent Sync
  8. pandas的离散化,面元划分
  9. 润乾报表连接mysql_润乾报表与DERBY数据库的创建连接详解
  10. Python代码书写规范
  11. UI设计师常用500多款字体和73款手写字体打包
  12. ADB工具连接Android手机
  13. 华硕笔记本Delete键和Insert键合二为一与分离
  14. 模拟Get、Post请求
  15. python开发抢票软件_python自动抢票神器
  16. C-7统计元音字母个数
  17. 圆桌:满足客人空座需求,准备最少的椅子,合理安排客人入座圆桌
  18. 三重缓冲:为什么我们爱它
  19. KDevelop开发环境的搭建
  20. 大数据杀熟为何屡禁不止

热门文章

  1. 9.03 Every Day English
  2. CCA,rCCA,gCCA
  3. java 腾讯地图api,Class:覆盖物/Marker - 腾讯地图API
  4. 期刊论文的分析技巧与程序
  5. 我偶尔会用到的调试方法 | Linux 内核
  6. 图片转PDF如何免费在线转换?教你免费在线转换方法
  7. OpenCV(2)--OpenCV介绍
  8. 写在5G边缘:2B本质是2C
  9. springboot微信sdk方式进行微信支付
  10. 大话西施公网演示搭建OK了,研究用.