SCC(超级计算集群)简介 SCC概述 超级计算集群(Super Computing Cluster,SCC)使用高速RDMA网络互联的CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算集群服务。

SCC实例类型 类型 CPU Memory 网络 存储 适用场景 ecs.scch5.16xlarge 64核 Skylake Xeon Gold 6149 3.1GHz 192GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU主频高,单核计算能力强,适用于多数计算密集型应用场景 ecs.sccg5.24xlarge 96核 Skylake Xeon Platinum 8163 2.5GHz 384GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU核数多,内存容量大,适用于内存需求较高、扩展性好的科学计算场景以及高并发的批处理场景 使用SCC实例创建E-HPC集群 创建过程 目前配备有SCC实例的可用区主要有:华东1可用区H、华东2可用区B、华北1可用区C、华北3可用区A。考虑到库存的变化,用户在创建集群之前可以通过ECS管理控制台查看SCC实例在不同可用区的分布情况。 从E-HPC管理控制台进入集群创建页面,在计算节点下划栏中勾选SCC实例。 勾选SCC注意:上图中SCC实例的CPU核数是按照vCPU数目来显示的,而实际交付的SCC实例为超线程关闭(HT off)状态,即scch5.16xlarge和sccg5.24xlarge的CPU核数分别为32物理核和48物理核。

后续创建过程请参考E-HPC集群创建与配置 硬件信息 相比于普通ECS实例,SCC实例的核心硬件升级之一在于配备了50Gbps的RoCE(RDMA over Converged Ethernet)网络,故网络信息与普通ECS实例相比有明显差异。

网络硬件信息 相比于普通ECS实例,SCC实例同时拥有10Gbps VPC网络和50Gbps RoCE网络的网口,因此在会ECS管理控制台上会同时显示两个IP地址。 SCC IP

正常的SCC实例会显示如下网口信息,其中bond0为RoCE网口,eth0为VPC网口。 SCC网口信息

网络连通性验证 同一个E-HPC集群下的SCC实例间的VPC网络IP和RoCE网络IP均可以相互ping通 同一个E-HPC集群下的SCC实例间可以通过VPC网络IP和RoCE网络IP进行ssh登陆 RoCE网络性能测试 测试RoCE网络的峰值带宽与延迟 带宽测试样例 ##读带宽测试 ib_read_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_read_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 ##写带宽测试 ib_write_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_write_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 延迟测试样例 ##读延迟测试 ib_read_lat -a ##服务端compute0执行 ib_read_lat -F -a compute0 ##用户端compute1执行 ##写延迟测试 ib_write_lat -a ##服务端compute0执行 ib_write_lat -F -a compute0 ##用户端compute1执行 监测RoCE网络的实际带宽利用情况 在SCC实例root用户下执行rdma_monitor -s实时获取RoCE网络信息 rdma_monitor

使用E-HPC性能监控与分析引擎集谛来监测各SCC实例RoCE网络带宽随时间的变化情况。 集谛监测RoCE

在SCC集群上编译和运行MPI程序 由于SCC实例同时支持50Gbps RoCE网络和10Gbps VPC网络,用户在执行跨节点MPI程序时可能会遇到节点间数据流量默认走VPC网口的情况,这里我们推荐用户在SCC集群上使用IntelMPI来编译和运行跨节点MPI程序。

编译跨节点MPI程序 安装IntelMPI E-HPC集成了IntelMPI 2018版本,用户只需在E-HPC控制台集群创建或软件管理功能界面中勾选IntelMPI 2018进行安装即可。

intelmpi

配置MPI环境变量 方法一:使用E-HPC集成的Module管理工具 $ module avail --------------------------------- /opt/ehpcmodulefiles -------------------------------- intel-mpi/2018 $ module load intel-mpi/2018 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 方法二:执行IntelMPI自带的环境变量配置脚本 $ source /opt/intel/compilers_and_libraries/linux/bin/compilervars.sh intel64 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 设置MPI编译参数 完成MPI环境变量配置后,需要在软件Makefile或预编译脚本中指定MPI编译器的相对/绝对路径,然后执行编译过程。

-DCMAKE_C_COMPILER=mpicc -DCMAKE_CXX_COMPILER=mpicxx 运行跨节点MPI程序 对于在E-HPC软件环境中采用IntelMPI编译的软件,提交任务时无需额外指定网口参数,便可以直接通过RoCE网络进行跨节点数据通信。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= module load intel-mpi/2018 mpirun 对于在用户本地环境编译的软件或预编译的商用软件,可以在提交MPI任务时指定RoCE网卡信息来避免可能出现的数据流量不走RoCE网络或网卡设备not found等问题。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= export I_MPI_FABRICS=shm:dapl module load intel-mpi/2018 mpirun -genv I_MPI_DAPL_PROVIDER ofa-v2-mlx5_bond_0 用户可以使用集谛性能监测功能对SCC实例的CPU利用率、访存带宽、RoCE网络带宽等性能数据进行实时监测。 SCC性能

linux 编译器ping,linux指定网口ping相关推荐

  1. linux 编译器 fpp,linux下常见的Fortran编译器介绍

    (百度和网页http://www.doczj.com/doc/d81360da50e2524de5187e0b.html/forum/simple/index.php?t6437.html 的作者无关 ...

  2. linux编译器6,Linux安装gcc编译器详解(CentOS 6.5 64位系统)

    本次安装针对CentOS 6.5 64位系统,由于在安装系统的时候并没有勾选安装gcc编译器,因此需要自行安装gcc编译器. 使用yum安装gcc 对于配备了yum的Linux发行版而言,安装gcc编 ...

  3. linux 编译器错误,linux – GHCi – Haskell编译器错误 – /home/user/.ghci归其他人所有,IGNORING...

    在尝试将〜/ .ghci文件更改为我的配置时,当我打开GHCi时出现此错误. GHCi, version 7.6.3: http://www.haskell.org/ghc/ :? for help ...

  4. linux 编译器制作,Linux交叉編譯器的制作(一)

    Linux交叉編譯器的制作-buildroot 1.問題出現 編譯內核時,需要在PC機上進行編譯才能下載到開發板上去,但兩個平台不一樣,需要我們自己實現這個功能. [klaus@localhost l ...

  5. 手机linux编译器,在linux上交叉编译helloWorld到android手机上去

    在ubuntu上交叉编译helloWorld到arm64的android手机上去. 这里NDK用的是r19及以上的版本. 1. 安装NDK 这里下载了 android-ndk-r21b,解压到 /ho ...

  6. linux 指定网卡 ping

    指定网卡 ping 1,系统环境 2,指定网卡 ping 检测网络 1,系统环境 $ sw_vers ProductName: Mac OS X ProductVersion: 10.13.6 Bui ...

  7. linux下,fping命令与ping命令解析

    ping Linux系统的ping命令是常用的网络命令,它通常用来测试与目标主机的连通性. 1.命令格式: ping [参数] [主机名或IP地址] 2.命令功能: ping命令用于:确定网络和各外部 ...

  8. linux fping参数,linux下,fping命令与ping命令解析

    ping Linux系统的ping命令是常用的网络命令,它通常用来测试与目标主机的连通性. 1.命令格式: ping [参数] [主机名或IP地址] 2.命令功能: ping命令用于:确定网络和各外部 ...

  9. linux命令菜鸟ping,Linux ping命令

    Linux ping命令 Linux ping命令用于检测主机. 执行ping指令会使用ICMP传输协议,发出要求回应的信息,若远端主机的网络功能没有问题,就会回应该信息,因而得知该主机运作正常. 语 ...

最新文章

  1. modelsim 自动化 独立仿真vivado ip核工程
  2. spring-cloud-config安全问题
  3. ajax调用上一个ajax,关于jquery:当频繁使用ajax请求调用函数时,如何在处理下一个请求之前等待上一个ajax请求完成?...
  4. Facebook-Rebound探索发现
  5. 云+AI+5G时代,华为云已准备好多元化云服务架构
  6. .NET Compact Framework 2.0 SP1 发布了
  7. 秒杀抢购软件,支持淘宝/天猫、京东、拼多多和苏宁易购茅台抢购、华为/小米手机抢购,源码技术交流
  8. 清华大学 谭浩强c语言课件,C语言课件 清华大学谭浩强版C3
  9. moment.js时间格式转换
  10. 知识管理在企业竞争发展中的作用
  11. android手机 滚动截屏,安卓手机如何滚动截屏?看完图解一秒学会!
  12. 7、JSON数据和Java对象的相互转换(客户端和服务器对象数据通讯用)
  13. Playbooks 简介
  14. arduino 源码分层浅析
  15. 在长度为n的()上,删除第一个元素,其算法的时间复杂度为O(n)
  16. supervisor reload报错及恢复方法
  17. Java 程序处理 去除文件中的NUL字符
  18. The Old Man and The Sea
  19. 基于WIFI无线组网的水雨情远程监测预警系统
  20. 数据结构-16枚硬币问题

热门文章

  1. 【Python】类与对象:封装/继承/多态
  2. 通过百度简单获取本地 ip 地址
  3. Keil主题配色方案
  4. 关于 Activity 的跳转。
  5. 中电信涉水软件网络商店 开发者可获四成收入
  6. 《影像中的国》阅读摘抄
  7. springboot写接口
  8. 虚幻引擎 4.14 版发布!
  9. C/C++练习(一)——将句子倒序输出:输入“how are you倒序输出you are how
  10. 炉石传说 服务器 维护,《炉石传说》出现严重运营事故,维护近40小时,数据将回档至14日...