SCC(超级计算集群)简介 SCC概述 超级计算集群(Super Computing Cluster,SCC)使用高速RDMA网络互联的CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算集群服务。

SCC实例类型 类型 CPU Memory 网络 存储 适用场景 ecs.scch5.16xlarge 64核 Skylake Xeon Gold 6149 3.1GHz 192GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU主频高,单核计算能力强,适用于多数计算密集型应用场景 ecs.sccg5.24xlarge 96核 Skylake Xeon Platinum 8163 2.5GHz 384GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU核数多,内存容量大,适用于内存需求较高、扩展性好的科学计算场景以及高并发的批处理场景 使用SCC实例创建E-HPC集群 创建过程 目前配备有SCC实例的可用区主要有:华东1可用区H、华东2可用区B、华北1可用区C、华北3可用区A。考虑到库存的变化,用户在创建集群之前可以通过ECS管理控制台查看SCC实例在不同可用区的分布情况。 从E-HPC管理控制台进入集群创建页面,在计算节点下划栏中勾选SCC实例。 勾选SCC注意:上图中SCC实例的CPU核数是按照vCPU数目来显示的,而实际交付的SCC实例为超线程关闭(HT off)状态,即scch5.16xlarge和sccg5.24xlarge的CPU核数分别为32物理核和48物理核。

后续创建过程请参考E-HPC集群创建与配置 硬件信息 相比于普通ECS实例,SCC实例的核心硬件升级之一在于配备了50Gbps的RoCE(RDMA over Converged Ethernet)网络,故网络信息与普通ECS实例相比有明显差异。

网络硬件信息 相比于普通ECS实例,SCC实例同时拥有10Gbps VPC网络和50Gbps RoCE网络的网口,因此在会ECS管理控制台上会同时显示两个IP地址。 SCC IP

正常的SCC实例会显示如下网口信息,其中bond0为RoCE网口,eth0为VPC网口。 SCC网口信息

网络连通性验证 同一个E-HPC集群下的SCC实例间的VPC网络IP和RoCE网络IP均可以相互ping通 同一个E-HPC集群下的SCC实例间可以通过VPC网络IP和RoCE网络IP进行ssh登陆 RoCE网络性能测试 测试RoCE网络的峰值带宽与延迟 带宽测试样例 ##读带宽测试 ib_read_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_read_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 ##写带宽测试 ib_write_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_write_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 延迟测试样例 ##读延迟测试 ib_read_lat -a ##服务端compute0执行 ib_read_lat -F -a compute0 ##用户端compute1执行 ##写延迟测试 ib_write_lat -a ##服务端compute0执行 ib_write_lat -F -a compute0 ##用户端compute1执行 监测RoCE网络的实际带宽利用情况 在SCC实例root用户下执行rdma_monitor -s实时获取RoCE网络信息 rdma_monitor

使用E-HPC性能监控与分析引擎集谛来监测各SCC实例RoCE网络带宽随时间的变化情况。 集谛监测RoCE

在SCC集群上编译和运行MPI程序 由于SCC实例同时支持50Gbps RoCE网络和10Gbps VPC网络,用户在执行跨节点MPI程序时可能会遇到节点间数据流量默认走VPC网口的情况,这里我们推荐用户在SCC集群上使用IntelMPI来编译和运行跨节点MPI程序。

编译跨节点MPI程序 安装IntelMPI E-HPC集成了IntelMPI 2018版本,用户只需在E-HPC控制台集群创建或软件管理功能界面中勾选IntelMPI 2018进行安装即可。

intelmpi

配置MPI环境变量 方法一:使用E-HPC集成的Module管理工具 $ module avail --------------------------------- /opt/ehpcmodulefiles -------------------------------- intel-mpi/2018 $ module load intel-mpi/2018 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 方法二:执行IntelMPI自带的环境变量配置脚本 $ source /opt/intel/compilers_and_libraries/linux/bin/compilervars.sh intel64 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 设置MPI编译参数 完成MPI环境变量配置后,需要在软件Makefile或预编译脚本中指定MPI编译器的相对/绝对路径,然后执行编译过程。

-DCMAKE_C_COMPILER=mpicc -DCMAKE_CXX_COMPILER=mpicxx 运行跨节点MPI程序 对于在E-HPC软件环境中采用IntelMPI编译的软件,提交任务时无需额外指定网口参数,便可以直接通过RoCE网络进行跨节点数据通信。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= module load intel-mpi/2018 mpirun 对于在用户本地环境编译的软件或预编译的商用软件,可以在提交MPI任务时指定RoCE网卡信息来避免可能出现的数据流量不走RoCE网络或网卡设备not found等问题。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= export I_MPI_FABRICS=shm:dapl module load intel-mpi/2018 mpirun -genv I_MPI_DAPL_PROVIDER ofa-v2-mlx5_bond_0 用户可以使用集谛性能监测功能对SCC实例的CPU利用率、访存带宽、RoCE网络带宽等性能数据进行实时监测。 SCC性能

linux查看bond0网卡,linux 查看bond0相关推荐

  1. linux怎么看网卡日志,查看网卡信息及状态和网卡日志信息

    查看网卡信息 1-mii-tool [-v/w] em1/em2/l0 em1: negotiated 100baseTx-FD, link ok product info: vendor 00:aa ...

  2. linux 内核 82540网卡,Linux网卡as4.2 编译安装及配置准备

    Linux网卡as4.2 编译安装及配置准备 [日期:2008-03-28] 来源:Linux公社 作者:Linux整理 [字体:大 中 小] 确定make gcc kernel-devel包必须安装 ...

  3. linux删除slave网卡,Linux bonding网卡与其slave共同使用

    在昨天的一文中,我吐槽了Linux各种虚拟网卡设计的不完备,也只是吐槽,其实我并没有别的意思,我也懒得去做一些hack型的配置去规避这些不完备,我只是吐槽而已. 昨晚,有网友要求我给出一些解法,因为他 ...

  4. linux关闭bond网卡,Linux 网卡Bond

    服务器共四块网卡,现要将四块网绑,进行两两绑定,只简单介绍实践过程. 说明:网卡绑定有多种模式,详细信息请google 在Linux系统下实现网卡绑定的步骤: 1.在/ect/sysconfig/ne ...

  5. linux怎样重启网卡,linux系统重启网卡的方法步骤详解

    在实际工作中,经常会遇到Linux系统进行重启网卡的操作.接下来是小编为大家收集的linux系统重启网卡方法,希望能帮到大家. linux系统重启网卡方法 一.service network rest ...

  6. linux安装8168网卡,linux下安装RTL8168B或RTL8189等网卡方法心得

    整个安装过程需要用的命令: # lspci //列出所有PCI插卡硬件信息. # lspci �Cqa |grep Ethernet //专门查看网卡型号,方便去寻找驱动. # ethtool �Ci ...

  7. linux里添加网卡,Linux添加虚拟网卡的多种方法

    Linux添加虚拟网卡的多种方法有时候,一台服务器需要设置多个ip,但又不想添加多块网卡,那就需要设置虚拟网卡.这里介绍几种方式在linux服务器上添加虚拟网卡.我们 有时候,一台服务器需要设置多个i ...

  8. 如何查询linux服务器的网卡,Linux服务器如何查看有没有无线网卡

    还是实验室那台服务器,连不上网.有没有界面,所以想着如何用一些命令来链接上热点.当然,在Linux下链接wifi没有win下那么一点就好了! 首先我们需要的基本条件就是: 服务器上有无线网卡. [ro ...

  9. linux支持ppp网卡,linux和安卓上(ppp widget)使用3g网卡的方法

    在usb3G上网卡中,有许多都是使用的称为zeroCD的一种模式.就是在初始时,将3G上网卡,识别为一个CD设备.然后自动安装驱动,安装完成后.自动卸载.将3G网卡转换成串口模式. 要想在linux和 ...

最新文章

  1. 为什么要放弃 Lombok ?
  2. 【笔记】Comparison of Object Detection and Patch-Based Classification Deep Learning Models on Mid- to La
  3. 入门数据分析选择Python还是SQL?七个常用操作对比!
  4. 指针变量的定义与引用
  5. heroku_本月风味– Neo4j和Heroku
  6. 新年就是要你红!华为Mate 20 Pro馥蕾红璨星蓝来袭
  7. 一加7是什么协议_刘作虎“拔钉”成功:大量一加5、一加3用户入手一加8T
  8. 【docker】docker持续集成CI/持续部署CD
  9. HTTP API 设计指南(响应部分)
  10. PphpStorm常用操作整理
  11. Zabbix 5.0版本的详细安装教程
  12. 广州日报新媒体发展战略解析(转)
  13. 51SCM_AD模块CS5550学习心得
  14. 【嵌入式开发】 Linux Kernel 下载 配置 编译 安装 及 驱动简介
  15. pe卸载linux系统软件,ciscodk教你卸载Linux软件
  16. notepad++ 多行批量 标序号
  17. 如何在线将普通英文转换成艺术英文字体?
  18. 08-egg服务端发送请求
  19. Linux开发者的CI/CD(3)jenkins pipeline语法学习
  20. 三层交换机与路由器的连接(sisco)

热门文章

  1. 魅族支持鸿蒙吗,魅族用上鸿蒙,小厂商抱团作战的起点?
  2. 无论你做什么爸爸妈妈都爱你java_各位叔叔阿姨啊,我不管做什么都会被自己的爸爸妈妈教育啊,如果你是? 爱问知识人...
  3. Qt的实训项目:酒店管理系统开发进度
  4. 《A sparse annotation strategy based on attention-guided active learning for 3D medic》--阅读笔记-Arxiv
  5. cmd for 遍历目录_DOS 遍历目录及子目录,删除特定名称文件夹或文件
  6. google Picasa 3.9 图片浏览器 提取版
  7. 由于Redis后门漏洞导致服务器被注入挖矿脚本解决过程
  8. PhotoshopCS4轻松将PSD分层导出为Png分层
  9. break和continue的区别
  10. ui曲线谁是横坐标_用UiBot做Excel曲线图