SCC(超级计算集群)简介 SCC概述 超级计算集群(Super Computing Cluster,SCC)使用高速RDMA网络互联的CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算集群服务。

SCC实例类型 类型 CPU Memory 网络 存储 适用场景 ecs.scch5.16xlarge 64核 Skylake Xeon Gold 6149 3.1GHz 192GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU主频高,单核计算能力强,适用于多数计算密集型应用场景 ecs.sccg5.24xlarge 96核 Skylake Xeon Platinum 8163 2.5GHz 384GB 50 Gbps RDMA 高效云盘(容量可选) + SSD云盘(容量可选) CPU核数多,内存容量大,适用于内存需求较高、扩展性好的科学计算场景以及高并发的批处理场景 使用SCC实例创建E-HPC集群 创建过程 目前配备有SCC实例的可用区主要有:华东1可用区H、华东2可用区B、华北1可用区C、华北3可用区A。考虑到库存的变化,用户在创建集群之前可以通过ECS管理控制台查看SCC实例在不同可用区的分布情况。 从E-HPC管理控制台进入集群创建页面,在计算节点下划栏中勾选SCC实例。 勾选SCC注意:上图中SCC实例的CPU核数是按照vCPU数目来显示的,而实际交付的SCC实例为超线程关闭(HT off)状态,即scch5.16xlarge和sccg5.24xlarge的CPU核数分别为32物理核和48物理核。

后续创建过程请参考E-HPC集群创建与配置 硬件信息 相比于普通ECS实例,SCC实例的核心硬件升级之一在于配备了50Gbps的RoCE(RDMA over Converged Ethernet)网络,故网络信息与普通ECS实例相比有明显差异。

网络硬件信息 相比于普通ECS实例,SCC实例同时拥有10Gbps VPC网络和50Gbps RoCE网络的网口,因此在会ECS管理控制台上会同时显示两个IP地址。 SCC IP

正常的SCC实例会显示如下网口信息,其中bond0为RoCE网口,eth0为VPC网口。 SCC网口信息

网络连通性验证 同一个E-HPC集群下的SCC实例间的VPC网络IP和RoCE网络IP均可以相互ping通 同一个E-HPC集群下的SCC实例间可以通过VPC网络IP和RoCE网络IP进行ssh登陆 RoCE网络性能测试 测试RoCE网络的峰值带宽与延迟 带宽测试样例 ##读带宽测试 ib_read_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_read_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 ##写带宽测试 ib_write_bw -a -q 20 --report_gbits ##服务端compute0执行 ib_write_bw -a -q 20 --report_gbits compute0 ##用户端compute1执行 延迟测试样例 ##读延迟测试 ib_read_lat -a ##服务端compute0执行 ib_read_lat -F -a compute0 ##用户端compute1执行 ##写延迟测试 ib_write_lat -a ##服务端compute0执行 ib_write_lat -F -a compute0 ##用户端compute1执行 监测RoCE网络的实际带宽利用情况 在SCC实例root用户下执行rdma_monitor -s实时获取RoCE网络信息 rdma_monitor

使用E-HPC性能监控与分析引擎集谛来监测各SCC实例RoCE网络带宽随时间的变化情况。 集谛监测RoCE

在SCC集群上编译和运行MPI程序 由于SCC实例同时支持50Gbps RoCE网络和10Gbps VPC网络,用户在执行跨节点MPI程序时可能会遇到节点间数据流量默认走VPC网口的情况,这里我们推荐用户在SCC集群上使用IntelMPI来编译和运行跨节点MPI程序。

编译跨节点MPI程序 安装IntelMPI E-HPC集成了IntelMPI 2018版本,用户只需在E-HPC控制台集群创建或软件管理功能界面中勾选IntelMPI 2018进行安装即可。

intelmpi

配置MPI环境变量 方法一:使用E-HPC集成的Module管理工具 $ module avail --------------------------------- /opt/ehpcmodulefiles -------------------------------- intel-mpi/2018 $ module load intel-mpi/2018 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 方法二:执行IntelMPI自带的环境变量配置脚本 $ source /opt/intel/compilers_and_libraries/linux/bin/compilervars.sh intel64 $ which mpicc /opt/intel/impi/2018.3.222/bin64/mpicc 设置MPI编译参数 完成MPI环境变量配置后,需要在软件Makefile或预编译脚本中指定MPI编译器的相对/绝对路径,然后执行编译过程。

-DCMAKE_C_COMPILER=mpicc -DCMAKE_CXX_COMPILER=mpicxx 运行跨节点MPI程序 对于在E-HPC软件环境中采用IntelMPI编译的软件,提交任务时无需额外指定网口参数,便可以直接通过RoCE网络进行跨节点数据通信。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= module load intel-mpi/2018 mpirun 对于在用户本地环境编译的软件或预编译的商用软件,可以在提交MPI任务时指定RoCE网卡信息来避免可能出现的数据流量不走RoCE网络或网卡设备not found等问题。 #!/bin/sh #PBS -j oe #PBS -l select=:ncpus=:mpiprocs= export I_MPI_FABRICS=shm:dapl module load intel-mpi/2018 mpirun -genv I_MPI_DAPL_PROVIDER ofa-v2-mlx5_bond_0 用户可以使用集谛性能监测功能对SCC实例的CPU利用率、访存带宽、RoCE网络带宽等性能数据进行实时监测。 SCC性能

linux查看都哪口状态,linux c 查看网口状态相关推荐

  1. linux目录都是什么意思,linux中的基本的目录结构都是什么意思,初学者都应该有印象-tmp是什么文件...

    /bin 这个目录存放一些经常使用的命令 /boot 这个目录存放的是启动linux时使用的一些核心文件,包括一些连接文件和镜像文件 /dev 这个目录是存放linux的外部设备,在linux中访问设 ...

  2. linux 网络端口状态,Linux下用netstat查看网络状态、端口状态(转)

    转:http://blog.csdn.net/guodongdongnumber1/article/details/11383019 在linux一般使用netstat 来查看系统端口使用情况步. n ...

  3. 监控io性能, free命令, ps命令, 查看网络状态, linux下抓包

    2019独角兽企业重金招聘Python工程师标准>>> 监控io性能 free命令 ps命令 查看网络状态 linux下抓包 --- 监控io性能 查看磁盘 iostat 和sar属 ...

  4. Linux日常运维管理技巧(一)监控系统状态、监控网卡流量、监控IO性能、查看系统进程、查看网络状态、Linux下抓包tcpdump、Linux网络相关、DNS配置

    目录 监控系统状态 监控网卡流量 监控IO性能 查看系统进程 查看网络状态 Linux下抓包 Linux网络相关 监控系统状态 w/uptime查看系统负载 [root@zyshanlinux-01 ...

  5. linux6 防火墙状态,linux 6 查看防火墙状态及开启关闭命令

    linux 6查看防火墙状态及开启关闭命令 存在以下两种方式: 一.service方式 查看防火墙状态: [root@centos6 ~]# service iptables status iptab ...

  6. oracle 僵死的进程,查看进程僵死状态 linux查看进程的方法有几种

    unix怎么看一个进程是不是僵死的 unix时程都有哪几种状态,具体怎么查看, unix怎么看一个进程是不是僵死的 利用命令ps,可以看到有标记为Z的进程就是僵尸进程. 显示Zombie状态进程 ps ...

  7. linux如何看udpsocket状态,Linux如何使用ss命令查看系统的socket状态

    Linux如何使用ss命令查看系统的socket状态 发布时间:2021-05-08 10:34:54 来源:亿速云 阅读:99 作者:小新 小编给大家分享一下Linux如何使用ss命令查看系统的so ...

  8. linux 查看san链路状态,linux系统运行状态检查

    1 CPU状态检查 1.1 运行时间 信息: 运行时间 / Uptime 工具: uptime 示例: [root@paris ~]# uptime 17:03:12 up 2 days, 20:08 ...

  9. linux怎么看文件状态,linux查看文件类型-file、状态-stat

    linux查看文件类型-file.状态-stat 首页 计算机相关 linux命令 linux查看文件类型-file.状态-stat file 命令可以用来查看文件类型-i mime type -s ...

最新文章

  1. 咱们一起聊聊Zookeeper
  2. Redis进阶-Redis的惰性删除
  3. python字典添加列表_【Python】对字典列表进行去重追加
  4. 【宜搭客户说第二期】宜搭助力跨境金融行业实现数字化管理
  5. element 时间日期选择器el-date-picker点击清空按钮报错 Cannot read property ‘0‘ of null
  6. 应用密码学的笑话之MD5+Salt不安全
  7. java兔子问题流程图_求龟兔赛跑的流程图 高手进来瞧瞧啊
  8. 已安装的Flash Player不支持FlexBuilder调试
  9. 华为服务器 修改为传统模式,电脑设置成服务器模式
  10. 手机b站封面提取网站_B站视频封面提取网站
  11. 光耦w314的各引脚图_a3140光耦用什么代替
  12. Android:根据阳历日期获取农历日期
  13. 英语语法基础01(句子结构)
  14. 第四章:迭代器与生成器
  15. 海豚湾,变态的日本银
  16. 内存类型:UDIMM、RDIMM、LRDIMM
  17. 配置pcl(点云)环境遇到的问题(华南理工大学三维人体建模与测量)
  18. 转一篇经典音响文章《“摩机”宝典之如何“摩功放”》
  19. Spring Framework 官方文档学习(四)之Validation、Data Binding、Type Conversion
  20. 三维重建02技术介绍及学习路径

热门文章

  1. Echarts数据可视化series-line线图,开发全解+完美注释
  2. python截图工具
  3. 点至直线的距离和垂足点计算
  4. 图的广度优先搜索算法
  5. 字符串拼接的双引号和单引号问题,转义字符
  6. iOS之Cocoapods安装
  7. appium 原理解析
  8. 【Java】【编译】javac编译源代码时,若源文件使用了别的java源代码的函数,javac会自动关联。...
  9. jQuery实用Ajax loading旋转指示器插件
  10. APP 上传之后出现invalid binary 问题解决汇总