经常听到客户反馈,某某分布式多机集群、某某云计算平台,在集群上做计算还不如普通电脑快,高性能计算集群做工程仿真计算效率很低,花了一大笔经费,经过一年多的方案论证、审批通过、采购、交货、使用,但集群性能表现很差。

看似高性能集群的计算服务器、存储服务器、管理服务器、infiniband交换机等硬件设备放到机柜上,通过网络交换机全部连接好,系统、软件、开发工具也都安装调试正常了,HPC集群就OK了,真这么简单吗?

实际情况:

可能1 计算服务器硬件配置选型不合理,
可能2 并行存储服务器硬件配置有问题
可能3 作业调度方法存在问题
可能4 计算方式选择有问题,通过GPU计算更快,但确用CPU计算方式
可能5 网络io有问题,永远是满负荷

出现这些问题的原因,集群的配置方案往往是使用者想要一个“最先进、成熟的”集群计算架构,自己认为的一个方案,或者过度相信“丰富有经验的系统集成商”(大品牌,不用质疑),根据客户的预算,给出的高性能计算集群方案。

使用者大部分是对软件熟悉,对工作计算任务熟悉,但因工作知识的局限性,可能对硬件配置,最新计算架构不是很精通,集成商,大部分都是卖设备的,关心的是设备能否卖出去,对客户应用了解很少或不是很深入,因此这样两类人,在一起交流讨论仿真计算集群硬件配置方案,未来必然存在隐患。那么一个合理、完美、高效的高性能计算集群方案的关键点都有什么?

首先 要根据客户的应用要求,跑什么软件,对这些软件特点进行分析。其次,根据掌握了应用情况,结合最新的硬件规格,分别给出计算服务器、GPU服务器、并行存储服务器、管理服务器、网络低延迟的交换机的对应方案,另外还要配备好一个高效的作业调度系统,这样这个集群方案更贴近仿真软件的计算要求。

关键点1 计算服务器用什么规格CPU、GPU、内存、硬盘,性能最大化?
关键点2 存储服务器,作为数据交换最密集的地方,最大的瓶颈,是什么?

不能忽略的情况:
       如果不知道仿真数值模拟软件的不同求解器的特点,很可能计算服务器配置正常,软件运行正常,速度很慢,怎么回事?
       如果不熟悉计算硬件架构,计算服务器的CPU频率高低无所谓,内存带宽无所谓,硬盘io无所谓,便宜就行,可能结果性能表现很差。
       如果不清楚很多软件已经支持GPU加速,求解过程得到10几倍的提升(用CPU就可以,或用最贵的GPU,也不快,什么情况?)
       如果不清楚作业调度正确方式,按核调用,计算规模越大,分配更多核,速度就快?
因此,集群配置缺陷,将来必然面临并行计算效率低,性能表现差的问题,再加上作业调度软件问题或使用问题,集群运算效率自然好不到哪里。

CX650高性能仿真计算集群

西安坤隆计算机公司,经过多年实际集群系统的应用软件运行和监测分析,我们可以给出从集群硬件配置和集群架构、作业调度全方位的满足不同仿真计算特点,通过采用最新CPU和GPU,以及合理硬件配置和高效作业调用,保证了集群的计算效率发挥到最大。UltraLAB高性能仿真计算集群充分考虑应用软件的算法特点,保证整个集群每个环节,计算服务器或GPU超算服务器,并行存储服务器等集群配置架构,无死角、无卡顿、均衡,都能最大限度发挥各自的性能。

应用软件并行计算特点

CX650仿真集群系统介绍

CX650是采用intel xeon第三代可扩展处理器组成的集群,代表着目前最新的计算架构,求解更快、更高效。CX650集群系统是由【高频服务器】、【计算服务器】、【GPU超算服务器】、【管理与存储服务器】、【高性能低延迟交换机】、作业调度系统组成。

CX650高性能仿真计算集群配置推荐

方案1:5个计算节点集群配置方案推荐

总核数:200核@2.8GHz 、 CPU算力 8.9TFlops 、 总内存容量 1.28TB 。

方案2: 10个计算节点集群配置方案推荐

总核数:400核@2.8GHz 、CPU算力 17.9TFlops 、GPU算力(FP32) 80Tfops 、总内存容量 2.56TB 。

方案3: 15个计算节点集群配置方案推荐

总核数:600核@2.8GHz 、CPU算力 26.88TFlops 、GPU算力(FP32) 80Tfops 、总内存容量 3.84TB 。

结构流体多物理场耦合高性能仿真计算集群配置推荐相关推荐

  1. Linux ANSYS Fluent计算集群配置

    目录 0 Linux系统及ANSYS版本 1 Linux系统安装及相关配置 1.1 系统安装 1.2 CentOS 配置ntfs挂载 1.3 SSH相关配置 2 ANSYS 安装 3 实际计算操作及相 ...

  2. Microsoft HPC Pack 2016部署Comsol Multiphysics多物理场耦合并行计算以及超大规模仿真计算集群硬件配置推荐

    并行计算(Parallel Computing)是指同时使用多个计算资源解决计算问题.并行 计算的主要目的是快速解决大型复杂的计算问题,或者节约成本--使用多台"廉价" 计算机取代 ...

  3. GPU在高性能仿真计算中的应用

    一.什么是GPU? 首先需要解释CPU和GPU这两个缩写分别代表什么.CPU即中央处理器,GPU即图形处理器.其次,要解释两者的区别,要先明白两者的相同之处:两者都有总线和外界联系,有自己的缓存体系, ...

  4. Linux仿真运算集群,fluent DPM Linux计算集群运行报错 - 计算模拟 - 小木虫 - 学术 科研 互动社区...

    计算对象是一个三维圆柱在空间中做简谐运动,计算域顶面有离散相入射. DPM设置为面入射,按rosin预设函数分布,unsteady particle track, 按0.001s的粒子时间步计算(计算 ...

  5. 创建父需求子需求构建需求树_用pc构建DIY计算集群(超级计算机)

    ----------------------------------------------------------------- 用pc构建DIY计算集群 目录 /构建计算集群 0. |-- /0前 ...

  6. 用pc构建DIY计算集群

    ----------------------------------------------------------------- 用pc构建DIY计算集群 目录 /构建计算集群 |-- /0前言 | ...

  7. 如何从0到1构建一个稳定、高性能的Redis集群?(附16张图解)

    阅读本文大约需要 13 分钟. 大家好,我是 Kaito. 这篇文章我想和你聊一聊 Redis 的架构演化之路. 现如今 Redis 变得越来越流行,几乎在很多项目中都要被用到,不知道你在使用 Red ...

  8. 学界 | 进化算法可以不再需要计算集群,开普敦大学的新方法用一块GPU也能刷新MNIST记录

    来源:AI科技评论 概要:最近这项来自南非开普敦大学的研究就带来了新的发现,只用单块GPU的资源就进化出了理想的网络结构,还刷新了三项测试的结果. 作者按:进化算法和生成式对抗性网络GANs类似,提出 ...

  9. 16 张图教你如何从 0 到 1 构建一个稳定、高性能的 Redis 集群!

    作者 | Magic Kaito   责编 | 张文 来源 | 水滴与银弹(ID:waterdrop_bullet) 这篇文章我想和你聊一聊 Redis 的架构演化之路. 现如今 Redis 变得越来 ...

最新文章

  1. 陶哲轩实分析 习题 7.5.2
  2. RecylerView动画组件RecylerViewAnimators
  3. Java™ 教程(字符流)
  4. 病毒软件,导致DNS失效的解决办法
  5. 119. Leetcode 115. 不同的子序列 (动态规划-子序列问题)
  6. 数据分析(排序,数据特征、平均数、方差等,累计统计,相关分析)
  7. CloudFoundry的cf push命令执行后,背后发生了什么
  8. js(Dom+Bom)第五天(1)
  9. FL-EM7688 Smart评估板openwrt开发环境搭建(linux固件部分)
  10. [2019 牛客CSP-S提高组赛前集训营4题解] 复读数组(数论)+ 路径计数机(数上DP)+ 排列计数机(线段树+二项式定理)
  11. 计算机网络—时延相关真题练习(三)
  12. 有哪些在朋友圈发会被秒赞的文案?
  13. 微信小程序支付异常:requestPayment:fail no permission
  14. java jdk学习_Java学习第一步:JDK环境搭建(纯小白向)
  15. VMP3.6的反调试和反虚拟机
  16. 华为主题引擎怎么下载_华为主题动态引擎
  17. 能耗监控 | FCU1101物联数采网关在电力能效管理系统中的应用
  18. CPU 是怎么认识代码的?
  19. Oracle分析函数PERCENTILE_CONT
  20. Element UI(一)

热门文章

  1. java 地址切换_IP切换 java语言
  2. 软件设计师——知识产权与标准化
  3. Canny边缘检测算法(C++实现)
  4. 基于Spring Cloud的微服务架构脚手架实践
  5. python爬取趣事百科文本笑话,另中间两个for能同时输出不解,请看到的朋友帮忙解答
  6. AHP层次分析法—特征权重初始化
  7. IDEA EasyApi导出接口到Yapi返回的数据格式未解析问题
  8. WheelCollider惯性漂移
  9. 颜色科学相关学习资料
  10. 上班可以摸鱼了,刚刚发现在VScode中可玩魂斗罗,超级玛丽,附详细攻略