一、什么是GPU?

首先需要解释CPU和GPU这两个缩写分别代表什么。CPU即中央处理器,GPU即图形处理器。其次,要解释两者的区别,要先明白两者的相同之处:两者都有总线和外界联系,有自己的缓存体系,以及数字和逻辑运算单元。一句话,两者都为了完成计算任务而设计。

两者的区别在于存在于片内的缓存体系和数字逻辑运算单元的结构差异:CPU虽然有多核,但总数没有超过两位数,每个核都有足够大的缓存和足够多的数字和逻辑运算单元,并辅助有很多加速分支判断甚至更复杂的逻辑判断的硬件;GPU的核数远超CPU,被称为众核(NVIDIA Fermi有512个核)。每个核拥有的缓存大小相对小,数字逻辑运算单元也少而简单(GPU初始时在浮点计算上一直弱于CPU)。

从结果上导致CPU擅长处理具有复杂计算步骤和复杂数据依赖的计算任务,如分布式计算,数据压缩,人工智能,物理模拟,以及其他很多很多计算任务等。GPU由于历史原因,是为了视频游戏而产生的(至今其主要驱动力还是不断增长的视频游戏市场),在三维游戏中常常出现的一类操作是对海量数据进行相同的操作,如:对每一个顶点进行同样的坐标变换,对每一个顶点按照同样的光照模型计算颜色值。

GPU的众核架构非常适合把同样的指令流并行发送到众核上,采用不同的输入数据执行。在2003-2004年左右,图形学之外的领域专家开始注意到GPU与众不同的计算能力,开始尝试把GPU用于通用计算(即GPGPU)。

GPU 加速计算是指同时采用图形处理单元(GPU) 和 CPU,以加快科学、分析、设计、消费者和企业应用程序的速度。GPU 加速器与 2007 年由 NVIDIA 率先推出,现已在世界各地为政府实验室、大学、公司以及中小型企业的高能效数据中心提供支持。GPU 能够为从汽车、手机和平板电脑到无人机和机器人等平台的应用程序加快速度。

总之,GPU的作用如下:

GPU最早用于提升图形计算的性能,增加图形质量。

现今GPU已经不局限于图形处理,还可以用于并行计算的加速。

二、GPU在ANSYS高性能仿真模拟中的应用

计算机辅助工程(CAE)模拟让工程师能够设计更多的虚拟原型产品,因而在打造物理原型产品上花费的时间更少。更多次的反复设计可以成就更高质量的产品,通过加速模拟,GPU 能够进一步提高生产率,从而有助于缩短产品开发时间,为企业带来更具竞争力的优势。

ANSYS与 NVIDIA密切合作,以确保在 ANSYS 并行软件上运行的模拟能够达到性能。NVIDIA GPU 支持下列产品:

  • 结构:ANSYS Mechanical 17.0支持全套特性,其中包括在多颗 GPU上运行。
  • 流体:ANSYS Fluent 17.0能够为基于压力的耦合解算器和辐射传热模型提供GPU支持。
  • 电磁:ANSYS HFSS 17.0支持瞬态流动仿真计算瞬时求解器。

现在利用 NVIDIA GPU 加速 ANSYS 模拟比以往任何时候都更加容易。在 17.0 版本中,所有的 HPC 许可产品(HPC、HPC Pack、HPC Workgroup)均支持 GPU。具体而言,在许可证要求这方面,每一路 GPU 被视为一个 CPU 核心。如此一来,利用现有 HPC 许可证再加上 NVIDIA GPU,即可大幅提升模拟生产率,从而能够完成更多模拟工作。

三、GPU在ANSYS高性能仿真模拟中的成功应用案例

案例1

当使用 NVIDIA Tesla K20 或的 Tesla K40 GPU 时,ANSYS Mechanical 17.0 可实现大幅性能提升。 在下面的标准 ANSYS Mechanical 基准测试中看一看性能结果。

利用工作站中的 NVIDIA Tesla K40,ANSYS Mechanical 用户在大型模型上可实现更高的吞吐量。单块 K40 计算卡可加速 12M 自由度的大型模型,与单纯使用CPU相比可实现2倍性能提升。

案例2

ANSYS Fluent 17.0 现已支持多 GPU,能够在 CFD 模拟中实现更高的生产率。 这种性能增强归功于创新的 GPU 加速求解器和 ANSYS 17.0 中全新的许可方案,该求解器(叫做 AmgX)由 NVIDIA 和 ANSYS 合作开发。Fluent 17.0 中的当前软件能够加速基于压力的耦合流体求解器,从而可加快 CFD 模拟的流体部分。 只要为现有的 HPC 基础架构添加 Tesla K20、Tesla K20X 或 Tesla K40 GPU,即可享受到这些好处。它经专门设计,可在集群配置中具备多颗 GPU 的多个节点上运行,就像在 CPU 系统上运行一样。

下列图表对比了Tesla K40 GPU与CPU在ANSYS Fluent 15.0中的性能,软件是在集群上运行的,所模拟的是一种大型空气动力学情形。

4、总结

高性能计算(HPC&GPU)是未来仿真计算的发展趋势,将作为国家竞争力的重要标志之一。

GPU 作为推动高性能计算的驱动力,是高性能、低功耗的完美结合。

GPU在高性能仿真计算中的应用相关推荐

  1. 高性能计算之九-GPU在ANSYS高性能仿真计算中的应用

    什么是GPU? 首先需要解释CPU和GPU这两个缩写分别代表什么.CPU即中央处理器,GPU即图形处理器.其次,要解释两者的区别,要先明白两者的相同之处:两者都有总线和外界联系,有自己的缓存体系,以及 ...

  2. 结构流体多物理场耦合高性能仿真计算集群配置推荐

    经常听到客户反馈,某某分布式多机集群.某某云计算平台,在集群上做计算还不如普通电脑快,高性能计算集群做工程仿真计算效率很低,花了一大笔经费,经过一年多的方案论证.审批通过.采购.交货.使用,但集群性能 ...

  3. matlab 水利,Matlab在水力仿真计算中的应用.kdh.pdf

    ISSN 1009-3044 E-mail: eduf@ 第 卷第 期 年 月 6 3 (2010 1 ) Computer Knowledge and Technology 电脑知识与技术 Comp ...

  4. 3d打印英语文献_DMD 激光熔覆3D打印机型设计在仿真计算中的经验分享

    文章来源:安世亚太官方订阅号(搜索:peraglobal) 激光熔覆技术是20世纪80年代后兴起的一种新的表面处理技术,是指在基体表面上涂覆不同材料,这些材料以粉末的形式经送粉装置输送到基体材料表面, ...

  5. 格子玻尔兹曼方法(LBM)计算中的无量纲化转化(将物理参数转化为格子参数)

    说明:方法来自外文资料,主要通过无量纲方法进行LBM仿真计算中由实际物理量到格子物理量的转化,保证其一致性 已知量 物理长度尺寸HHH : 格子长度尺寸 (自定义)H~\tilde{H}H~: 密度ρ ...

  6. adams软件Linux,ADAMS仿真过程中如何提高计算效率,缩短计算时间,相应其他软件也可以类似操作。(原创)...

    大家再用软件做仿真计算时,总是感觉很费时间,有时候一算几十个小时还没有正确结果.个人总结了一下ADAMS中设置仿真计算节约时间的一些小规律,请采纳,其他的软件类似也是如此. 1.ADAMS中 end ...

  7. 2018结构、流体、热分析、多物理场耦合、电磁仿真计算特点与硬件配置方案分析

         2018结构.流体.热分析.多物理场耦合.电磁仿真计算特点与硬件配置方案分析 主要内容 1.有限元分析概述 2.有限元分析模拟计算过程分析与计算特点 2.1有限元前处理(建模.网格划分)计算 ...

  8. 阿里云HPC助力新制造 | 上汽仿真计算云SSCC

    随着上汽集团与阿里云的合作开展,阿里云各项技术逐步深入到上汽汽车研发领域的核心业务实现落地.其中上海汽车集团股份有限公司乘用车分公司(以下简称上汽乘用车)与阿里云共建的仿真计算混合云就是新制造产业升级 ...

  9. 阿里云HPC助力新制造 | 上汽仿真计算云SSCC 1

    摘要: 据了解,借助阿里云,上汽乘用车实现了工程开发仿真能力升级,仿真计算效率提升了25%,使工程开发人员更加专注于产品设计和性能优化,打造出世界级产品的高品质.今年北京车展上全球首秀的概念车MG X ...

最新文章

  1. 2017年嵌入式领域的MCU四个变化
  2. 20145317《网络对抗》shellcode注入Return-to-libc攻击深入
  3. 二十、SPI设备驱动及应用(一)
  4. 解压缩文件命令linux
  5. 【CyberSecurityLearning 62】文件包含
  6. java mp3 to wav_java实现wavToMP3格式转换详解
  7. 问题 J: 寻找复读机【模拟】
  8. CAN笔记(3) 错误状态
  9. 关于0bug商用之道的第三章的少用模板
  10. Linux2.6用户空间堆栈区的分配与回收
  11. Git-第二篇廖雪峰Git教程学习笔记(1)基本命令,版本回退
  12. 【数据结构初阶-oj】入门二叉树的入门oj
  13. 现代计算机网络的前沿技术,现代计算机网络的前沿技术分析
  14. Android,什么是MVP模式?
  15. python:操作文档——TXT篇
  16. 如何帮助公司设计一个优秀的品牌标志?
  17. 支持语音记事的便签怎么将声音文件转文字保存
  18. vue3循环遍历图片渲染无效果
  19. 代码审计:企业级web代码安全架构读书笔记(一)
  20. Vue SSR 渲染 Nuxt3 入门学习

热门文章

  1. web work 。。。
  2. Switch 开关,将字写在滑块上面
  3. TPO “Java运行环境未找到”
  4. 大数据和位置智能:助力企业数字化战略落地
  5. 陌陌推出点赞匹配功能,动了谁的蛋糕?
  6. 邮件营销群发6大技巧!怎么群发邮件效果好?
  7. 10款 好用的php 编辑器
  8. Angular自定义组件实现ngModel双向绑定
  9. 教师考核成绩评定c语言程序,C语言课设--教师评价系统
  10. 爬取古诗文网的推荐古诗