编者按:在不久前闭幕的ISC12国际大学生超级计算机竞赛中,由浪潮集团组织支持的清华大学、国防科学技术大学参赛队分别勇夺竞赛总冠军和最高计算性能奖,优异成绩震惊国际超算界。作为此次国内外竞赛设备、技术的负责人,浪潮高性能计算技术专家王渭巍为我们深度剖析“最高计算性能奖”获得者国防科学技术大学的比赛策略与方案。

在2012年6月20日于德国汉堡闭幕的ISC12国际大学生超级计算竞赛中,国防科学技术大学代表队采用CPU-GPU异构架构计算集群方案,力挫美国科罗拉多大学、纽约州立大学石溪分校、德国卡尔斯鲁厄理工学院和清华大学参赛队,勇夺“最高计算性能奖”。国防科学技术大学也是唯一一支采用CPU-GPU异构架构搭建计算集群的参赛队,双精度计算峰值5.5T左右,计算核心数量达到3168个(含GPU计算核心)。

在上一篇的稿件里,我已介绍过ISC12国际大学生超级计算机竞赛的参赛队实力:美国科罗拉多大学连续5年参加了美国的SC国际大学生超级计算机竞赛,并曾在2009夺得过Linpack冠军;纽约州立大学石溪分校从2007年就开始参加SC大学生超级计算机竞赛,曾获得过2009年SC比赛的冠军;德国卡尔斯鲁厄理工学院(KIT)计算机系在德国排名第一,号称“德国MIT”,他们的超级计算机教学和科研能力独步欧洲;国防科学技术大学设有系统的超级计算机教学和比赛的体系、机制,拥有良好的人才梯队和比赛经验,2011年他们曾在西雅图的SC超级计算机竞赛中仅以0.5分之差屈居亚军;清华大学则是国内的顶尖学府,设有与浪潮共建的超算中心,有丰富的超级计算机教学、应用研究沉淀。

在这次竞赛中,所有参赛队都想为自己的祖国、母校赢得荣誉,尤其是德国东道主德国卡尔斯鲁厄理工学院,他们更是抱着必胜的信心,欲将ISC12国际大学生超级计算机竞赛所有奖项一览怀中。他们曾在赛前公布了他们在实验室里面能测到0.97GFlops/W性能。而在比赛当天,他们以3000W内实现13个双路CPU节点集群系统亮相时,令其他对手大吃一惊。按照每瓦0.97GFlops性能计算,德国卡尔斯鲁厄理工学院计算峰值是2.995万亿次,另外科罗拉多大学也达到了2.4万亿次,而清华大学是2.3万亿次,国防科学技术大学的CPU计算峰值为1.5万亿次,GPU4万亿次。单纯从CPU性能比,中国的清华大学、国防科学技术大学跟德国卡尔斯鲁厄理工学院有相当大的差距。媒体、超算业界人士都认为德国卡尔斯鲁厄理工学院会赢的比赛的冠军,并且开出了相关的赔率:

LINPACK最后成绩与最后赔率预测对比

那么,国防科学技术大学是怎样扭转乾坤的呢?

在2011年参加美国西雅图SC11的国际大学生超算竞赛时,国防科学技术大学就采用了CPU-GPU异构计算集群方案,但当时异构方案庞大的代码移植工作量,给他们造成了较大困扰。而在本次ISC12国际大学生超级计算机竞赛中,除了常规试题外,还设有两个神秘应用,考虑到竞赛组委会倾向于在传统CPU上组织竞赛命题,且在比赛现场做异构代码移植工作,会极大挤占运行其他应用的时间,无疑是不合算的。因此,国防科学技术大学代表队赛前就拟定此次竞赛策略是在最高计算峰值和计算通用性上取得平衡,冲击最高计算性能奖,同时在应用计算部分保持相当竞争力。

而在具体的竞赛战术设计中,国防科学技术大学参赛队同学仔细考虑和讨论,为了达成既得到最高性能,又兼顾代码运行兼容性的目的,他们决定采用继续采用CPU-GPU异构架构搭建比赛集群,冲击计算性能最高奖:在浪潮最新发布的NF5280M3节点服务器上采取CPU+GPU异构计算形式,构建异构集群,其中浪潮NF5280M3配置了两颗最新的E5-2650 CPU、8条8G DDR3内存、一块SAS硬盘(浪潮NF5280M3是基于通用目的的高性能服务器,针对高性能计算领域日益重要的异构计算,特意设计了空间和风道,可以支持两块GPU的异构计算),在此基础上,每台服务器上搭配一块双精度计算峰值在665GFlops 的NVIDIA Fermi M2090(而不是两块)。为了有效解决散热和系统功耗,他们现场又对风道做了改善,六套搭载GPU卡的浪潮NF5280M3在3000W的竞赛总功率限制下,运行HPL时系统功耗峰值控制在2950W左右;而在具体的集群系统环境中,国防科学技术大学采用RHEL 6.1、CUDA4.0和针对FERMI的HPL测试包,赛前在他们实验室机房同样配置的集群最高可以得到接近2.8T的实测峰值,但由于比赛现场的散热条件有限,选手们反复运行只能跑到2.65T左右,但这样也足以笑傲群雄,力压第二名德国卡尔斯鲁厄理工学院 2.3T的峰值,成功拿到了最高计算性能奖。

我个人认为清华大学和国防科学技术大学参赛队在国际赛场上取得好成绩与他们准备充分、团队配合、具备拼搏精神和天赋以及浪潮提供高品质的硬件竞赛平台密切相关。如国家863重点专项专家组组长钱德沛教授在首届中国大学生超级计算机竞赛开幕式上所讲:“我要感谢浪潮所起的作用。回顾几十年来,浪潮参与了国家高性能计算的工作,同时浪潮集团与科研人员密切合作提高了技术水平,掌握了高超技术实力。今天浪潮有实力来组织支持这样一个竞赛表明浪潮已经跻身于世界IT企业。”

作为国内高性能计算的领军企业,浪潮秉承应用、创新的发展理念,依托高效能服务器与存储技术国家重点实验室、Inspur-Intel中国并行计算联合实验室以及与业内顶尖的厂商、行业应用专家等合作,不仅持续推进中国超级计算机产品与技术的发展,也通过组织大学生超级计算机竞赛这样的活动,推进中国超级计算机人才和应用的发展进程。在参加本次竞赛的同学们为国家、母校赢得荣誉的同时,我也为我所在的浪潮感到骄傲。

学计算机专业异构超算,中国科学技术大学超级计算中心相关推荐

  1. 中国科学技术大学计算机专业排名,2019中国科学技术大学专业排名

    中国科学技术大学是中国科学院所属的一所的综合性全国重点大学.截止到目前为止,中国科学技术大学重点专业共有12个专业,其中分为一级学科8个专业和二级学科4个专业.为了让大家更好的了解这所大学的专业排名, ...

  2. 中国科学技术大学大学计算机学院,张俊霞 - 中国科学技术大学 - 计算机科学与技术学院...

    个人简介 张俊霞,男,1965年11月生,硕士,高级工程师.1987年本科毕业于西安交通大学自动控制专业,1987年~1994年在安徽电子计算机厂先后从事微机技术培训和医疗电子仪器开发工作,1997年 ...

  3. 中国科学技术大学计算机考研难吗,中国科学技术大学(专业学位)计算机技术考研难吗...

    考研真题资料优惠价原价选择 很多考生在准备中国科学技术大学(专业学位)计算机技术考研难吗?是考研报考的时候都会产生这样的疑问:这个专业的研究生好吗?适合我吗?对我以后的人生和职业会有帮助吗?考生在准备 ...

  4. 大专里学计算机应用会挂科吗,女生适合学计算机专业吗?别等大学挂科再后悔...

    之前呢小编和粉丝们聊到了数学不好的同学们,在选择大学专业的时候,可以考虑的一些方向,像中国语言文学类.外国语言文学类.新闻传播类这三大类啊,咱们可以重点的家考虑,那么还有呢像法学这样的专业,咱们有个家 ...

  5. 2020中科大计算机分数线,2020年中国科学技术大学强基计划入围分数线,录取分数线,中国科大强基计划笔试、面试...

    2020年是强基计划首年,国家教育部取消自主招生,转而将目光投向更具体的基础学科领域,聚集36所双一流高校开展强基计划招生,选拔优秀学生作为人才储备,并辅以细致入微的培养方案,对入选者进行深造培养,以 ...

  6. 中科大计算机本科毕业论文范文,中国科学技术大学本科生毕业论文(设计)管理条例...

    一.总则 本科毕业论文(设计)是学生整个培养方案的一个组成部分:是培养学生综合运用本学科的基本理论.专业知识和基本技能.提高分析和解决问题的能力.掌握从事科学研究工作的思想及方法的重要环节:是培养学生 ...

  7. 中国科技大学计算机考研复试内容,中国科学技术大学考研复试

    出国留学网考研网为大家提供中国科学技术大学材料科学与工程学院2018考研复试内容,更多考研资讯请关注我们网站的更新! 中国科学技术大学材料科学与工程学院2018考研复试内容 为进一步规范硕士生复试工作 ...

  8. 中国科学技术大学2021计算机考研分数线,【中国科学技术大学】2021考研复试分数线3月13日已公布!速看!...

    2021考研中国科学技术大学复试分数线已公布!相较于2020考研国家线各科分数线有哪些变化?2021考研国家线公布后各位考研考生要为后续考研复试做好准备工作."赢战"国家线,抓住复 ...

  9. 中国科技大学计算机在职研究生学费,中国科学技术大学在职研究生学费需要多少...

    中国科学技术大学在职研究生的学费并不高,在职人员并不需要过多关注学费的问题,还是能够承担的起的,下文将简单介绍学费的大致情况. 第一,中国科学技术大学在职研学费大致在几万元 学费的定价基本是依旧能够提 ...

最新文章

  1. 实现MFC中Radio Button组绑定同一变量控制
  2. position:fixed和scroll实现div浮动【示例】
  3. cas跨域单点登录原理_CAS实现SSO单点登录原理
  4. python元类的简单了解
  5. 【spring相关面试题摘录】
  6. css不常用重要属性
  7. CALL SYMPUT与CALL SYMPUTX区别
  8. 使用springboot集成jseesite
  9. linux 高级IO函数之sendfile splice tee
  10. go实现文件服务器,golang文件服务器的两种方式(可以访问任何目录)
  11. linux安装了xml怎么编译,linux下libxml库的安装及编译
  12. js实现excel块拖拉数据_Excel操作比Python更方便?常见数据操作Excel实现和Python实现的比较...
  13. Slimer软工课设日报-2016年6月30日
  14. 2020 高考大数据下,数据可视化告诉你如何填志愿、选学校?
  15. AI团队领头人携耗资数十万项目案例,价值2W+的5堂直播课,限时免费Get!
  16. 分三种情况C语言编程,吴进的256basic.h阅读笔记,请问scanline_copy子程序为什么要分三种情况考虑:(1)d...
  17. 小程序技术能提升桌面应用安全等级?
  18. DB2数据库基本操作
  19. 数据挖掘项目——金融反欺诈
  20. Scrapy框架 - Spiders

热门文章

  1. M41ST85W_3.0/3.3 V I²C组合实时时钟、NVRAM监控器和微处理器监控——科时进商城
  2. asp.net模糊查询
  3. dw如何制作图片自动切换效果_dw怎么用css做图片轮播
  4. 《结构动力分析的MATLAB实现》,结构动力分析的MATLAB实现
  5. 【Three.js入门】灯光与阴影、平行光阴影属性、聚光灯的属性和应用
  6. windows-sys5:升级win11——此版本Windws不支持该处理器、该电脑必须支持TPM2.0等问题解决
  7. 比word更适合编写方案文档的工具Latex
  8. T检验:两样本数据的差异性
  9. 怎样解决移动硬盘提示格式化的问题
  10. 羽毛球比赛中羽毛球擦网和卡网(挂网)怎么判罚?