本文重点:

传统的HPC应用的特殊性与昂贵硬件和大量基础设施投入,成为高性能计算拥抱新技术、新平台的两大障碍。

随着通用计算市场逐渐饱和,刺激各大云提供商的持续投入,终于让高性能计算上云不再只是少数传统玩家的专利。

数据量和业务类型的双爆发使传统的高性能计算集群,比如超级计算中心的模式,已经很难跟上业务增长的步伐。

云端高性能计算(Cloud HPC),顾名思义,就是在云计算平台上运行高性能计算的分析任务

这个名词,包括其近义词:高性能计算云(HPC Cloud),何时开始使用并没有一个公认的说法。时至今日,在维基百科(英文)网站上也没有这么一个词条。稍微扯得上一点关系的是高性能计算 / 超级计算机词条下的一个小节:云中的高性能计算(HPC in the Cloud)

然而从去年到今年,我们真真切切地感受到了这个词要火起来的节奏。

作为标志性的事件,我们看到了这个行业的第一份市场分析研究报告:来自Market Research Future的《CloudHPC市场研究报告——及2023年预测》。

让我们一起来回顾一下Cloud HPC的发展历程,面临的挑战以及未来发展趋势。

云端高性能计算市场(来源:Market Research Future)

传统高性能计算:专用硬件/软件库

高性能计算是计算机科学领域发展的一个特殊分支,不同于我们平常接触的通用计算。

传统上,高性能计算主要应用于大规模科学计算,例如天气预报、石油勘探、汽车碰撞模拟、药物研发等这些任务通常是通过超级计算机,或者大规模计算集群运行,通过集群内的各节点协同工作完成的。一个分析任务被分解为一系列的子任务,分布到不同的节点上运行。子任务之间经常是紧耦合的,即需要紧密合作完成分析。

因此传统的高性能计算集群通常需要很多特殊的硬件来加速节点间通:高带宽、低延时、低CPU占用率的等等。其中代表性的技术就是Infiniband和RDMA,而不是我们通常所见的以太网。

此外,为了将集群资源抽象为一个统一的资源池,从而实现高效的并行计算,大多数的高性能计算应用需要使用统一的开发库,其中最流行的解决方案就是消息传递接口(MPI)。所有的进程都必须通过开发库提供的接口进行相互通讯和数据交换。

另外,通常也需要专为高性能计算优化的存储,比如Lustre,在此就不展开了。

传统的HPC应用的并发扩展性与算法设计紧密相关,因而通常并不能线性扩展。

这些特殊性后期实际上成为了一把双刃剑,一定程度上成为高性能计算拥抱新技术、新平台的障碍。

高性能计算涉及领域(来源:ICHEC)

云计算崛起:成功?障碍?

早在十余年前,云计算刚刚起步,虚拟化大行其道的时候,就开始有热烈的讨论,是否要将虚拟化的浪潮引入高性能计算领域。当时第一个大的顾虑,就是虚拟化带来的性能损失,包括计算性能损耗和额外的网络延时等等

此外,前文提到的许多特殊硬件,也没有好的虚拟化 / 多租户方案。

最终结果:第一波冲击,生不逢时,波澜不惊。

等到以亚马逊(AWS)为代表的云计算崛起,通用云计算市场成为市场的宠儿,获得了快速发展。用户开始习惯在云计算平台上部署 / 运行各种不同类型的业务。

然而多年来通用计算业务的高速增长,一定程度上却妨碍了高性能计算在云端的布局。

为什么?

当通用计算市场需求快速增长的时候,云提供商们会满足于当前的业务,也就是所谓的“容易摘的果子”(low-hanging fruit)。像高性能计算这种需要昂贵硬件和大量基础设施投入的新型业务,自然就没有理由得到重视。

因此长期以来,云计算平台上运行的多是服务型应用;包括后来容器技术和Kubernetes的流行,也是主要服务于这一类型应用的。

计算密集型的用户们只能静待时机。

契机:通用云计算市场成熟

这两年来,随着云计算技术逐渐成熟,市场开始慢慢饱和。不管是国际还是国内市场,都已经出现了几家大厂瓜分大部分市场的情况。

通用云计算风光不再,新兴的增长点自然而然就会得到大家的青睐了;高性能计算上云终于到了瓜熟蒂落的时候。随着各大云提供商的持续投入,高性能计算不只是少数传统玩家的专利,而是作为一项新型服务(HPC-as-a-service)向普通用户开放

更多的新用户也能够利用高性能计算技术 / 平台拓展新的业务,或者重构现有的计算应用,同时享受云端的扩展性等福利。

微软Azure上HPC技术支持的发展历程(来源:Azure)

动力:数据量和业务类型的双爆发

一方面,传统的高性能计算应用仍在,然而要处理的数据量已今非昔比

随着数据采集设备的成本下降,以及存储成本的白菜价趋势,近些年来数据量的增产实际上是爆发式的。传统的高性能计算集群,比如超级计算中心的模式,已经很难跟上业务增长的步伐。

另一方面,更为重要的是,各种新型业务开始出现,大大拓展了高性能计算的业务范畴。

其中就包括大家熟悉的,正在风口上的人工智能(AI)和机器学习(ML)。还有基于人体全基因分析的精准医疗,创新药的研发模拟等等。

与之相配套的是大量新型硬件的出现,比如针对通用计算的显卡(GP-GPU),专为TensorFlow设计的TPU,以及各种FPGA专用芯片等等。仅刚刚过去的2018年,这样的新硬件就不下数十种。

这些新型的硬件,在设计之初就充分考虑到了多租户、虚拟化、容器化等新型的系统需求,对于云端高性能计算的快速增长也是功不可没的。

新型硬件:Google TPU(来源:Google)

趋势:巨大的市场潜力

尽管云端的高性能计算还存在这样那样的短板,市场的发展却是势不可挡。

大家开始在云端运行各种高性能计算任务,涉及生命科学、化工、人工智能、汽车设计、精准医疗、数字图像处理等各种科学 / 商业计算场景

高性能计算用户也开始能享受到云计算平台带来的快速部署、可扩展性、多租户、按使用量付费好处

Market Research Future(MRFR)的调查表明,目前大概有25%的企业都有运行高性能计算业务,云端高性能计算在接下来的五年内仍将保持高达21%的年均增长率。

  http://www.fastonetech.com/

END -

你也许有兴趣:

速石短评:Novartis新世代HPC系统的十大策略

闲话高性能计算

从疯涨的房租说起,聊聊资源优化配置那点事儿

一小时内完成百万计算任务?

双杀之后迎来双爆发,高性能计算HPC上云之势不可挡相关推荐

  1. 生产后市场爆发,工业上云后的智能化场景革命

    在工业领域,传统的产品交付正逐渐让位于生产能力交付.产品质检.预测性维保.能耗控制等生产后市场将变得越来越重要.生产线精细化与智能化运营需要对每一台设备了如指掌,而这一切的前提都离不开对工业数据的分析 ...

  2. 火箭双杀尼克斯 哈林组合和砍50分

    北京时间12月18日,休斯敦火箭迎来背靠背第二场比赛,最终休斯敦火箭客场以109-96狂胜纽约尼克斯队13分,本赛季火箭对尼克斯两场比赛都取得了胜利,实现了对尼克斯的双杀. 很明显,有些事情永不会改变 ...

  3. 计算机是中北大学双一流建设学科不,中北大学创建“双一流”大学迎来新消息,网友:山西大学仍需努力...

    原标题:中北大学创建"双一流"大学迎来新消息,网友:山西大学仍需努力 山西资源丰富,历史文化底蕴深厚,但优质高等教育资源却一直比较匮乏,目前省内仅有太原理工大学一所"双一 ...

  4. 科普一下,什么是戴维斯双击和戴维斯双杀?

    创业板受到多重利空压制而大跌,上证也受到拖累,只有上证50小幅翻红.创业板依然是下跌趋势,不要瞎猜底部,更不要轻易抄底,要以均线为准,反弹站上5日线才有短线机会.主板部分板块仍然是处于上升趋势,仍然有 ...

  5. 双11还是那个双11,双12却早已不是那个双12

    (图片来源于网络) 文 | 易不二 来源 | 螳螂财经(ID:TanglangFin) 1936年12月12日,张学良和杨虎城在西安发动的兵谏,致使蒋介石停止内战,一致抗日,从而,为抗日战争胜利.新中 ...

  6. 解码2017双11:全球狂欢新记录背后的阿里云存储

    摘要: 2017天猫双11再次刷新纪录,这背后是大数据的支撑和阿里云计算的能力的体现.手淘.天猫APP主站的所有图片和视频都存储在阿里云对象存储OSS之上,全球数以亿计的消费者,对这些商品的访问的流量 ...

  7. 电商“双11”or直播“双11”?

    2020双十一,电商玩法变了.双十一,直播电商已成主流. 日渐普及的直播电商,正在重构零售. 01 双十一,直播电商成主流 2020年,直播电商无疑是消费领域最火爆的话题.疫情之下,各行业争相入局,企 ...

  8. 一分钟了解阿里云产品:高性能计算HPC

    2019独角兽企业重金招聘Python工程师标准>>> 概述 阿里云发布了许许许多多的产品,今天就让我们一起来了解下高性能计算 HPC (AliCloud HPC)吧. 关于阿里云高 ...

  9. 今年双11,阿里业务100%上云

    简介: 阿里巴巴业务的研发效率提升了20%.CPU资源利用率提升30%.应用100%云原生化.在线业务容器可达百万规模,同时计算效率大幅提升,双11整体计算成本三年下降30%. 今天,阿里巴巴首席技术 ...

最新文章

  1. Linux查看可执行文件的各个段:.BSS,.TEXT,.DATA的大小
  2. python编程爱心-520用Python画一颗特别的爱心送给她
  3. python画函数曲线-使用Python画数学函数曲线
  4. Intellij Idea导出可执行的jar包
  5. 鸿蒙是单线程还是多线程,鸿蒙 RT-Thread 两者之间究竟是不是竞争关系呢
  6. 忘记手机绑定过的UC/交易猫账号怎么找回
  7. bzoj 3495: PA2010 Riddle(2-SAT)
  8. Python模拟登录的几种方法
  9. 39. 日志记录与使用情况跟踪
  10. 计算机专业英语词汇pdf,计算机专业英语词汇大全(完美打印版).pdf
  11. 第13章Stata Logistic回归分析
  12. matlab拟合sin函数原理,matlabsin函数拟合
  13. 华硕FX63VM笔记本bios如何设置U盘启动
  14. magma测试与安装,使用(含docker配置)
  15. 一键复制吱口令,支付宝红包js代码
  16. Appium爬虫小案例
  17. python语法基础语法_Python基本语法[二],python入门到精通[四]
  18. 家庭卡拉OK的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  19. linux不需要磁盘碎片整理!
  20. Basler相机和pylon viewer 的使用

热门文章

  1. 魅蓝E3发布,斥资千万购买虹软算法!
  2. System Verilog 四值逻辑
  3. 2D和3D人体姿态数据集
  4. QC新旧七图汇总连载3——检查表
  5. 谷歌浏览器实用插件-总结
  6. Java中的方法重载。
  7. 获取youku视频源地址
  8. 程序人生 - 旗舰店公然卖假货!更恶心的还在后面……
  9. Go关键字--if else
  10. JUC多线程学习笔记