阿里云超算异构Spot集群,助力深势科技30%成本驱动MDaaS海量算力
本文主要介绍药物研发算法科技公司深势科技是如何实现低成本在阿里云上构建分子模拟MDaaS (Molecular Dynamics as a Service)超算集群。
客户简介
公司名称:深势科技
公司网址:http://dptech.deepmd.net/
公司介绍:
深势科技是一家成立于2018年的药物研发算法科技公司,致力于运用新一代分子模拟MDaaS (Molecular Dynamics as a Service)技术解决药物研发难题,实现药物分子的理性发现和设计。
企业的主要产品Hermite 药物研发套件,旨在帮助用户在第一性原理精度力场基础上,实现高通量药物筛选与优化;DP-Cloudserver软件,旨在帮助用户更便捷创建基于深度学习的原子间势能和力场模型和运行分子动力学模型,有效解决分子模拟中的准确性和效率性难以兼顾的问题。
公司由中科院院士领衔,核心团队来自北京大学、普林斯顿大学、上海药物研究所等高校和科研机构,在机器学习、第一性原理建模、RiD高效采样、生成算法、力场开发等方面有着深厚的技术积累,在小分子药物设计和大分子药物设计领域有着丰富的项目经验。
公司已在力场开发、小分子药物筛选与优化、药物ADMET性质预测、结合自由能微扰、多肽药物设计等领域提出更加高效和准确的解决方案,并与诸多来自学界和工业界的客户开展合作。目前已经获得来自知名投资机构的近2000万元天使投资。
业务痛点
深势科技的业务量波动较大,希望可以提供基于作业负载的弹性伸缩能力,最大化利用计算资源;
深势科技可以有效调度集群的计算资源,希望提供跨可用区的多规格实例弹性扩容,并且支持不同实例规格使用不同的镜像;
集群的作业量很大,所以深势科技希望可以提供作业粒度的费用账单便于计费;
深势科技作为一家初创企业,追求高性价比,以较低成本完成有效计算。
为什么选择阿里云?
主要是领先的产品与灵活的售卖模式。
阿里云是国内少有提供云上弹性高性能计算平台(EHPC)的云厂商,阿里云EHPC集群的自动伸缩功能,超越传统超算的“静态”资源分配,用户可根据负载实现按需扩容缩容。通过用户自定义设置,有效提升作业的吞吐量,加快作业处理速度,极大提升集群的利用率。
植根于阿里云自动运维与可视化管控技术,E-HPC提供集群管理、作业管理、用户管理和可视化等功能,帮助用户轻松使用云上HPC集群。阿里云后台实现对集群的主动运维、热升级与迁移,让HPC客户专注于应用与科研本身,无需费时费力于集群管理与运维,更加便捷地使用超算带来的便利。
同时基于费用中心的账单,EHPC提供开源计费工具,支持作业粒度的费用统计,高效解决计费需求。同时阿里云的抢占式实例提供了低成本的算力资源,价格最低达到按量付费的一折。
解决方案
方案细节:
深势科技通过阿里云弹性高性能计算的平台,调度下层多种算力资源。在选择算力资源时,深势科技多选用了具有低成本优势的抢占式实例,同时通过阿里云弹性供应解决方案,深势科技可以一次性获取所需的算力资源,无需关注底层实例。
由于客户需求多跟着项目周期走,深势科技的业务有不稳定的周期性,阿里云弹性高性能计算平台(EHPC)的自动伸缩功能,利用云上的弹性,根据作业负载自动管理计算资源,深势科技不需要自行管理资源规模,有助于深势科技降低运维成本。
深势科技需要计算每个用户、作业所用资源费用,帮助统计成本;阿里云EHPC的作业详情导出功能,可以查看每个作业的资源使用量。同时开发费用统计工具,结合费用中心账单可以统计每个作业的计算费用。
阿里云弹性供应组是一个使用抢占式实例和按量付费实例快速部署实例集群的方案,支持一键部署跨计费方式、跨可用区、跨实例规格族的实例集群,可以稳定提供计算力,在享受缓解抢占式实例的回收机制带来的不稳定因素,免去重复手动创建实例的繁琐操作。
因此,使用弹性供应的成本最优策略来调度抢占式实例资源,指定多个可用区和实例规格,确保以最优价格完成spot+按量计算资源的交付。按秒计费,价格最低至1折。
客户效益
1、满足了客户低成本构建高可用算力集群的需求:30%成本实现海量算力交付:深势科技利用弹性供应的成本优化策略,结合spot实例的价格巡检,以30%的成本完成日均3w+ vCPU资源的交付。
2、EHPC自动运维的易用特性,降低了深势科技的运维成本,提升了集群管理效率。
客户证言
分子模拟为我们提供了认识世界的重要工具,而具体实现这一过程一方面需要优质的算法,另一方面需要海量的计算资源。深势科技采用的“AI+物理建模+HPC”的研发范式,在算法层面取得了重大突破;而在资源层面,我们要感谢阿里云的弹性高性能计算服务在较低成本的基础上提供了海量的计算资源。接下来,深势科技会与阿里云进一步紧密合作,将“AI+物理建模+HPC+云计算”的MDaaS模式推及更多有需求的朋友们。——深势科技CEO孙伟杰
选用产品
弹性高性能计算E-HPC
弹性高性能计算(E-HPC)基于阿里云基础设施,为用户提供一站式公共云HPC/AI平台服务,面向科研,生产,教育和行业大计算,提供快捷,弹性,安全和与阿里云产品互通的云超算平台。
更多关于弹性高性能计算E-HPC的介绍,请参见弹性高性能计算E-HPC产品详情页。
云服务器ECS
云服务器(Elastic Compute Service,简称ECS)是阿里云提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别云计算服务。云服务器ECS免去了您采购IT硬件的前期准备,让您像使用水、电、天然气等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。阿里云ECS持续提供创新型服务器,解决多种业务需求,助力您的业务发展。
更多关于云服务器ECS的介绍,参见云服务器ECS产品详情页。
抢占式实例
抢占式实例是云服务器ECS一种特殊的实例,相对于按量付费实例价格有一定的折扣,其价格以小时为周期根据供需情况不同而变化,最低可至按量付费的一折,旨在为用户降低部分场景下使用ECS实例的成本。
更多关于抢占式实例的介绍,参见抢占式实例文档页。
GPU 云服务器
提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚洲第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。
原文链接
本文为阿里云原创内容,未经允许不得转载。
阿里云超算异构Spot集群,助力深势科技30%成本驱动MDaaS海量算力相关推荐
- Docker——阿里云搭建Docker Swarm集群
阿里云搭建Docker Swarm集群 Docker Swarm概念 环境部署 Swarm集群搭建 安装Docker 配置阿里云镜像加速 搭建集群 Raft一致性算法 Swarm集群弹性创建服务(扩缩 ...
- 基于阿里云服务器搭建hadoop集群:HDFS的namenode WEB访问9870端口打不开解决方法
基于阿里云服务器搭建hadoop集群:HDFS的namenode WEB访问9870端口打不开解决方法 以下是基于我所面临问题的解决办法. 1.在本地的c:windows/system32/dirve ...
- 阿里云ESC搭建hadoop集群
阿里云ESC搭建hadoop集群 前置 购买至少三台服务器,为了节约成本借了两个账号买了三台同一区域的服务器,安装的是 centos7:因此设计到不同账号相同地域之间通讯问题,阿里给了解决方案,详情参 ...
- 通过阿里云ecs部署k8s集群
通过阿里云ecs部署k8s集群 1. 搭建环境 2. 安装步骤 禁用Selinux Restart Docker 此处仅有两台服务器,一台master节点,一台node节点,后期可按照步骤继续增加no ...
- 阿里云上万个 Kubernetes 集群大规模管理实践
点击下载<不一样的 双11 技术:阿里巴巴经济体云原生实践> 本文节选自<不一样的 双11 技术:阿里巴巴经济体云原生实践>一书,点击上方图片即可下载! 作者 | 汤志敏,阿里 ...
- 使用三台阿里云服务器搭建Hadoop集群(云计算实验踩坑集锦)
使用阿里云服务器搭建这个hadoop集群,踩得坑人已经傻了,浪费了我快一周的时间. 1.准备环节 准备三台阿里云服务器 Namenode 121.196.224.191 Datanode1 121.1 ...
- 从零搭建阿里云托管版k8s集群-容器日志采集(八)
相信很多人都知道可以自己搭建elk来方便的收集日志,查询日志.虽然搭建elk并不是十分复杂,可对于一般的开发人员来说,尤其是对linux操作不是很熟练的人,是一项相当有难度的工程.所幸现在阿里云已经为 ...
- 看完阿里云的haddop云梯集群设计思路有感
上次去hadoop大会,听了互联网的专场,对于阿里的云梯这个主题颇有些印象,但是由于对hadoop纯属概念党,所以听的也不是太懂,今天在网上查了下这个云梯,其实网关于这个上面的还是挺多的,所以特别看了 ...
- 独家揭秘阿里云SQL Server AlwaysOn集群版重大突破
缘起 早在2015年的时候,随着阿里云业务突飞猛进的发展,SQLServer业务也积累了大批忠实客户,其中一些体量较大的客户在类似大促的业务高峰时RDS的单机规格(规格是按照 内存CPUIOPS 一定 ...
最新文章
- 《关系营销2.0——社交网络时代的营销之道》一T表示Technology(技术)
- ionic2.0禁止横屏模式
- 20个Nginx Web服务器最佳安全实践
- get方式乱码及MAC异常
- 【图论】【Kosaraju】刻录光盘(ssl 2344)
- Docker+Jenkins+Git+GitLab实现DevOps
- [原创]Enterprise Architecture V7.5 C++代码生成时,头文件中函数声明没有注释,CPP中函数定义却有注释。...
- 抽象工厂模式 -- 大话设计模式
- php商城关键字拆词搜索,做搜索查询的时候 怎么拆分词?
- mysql exporter怎么配置_mysqld_exporter的源码分析和定制化(单个mysqld_exporter监控多个数据库实例)...
- mini139聊天软件
- 计算机思维导图药剂学,思维导图在药剂学教学中的应用
- CI框架实现框架前后端分离的方法详解:把前端代码统一管理
- 将多个excel文件合并为:一个excel文件的多个sheet页【方法技巧】
- java 汉字转拼音_java汉字转拼音
- OTA频发的“大数据杀熟”,想要治你不容易?
- FPGA抗辐射加固方法
- 固定资产拆分比例怎么计算_资产拆分
- 安装Python 后安装Python-dev
- python读取xlsx文件pandas_pandas dataframe 读取 xlsx 文件
热门文章
- java 俄文,俄文字体在word里面是什么
- java音频采样_音频重采样的坑
- 如何检查私钥和公钥是否配对_如何检查家具是否有臭虫
- Java中AJAX工作原理是什么
- 快速了解Java集合框架
- 【学习笔记】第三章——内存 IV(虚拟内存、请求分页、页面置换、缺页中断、抖动现象)
- ssm java上传图片预览_ssm文件上传_上传图片
- python二进制文件 删除尾部数据_在Python中读取和切片二进制数据文件的最快方法...
- C++ STL 容器 string
- cwinthread*线程指针怎么销毁结束_最新版Web服务器项目详解 01 线程同步机制封装类...