在数字化浪潮中,AI 正在成为生物医药行业高质量发展的重要推动力。3月23日,百度深圳研发中心自然语言处理部技术总监、螺旋桨 PaddleHelix 生物计算平台负责人何径舟在机器之心 AI 科技年会 AI for Science 论坛上发表了《飞桨螺旋桨 PaddleHelix 赋能生物医药:AI 技术在药物研发领域的探索和应用》主题演讲,介绍了螺旋桨 PaddleHelix 在生物医药领域的布局与技术进展,以及在应用落地方面的成果。

传统药研瓶颈待解

预训练或成行业探索新方向

目前,伴随全球生物医药市场规模持续上涨,新药研发的投入产出比却持续下滑,药物研发面临的长周期、高投入、高风险等问题凸显。传统药物研发在尝试了生物实验、传统机器学习等方法后,面对大量无标注的数据,高要求的泛化能力,以及生物计算领域的特性,终于迈向拥有自监督和多任务学习融合能力,又考虑生物领域研究对象特性的预训练模型。

反观以化合物、DNA 与 RNA、蛋白质为主要研究对象的生物计算,何径舟表示,在此之前,预训练模型在 NLP、CV、跨模态等 AI 领域已相继展现出通用的 AI 能力、优秀的图像分类效果,以及强大的生成能力,构建基于预训练技术的分子表征模型、蛋白表征模型、组学表征模型,使之成为生物计算的底座,将有助于解决传统机器学习应用在生物领域的问题。

预训练模型发力

释放多维技术优势

基于预训练技术,螺旋桨 PaddleHelix 已经在化合物表征和蛋白质表征等研究方向上取得重大进展。

在化合物领域,螺旋桨 PaddleHelix 团队揭示了一种基于三维空间结构信息的化合物建模方法,即“几何构象增强 AI 算法”(Geometry Enhanced Molecular Representation Learning,GEM 模型),首次在全球范围内将化合物的几何结构信息引入自监督学习和分子表示模型,并在下游十多项的属性预测任务中取得 SOTA,成为百度在 AI 赋能药物研发领域对外公开的又一项重磅成果。

业界之前的预训练方法没有考虑化合物的三维空间结构,而空间结构对于化合物性质至关重要。凭借化合物表征模型 GEM 在基于空间结构的图神经网络和多个几何级别的自监督学习任务上的技术创新,该研究于今年2月登上了国际顶级学术期刊《Nature》子刊《Nature Machine Intelligence》。

在蛋白质领域,蛋白的建模技术能够有效表征蛋白,对预测蛋白结构和预测蛋白-蛋白相互作用(PPI)来说至关重要。螺旋桨 PaddleHelix 团队以“蛋白 PPI 表征模型 S2F”为例分享了相关进展。蛋白-蛋白相互作用问题与蛋白的结构和功能密切相关,单独使用蛋白质序列很难描述蛋白质的结构和功能。螺旋桨创新性地提出,通过构建多模态的蛋白预训练技术,应用在 PPI 任务上。该模型在跨物种蛋白 PPI、抗体-抗原亲和力预测、SARS-CoV-2 的抗体中和预测,以及突变驱动的蛋白结合亲和力变化的预测上,取得 SOTA 结果,相比于其他蛋白质表示模型有5%-10%的提升。

在本次科技年会上,螺旋桨 PaddleHelix 团队还透露,螺旋桨基于飞桨框架,联合国内多家超算中心,在国产的软硬件上,完整适配并跑通了 AlphaFold2 的训练和推理代码,实现千万级别的蛋白质 initial training 训练时间从 AlphaFold2 的7天压缩到2.6天。相关代码也将于3月底在螺旋桨PaddleHelix平台开源,为国内相关科研工作者提供更多的选择。

AI+生物计算成果涌动

螺旋桨全面赋能生物医药产业

除了技术上的不断创新,螺旋桨 PaddleHelix 在药物研发等应用场景领域取得了多项落地进展,全面赋能生物医药产业。

在药物研发领域,基于螺旋桨打造的“ADMET 成药性预测模型”已经在 biotech 公司实际业务管线中完成商业化落地;药物虚拟筛选 pipeline 在 first in class 的合作管线中应用,并成功筛选到活性在微摩尔级别的苗头化合物。相关的算法模型也被收录在 KDD 2021 和 BIBM 2021 等会议上。

在蛋白领域,螺旋桨 PaddleHelix 团队运用多模态的蛋白 PPI 表征模型 S2F,联合合作伙伴,共同推进在新冠变异病毒奥密克戎上的研究。通过百度的算法,预测新冠变异病毒奥密克戎的线性抗原表位,帮助合作伙伴研发变异毒株奥密克戎的疫苗,还能快速应对潜在的新型变异,后续也有望携手合作伙伴,在罕见病、癌症、免疫与代谢等疾病领域开创创新药物研发方案。

据悉,螺旋桨 PaddleHelix 是基于百度飞桨深度学习框架打造,通过螺旋桨生物计算开源工具集,搭建了生物计算和服务平台,为药物研发、疫苗设计和精准医疗三大场景提供强有力的支撑,同时也为生物信息学、计算机交叉学科背景的学习者、研究者和合作伙伴提供了 AI 算法模型,赋能生物医药产业。

百度在生物医药方面形成的核心能力已在 GitHub 开源,提供包括虚拟筛选、ADMET、DTI、PPI、蛋白结构预测等9大能力模块,为生物医药行业内的研究人员提供专业服务。

未来,螺旋桨 PaddleHelix 生物计算平台,将继续秉持开源开放的态度,期望与更多学术界和生物医药产业伙伴合作,加速 AI 与生物计算的融合创新,共同推动生物医药行业高质量发展。

百度飞桨螺旋桨赋能生物医药,推动AI技术在药物研发领域的探索应用相关推荐

  1. 青岛智能物联网产才融合中心成立,山东大学携手百度飞桨海尔海纳云等共育AI人才

    以人才引领产业发展,以技术驱动产业升级,成为激活创新动能的重要抓手.1月9日,由海尔海纳云.百度飞桨.中科曙光.山东大学联合中国海洋大学.中国石油大学等27所高校共同发起的公益性创新平台--青岛智能物 ...

  2. 百度飞桨亮相2019 AIIA,四大领先技术剑指落地引开发者点赞

    深度学习技术能让文化底蕴浓厚的老茶馆换上科技的"新装",也能让原本1周的工作量缩短为1个小时,且效果更佳--这些看似稀奇的事已经随着深度学习技术的发展成熟逐渐普及. 11月1-2日 ...

  3. 青岛智能物联网产才融合中心成立,山东大学携手百度飞桨海尔海纳云等共育AI人才...

    以人才引领产业发展,以技术驱动产业升级,成为激活创新动能的重要抓手.1月9日,由海尔海纳云.百度飞桨.中科曙光.山东大学联合中国海洋大学.中国石油大学等27所高校共同发起的公益性创新平台--青岛智能物 ...

  4. 百度飞桨和Imagination宣布在全球AI生态系统方面开展合作

    2021年2月1日 - Imagination Technologies 宣布:​ 在 Imagination 和百度飞桨(PaddlePaddle)的合作中,其 IMGDNN API 已集成到 Pa ...

  5. 百度飞桨:给出关键词,AI自动生成元宵节祝福~

    元宵节,祝福语 一. 前言 二. 模型介绍 三. 数据准备 四. 执行代码 4.1 安装依赖 4.2 开始训练 4.3安装模型 五. 预测输出 六. 元宵节快乐 七. 总结 百度飞桨系列文章: 百度飞 ...

  6. 英特尔计算引擎、阿里大规模图形神经网络平台、百度飞桨平台、索尼音乐生成AI套件......重量级深度学习工业产品亮相NeurIPS 2019行业展览会!

    NeurIPS 2019的正式会议将于加拿大/温哥华时间的12月9日早上8点开始.会议前一天将会举办为期一整天的行业展览会(可能是赞助商太多了--) 当别人为明天的正式会议捉急准备时,小助手已经在展览 ...

  7. 百度大脑发布企业服务解决方案,将 AI 技术落实到细分领域

    人工智能竞争之势愈演愈烈,AI与场景应用的深度结合将成为各家企业的取胜关键.10月18日,百度大脑行业创新论坛在北京正式拉开帷幕,届时将走进全国6个城市举办7场以企业服务.信息服务和零售等为主题的专题 ...

  8. 百度飞桨,让AI落地有解!

    Datawhale干货 大会:WAVE SUMMIT 2022 今天,我们面对的是一个充满变动的世界,科技正是一股改变的力量.人工智能拓展了人类看待问题.解决问题的角度,更让很多看似"无解& ...

  9. 长三角生物医药产业加速跑,飞桨螺旋桨为创新药企、医药技术伙伴装上AI大模型引擎...

    生物医药是国家"十四五"规划中明确的战略性新兴产业之一.长三角地区是中国生物医药产业的排头兵,也是<"十四五"生物经济发展规划>的"生物经 ...

  10. 百度飞桨和文心大模型助力,中康科技重构医疗科研大数据治理

    安永<生命科学4.0报告>曾用FV=ID描述生命科学的未来价值,即未来价值等于"创新"的"数据"次方.左右"价值"指数增长的&q ...

最新文章

  1. CVPR2020:训练多视图三维点云配准
  2. 深度学习100例-卷积神经网络(VGG-19)识别灵笼中的人物 | 第7天
  3. Python3.5 Day1作业:实现用户密码登录,输错三次锁定。
  4. 7-28 超市贴花 (5 分)
  5. margin塌陷问题
  6. Python函数式编程中map()、reduce()和filter()函数的用法
  7. Android开发之自定义view进行旋转动画
  8. 怎么在win7链接无线网络连接服务器,Win7系统网络连接一直显示正在获取网络地址但是连不上网解决方法...
  9. 小伙C++代码实现短信表白,软萌甜炸,送给你最喜欢的人!你值得拥有
  10. iOS 推送 获取手机设备的 deviceToken
  11. Linux各类压宿包的压缩和解压方法
  12. [转]如何:定义和处理 SOAP 标头
  13. java实现中文语音朗读
  14. python VTK画3D方框
  15. YOLOv7全文翻译
  16. sql语句查询时,where条件同时使用and和or
  17. 构建高并发高可用的电商平台架构实践(一)
  18. 计算机网络维护日记,计算机网络维护实习日记.doc
  19. Unity的Dots技术入门
  20. 李飞飞:我怎样走上AI研究之路

热门文章

  1. etl调度工具 Taskctl 变量概述
  2. 向日葵如何远程桌面Linux,最快的远程桌面向日葵软件
  3. 学习在layui中input、select、date日历的onchange事件无效解决方法
  4. PS使用技巧(五) 形状工具 U
  5. python数据标注工具_数据标注|分享9个数据标注工具
  6. 电子罗盘简单介绍和应用
  7. 【论坛项目】简单的论坛小项目-麻雀虽小,五脏俱全
  8. CorelDRAWX4的VBA插件开发(十六)颜色配置文件设置与检测
  9. java 批量打印pdf文件_java 打印tiff及批量打印图片技术文章.doc
  10. JAVA共享图片管理系统毕业设计 开题报告.