在上海举办世界人工智能大会前夕,腾讯公布了进入药物研发领域的两项最新进展。在应用侧,腾讯发布首个AI驱动的药物发现平台「云深智药(iDrug)」,整合腾讯 AI Lab和腾讯云在前沿算法、优化数据库以及计算资源上的优势,提供覆盖临床前新药发现流程的五大模块,包括蛋白质结构预测、虚拟筛选、分子设计/优化、ADMET性质预测(即将开源)及合成路线规划。目前平台上已经运行十个左右研发项目,包括对抗新冠病毒药物的虚拟筛选和性质预测(正在对筛选结果进行实验验证)。

官网体验地址:

https://drug.ai.tencent.com/

在研究侧,腾讯 AI Lab 在蛋白质结构预测的世界最权威测试平台CAMEO上,半年内五次夺得月度冠军,领先众多国际知名研究团队。蛋白质结构预测是药物设计的基础,对了解生物体内分子间的相互作用也至关重要,腾讯这款自研算法在困难案例(Hard)上提高非常显著(比权威方法提高10%以上),其创新思路也已被「云深智药」平台采用,将在新靶点发现、疾病机理研究上发挥更大应用价值。

平台名称「云深智药」源自唐诗《寻隐者不遇》的「只在此山中,云深不知处」,新药的发现过程正是如此。一款新药的诞生关乎人类健康福祉,但传统药物研发耗时耗力,每年上市的新药仅数十种。随着新冠疫情的全球蔓延,快速低成本药物研发成为行业共同挑战,而大数据挖掘和机器学习等技术驱动的药物发现方法的潜力与价值越加凸显。

腾讯AI Lab表示,「药物研发的数字化、智能化变革已经到来。人工智能与大数据在药物设计领域的应用被列为十三五重大新药专项的关键创新技术之一,也是国家新基建背景下的技术攻坚方向。秉承科技向善的理念,云深智药将充分发挥先进技术优势,为医药产业发展创新提供平台与机遇。」

平台的虚拟筛选和ADMET性质预测两个工具模块已开放免费使用,蛋白质结构预测、分子设计/优化、合成路线规划等模块将陆续在年内上线。值得关注的是,该平台的自研算法已在国际比赛中获得证明,并将对一些基础模块开源。

自研冠军级创新算法:作为全球唯一的蛋白质结构预测自动评估平台,CAMEO自2012年上线以来收集了全球最顶级、应用最广的自动化蛋白结构预测服务器(server),成为最权威的蛋白质结构预测服务器的评判标准。目前竞赛团队包括了来自华盛顿大学、有「蛋白设计天才」之称的David Baker教授团队,来自密歇根大学,曾夺得蛋白结构预测CASP六连冠的Yang Zhang(张阳)教授团队等。

「云深智药」平台采用了腾讯AI Lab自研的预测蛋白质结构的新思路,该算法在2020年起加入CAMEO,与35支顶级学界与企业队测试竞赛,腾讯比分大幅超越,保持了月度及周度冠军,证明了底层算法的技术价值。前文提到,腾讯AI Lab提出的新方法在困难案例(hard)上的提高非常显著,其比业内公认的权威方法Robetta提高了10%。在药物虚拟筛选和ADMET性质预测上,AI Lab也通过自研算法,在多个公开数据集上取得了较高精确度、突破了业界标准。

纵轴 lDDT 为蛋白结构预测质量打分,越高表示预测的蛋白模型与真实蛋白结构越相似

基础模块开源:目前ADMET预测模块即将开源大规模自监督分子图预训练GX模型,分子生成模型预计也将在下半年开源。GX模型是业界开源的首个基于深度图神经网络大规模的分子图预训练模型,模型基于大量无标签的小分子数据,通过构造原子/化学键级别的分子自监督任务,学习化学性质相关的底层信息,并利用消息传递模型提升了模型泛化性。在11个分子属性预测数据集上,GX模型与主流算法评测后,与SOTA(已知最优)算法相比效果微调结果平均提升6%。

平台功能覆盖新药发现全流程

临床前新药发现流程要经历从靶点的发现和验证,苗头化合物的发现,先导化合物的发现和优化直至临床候选化合物的确认及开发。「云深智药」平台全面覆盖了临床前新药发现的全流程,让研发人员更便捷开展研究。

云深智药平台功能模块覆盖从「靶点识别和确定」到「候选化合物确认及开发」等整个流程

新药发现是一个复杂的系统工程,第一步是靶点识别和确认,即找到药物在体内的作用位点;而确定靶点蛋白质的结构是其中的关键工作,被视为药物研发的重要基石。比如一个蛋白参与了某个疾病并成为关键通路上的重要一环,那么当研究人员了解该蛋白的结构后,就可以有针对性地设计药物分子来调节蛋白的功能。实验测定蛋白质结构往往难度大、周期长、费用高;通过深度学习模型预测出蛋白质结构以及功能后,计算机便可以更快的从数亿的海量小分子中,快速而有针对性地找到潜在的苗头化合物。

「云深智药」平台采用的蛋白质结构预测方法在准确度上达到国际领先水平,得益于两项关键技术上取得突破。一是基于自监督学习的蛋白质折叠方法,不依赖同源序列,而是直接从序列数据库中通过自监督学习,学得共进化的模式,从而能够从无到有地产生出含有共进化信息的伪同源序列,并最终让这些蛋白能够有效折叠;二是通过一种基于深度学习的可迭代方法,有效整合模板建模与自由建模,首次提出了动态的、可迭代的氨基酸对特异性的约束条件,显著提高了建模的精度,从而更好的折叠蛋白。

新药发现的第二步是针对靶点筛选苗头化合物。与传统的实验筛选相比,计算方法进行的虚拟筛选无需消耗化合物样品,能极大节省人力物力。基于配体的药物设计方法(ligand-based drug design,LBDD)是虚拟筛选的常见方法之一,是指从已知的有活性的配体小分子结构出发,学习和建立分子结构与活性之间关系的模型,用来预测新化合物的活性。由于很多靶点的已测得的化合物活性数据非常有限,严重制约了预测模型的准确性。AI方法有望解决这一问题:例如「云深智药」平台的虚拟筛选模块首次将元学习和深度神经网络算法用于LBDD任务,通过AI「迁移」从其他靶点上面学习到的知识(如分子局部结构对靶点结合强度的影响),应用在目标靶点上来提高模型预测精度。目前该算法在数千个实验数据集上预测精度(预测活性与实验测量活性的相关性)的中位数从目前最高记录0.36提升到0.42,且筛选可用模型的百分比从56%提升到60%,突破业界标准。

进入药物研发后期,预测分子的ADMET性质尤为重要(包括药物的吸收、分配、代谢、排泄和毒性)。据统计,因ADMET性质问题引起的药物后期失败的比例高达60%。因此,及早发现并排除成药性欠佳的分子能够大幅降低后期药物研发失败的风险。基于AI的ADMET性质预测能够让药物化学家快速地进行分子结构改造,优化分子理化性质,缩短药物研发的周期,降低实验测试成本。「云深智药」平台的药物小分子ADMET属性预测模块已在多个数据集上比学术界现有最好模型提高3%~11%,在合作伙伴的反馈中,平台的自研算法精度超过现有商业软件6%~37%不等。同时,平台采用了注意力等机制可视化分子中的子结构对结果的影响,提供模型的可解释性。此外,平台还可提供本地版本等灵活的部署形式,保障用户的数据安全。

平台提供数据库-算法-算力一体化服务

AI赋能药物研发,算法、算力、数据三要素缺一不可、且相辅相成。先进算法对已有大数据深度挖掘并分析数据间的隐含关系。这个过程不仅直接助力新药发现,还整合了大量已有数据库,同时促进新数据的产生和积累,转而更好的优化算法;优化的算法反过来也能降低模型对数据量的依赖,提高模型的范化性;而腾讯强大的算力支持则加快了数据库存储查找、算法迭代速度,并大大缩短使用模型的运算时间。

云深智药平台除了在算法领域不断创新,还提供算力和数据库的一体化服务支撑。

数据方面,分子大数据是药物研发中的基础设施。现有的药物分子公开数据集,以PubChem和ChEMBL等为代表,其来源多样。但也由于数据来源于不同机构的不同实验环境,存在数据难以对齐,字段缺失较多,总体质量不佳的问题,从而难以直接用于开发预测模型。云深智药平台使用的分子大数据,基于现有公开数据集,进行了多个环节的精细清洗整理工作,得到可以用于直接构建深度学习模型的药物分子大数据集,并且已在多个药物研发的项目中得到应用验证,清洗过程对多个项目的结果均有很大的提升作用。清洗过后的、打通多个数据库的大数据集已在陆续上线中。

算力方面,腾讯云为云深智药平台提供数据库服务,药企、科研机构登录平台即可开展研究,不需要再自行部署计算资源,从而能快速地将AI能力引入现有的研发流程中。

云深智药是腾讯以AI技术赋能药物发现的首个产品,平台上的各个功能模块和分子数据库将持续进行迭代,更多的药物发现功能模块和分析功能也将陆续上线。药企、科研机构等不仅能够免费试用平台搭载的核心功能,也可以和腾讯共同开发定制化的AI工具。目前腾讯已经和多家药企达成合作、将AI模型应用到实际药物研发项目中。未来,腾讯AI Lab将在国家新基建的背景下,继续推动人工智能、大数据等技术与药物研发需求的深度结合,以先进的技术能力赋能产业、推动我国药物研发行业的高速发展。

AI助力新药研发 腾讯发布「云深智药」平台相关推荐

  1. 腾讯发布「云深智药」平台,新基建助力药物研发全流程

    感谢阅读腾讯AI Lab微信号第99篇文章.本文将介绍腾讯首个AI驱动的药物发现平台「云深智药(iDrug)」. 在上海举办世界人工智能大会前夕,腾讯公布了进入药物研发领域的两项最新进展.在应用侧,腾 ...

  2. AI 领域新突破,腾讯发布首个AI药物研发平台「云深智药」

    7月9日,2020世界人工智能大会云端峰会开幕.会上,腾讯首席运营官任宇昕公布了用AI助力药物研发领域的最新进展--由腾讯自主研发的首个AI驱动的药物发现平台"云深智药(iDrug)&quo ...

  3. 腾讯AI Lab「云深」与成都先导合作「AI+药物」,发布骨架跃迁新算法

    感谢阅读腾讯AI Lab微信号第131篇文章.本文将介绍腾讯AI Lab「云深」联合成都先导发布骨架跃迁新算法,实验合成7个有效化合物. 腾讯AI Lab「云深」平台在药物发现 AI 算法研究领域取得 ...

  4. 百丽时尚×优维科技×道客战略启动「云原生一体化项目」

    3月7日,由百丽时尚集团(以下简称:百丽时尚)联合优维科技.道客共同举办的「云原生一体化项目启动会」在深圳百丽国际大厦圆满落幕,项目合作三方齐聚一堂,就云原生一体化建设战略方案达成合作共识,并进一步将 ...

  5. 论坛报名 | AI 时代,新药研发真能告别「十年磨一剑」吗?

    2021年6月1日-3日,第三届北京智源大会将隆重举办.现正式开放大会线上和线下报名渠道,线下地点为「中关村展示中心会议中心」. 2021年北京智源大会召开在即,6月1日至6月3日,持续三天,13场主 ...

  6. 【行业进展】AI:新药研发的新纪元

    杨皓博 大学生,计算机视觉方向 作者 | 杨皓博(微信号Midlurker2017) 编辑 | 杨皓博 01 这个世界没有药神,但是有AI 口碑俱佳<我不是药神>前段时间火热上映,很多人怀 ...

  7. 用AI变革新药研发,终极目标是延缓衰老,这家创业公司迎来“里程碑”

    编者按:新药研发的过程是一个耗资大.周期长以及风险高的行业,传统的药物研发据统计,平均研究每一个新药从靶点发现到药物上市需要大约10年的时间和需要大约20亿美元的研究经费. 如今,人工智能正在改变这一 ...

  8. 华为这台「技术暴力输出机」,亮出「云原生2.0」,研发效率飙升10倍!

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 云原生 (CloudNative),这个概念最近着实有点火,而且火得一塌糊涂. 简单来说,它就是一种构建和运行「应用程序」的方法. 从名字上 ...

  9. 无人配送“战斗员”新星,PIX助力创新企业逆讯发布智能物流机器人

    PIX 作为自动驾驶的产业中台,将自动驾驶软件.低成本传感器组合以及模块化的底盘硬件平台高度融合,配合柔性的数字化生产体系,大大降低了各行业应用方开发自动驾驶商业应用的成本和门槛,赋能各行业以自主移动 ...

最新文章

  1. 第三章--堆栈段的工作方式
  2. 防火墙(15)——SNAT和DNAT,SNAT实践
  3. redhat 6.5 vnc 配置
  4. C/C++与lua实现互调
  5. 黑马程序员___Java基础[09-IO]
  6. 【优化调度】基于matlab遗传算法求解码头泊位分配调度优化问题【含Matlab源码 247期】
  7. DIV CSS设计时IE6、IE7、FF 与兼容性有关的特性
  8. android查看native日志,Android 日志管理框架 NativeLogger
  9. 数据可视化大屏设计经验分享
  10. 【汉字识别】基于matlab GUI汉字精准识别【含Matlab源码 2197期】
  11. 交换基础之生成树协议
  12. 世界上第一天微型计算机,day 1:计算机发展史和组成部分
  13. 台式电脑怎么添加计算机硬盘,台式机怎么加硬盘 台式机加硬盘教程介绍【图文详解】...
  14. lect01_codes02_numpy
  15. 在Ubuntu中连接Vultr虚拟主机远程桌面
  16. Python | 用Python制作送给女票的生日礼物
  17. 三款大四学生必备PDF阅读器,国产也可以很牛x
  18. fdtd中时间监视器怎么放_lumerical FDTD的脚本
  19. CSS—新增标签标签
  20. 【人力资源管理】第1集 免费开源ERP: Odoo 16 Employees员工管理 构建一体化企业人力资源管理

热门文章

  1. OpenRTSP的使用
  2. 杭电2502--月之数
  3. form表单 无法提交js动态添加的表单元素问题。。
  4. [转载] Knowledge Management and Enginnering——02 知识表示方法
  5. 使用IPSec加强系统安全性
  6. ZOJ - 4117 BaoBao Loves Reading(树状数组求区间内不同数的个数+思维)
  7. Cannot add or update a child row: a foreign key constraint fails (`university`.`instructor`, CONSTRA
  8. 三年级人教版下学期计算机教案,人教版三年级下册信息技术教案
  9. java数组缓冲_java – 何时使用数组,缓冲区或直接缓冲区
  10. 椭圆中心到椭圆切线的距离