雷刚 发自 凹非寺
量子位 报道 | 公众号 QbitAI

AlphaFold2的纪录,刚刚被刷新了。

最新消息,全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)上,DeepMind旗下AlphaFold2的纪录被刷新。

HeliXonAI,一个此前名不见经传的“新面孔”,加冕第一。

同时,在全球结构预测领域主要评价指标lDDT(Local Distance Different Test)中,HeliXonAI跑分也高达83.5分,连续四周排名第一,远超第二名的70.2分。

HeliXonAI由此一鸣惊人,成为圈内热议焦点。

但随着幕后团队浮出水面,如此成绩又被认为情理之中。

因为打造团队华深智药,正是生物计算领域大牛彭健的创业公司,也是张亚勤旗下清华AIR智能产业研究院首个公开的孵化项目。

超越AlphaFold2的HeliXonAI

CAMEO(Continous Automated Model EvaluatiOn),全球持续蛋白质结构预测竞赛,由瑞士生物信息研究所和巴塞尔大学联合举办,与CASP被认为是结构预测领域最重要的两项比赛。

但不同于CASP的是,CAMEO的参赛者需要每周预测20个由世界范围内的结构生物学家最新破解出结构的蛋白质的结构,比赛的得分与排名也会每周实时更新。

该竞赛吸引了全球生物计算领域的最顶尖选手。

诸如华盛顿大学蛋白质设计研究所的David Baker教授研发的RoseTTAFold,百度开发的PaFold,和腾讯研发的tFold等模型,都在其中竞逐。

而华深智药的结构预测平台HeliXonAI,已经连续四周在主要评价指标lDDT(Local Distance Different Test)上达到83.5分,持续排名世界第一。

在CAMEO的结果中,越靠右表示预测的结构越多,越靠上表示预测的结构越准……

而现在,牢牢地占据最右上角的就是HeliXonAI。

更令人惊喜的是,在上一周CAMEO发布的17个目标蛋白质上,HeliXonAI的平均lDDT预测精确度,达到了84.0——意味着对AlphaFold2的超越。

之前DeepMind团队公开的AlphaFold2模型预测精确度,评分在81.9

并且在另一评价指标TM-score上,也有一致的结果。

HeliXonAI以91.6的评分,同样超越了AlphaFold2的85.6。

相比RoseTTAFold和PaFold的76分,更是数量级上的超越。

此外,在最新一周的标注为“困难” (hard) 的7个蛋白结构中,HeliXonAI更是进一步拉开差距,在TM-score上比第二名Alphafold2高出6分之多。

总之,不同层面的数据结果都在说明,全球蛋白质结构预测的王座,易主了。

HeliXonAI如何炼成?

众所周知,蛋白质在理解生命科学与药物开发中的地位举足轻重。为了执行特定功能,蛋白质必须折叠成对应的结构。

然而,理解蛋白质的三维空间结构一直是生物学中的重大挑战,已经困扰生物学家 50 多年…

直到 2020 年由DeepMind 团队开发的 AlphaFold2模型,在第十四届国际蛋白质结构预测竞赛(CASP14)上,几乎达到冷冻电子显微镜等实验技术的准确度。

一石激起千层浪,引领计算生物领域的标志性变革。

但AlphaFold2实际也并非完美,例如在同源信号较弱的情况下预测的误差较大,对于抗体可变区域的预测也精度欠佳。

华深智药团队,也是看到了可改进之处,着手开发人工智能药物开发平台——HeliXonAI。

该平台囊括了包含蛋白质结构预测在内的一整套生命建模算法体系,将被用于承接包含抗体设计,靶点发现等诸多挑战性任务。

同时,HeliXonAI的蛋白质结构预测算法在AlphaFold2的基础上,提出了诸多改进。

比如数据上利用数据蒸馏引入了更为庞大的无结构氨基酸序列数据库,并且在模型上设计了新颖的进化调整(Evolutionary Calibration)模块实现了对多比对序列的信息较正。

又比如对于空间坐标的优化,HeliXonAI引入了几何平滑(Geometric Smoothing)模块,利用几何深度学习的特性,和近一千层的深度,不断地将坐标优化到正确位置上。

这2大全新的模块的加入,能够迭代式地修复同源序列对比中的误差并相应地对所有原子几何位置做出对应的调整,这样就能更为有效地解决同源信号弱的问题,并在原子级别的细节上做出更精准的预测。

最终,在8块A100显卡上,经过连续接近3个多月的训练,HeliXonAI实现了模型预测能力指标上对AlphaFold2的超越。

当然,需要指出的是,如此成果并非只是3个月的冲刺,背后还有华深智药团队的多年积累。

华深智药打造者?

彭健,伊利诺伊大学厄巴纳-香槟分校(UIUC)计算机科学系及医学院终身教授,生物计算领域的知名大牛,机器学习与蛋白质结构和功能预测的顶级科学家。

他在博士期间设计的著名算法RaptorX以及在UIUC任教期间设计的DeepContact算法,多次在CASP比赛中获得领先的成绩,并很早就尝试将深度学习的技术引入这个领域。

彭健也因此在2016年获得有“诺奖风向标”之称的斯隆研究奖,并于2020年获得计算生物领域最高奖奥弗顿奖(Overton Prize)。

此前,奥弗顿奖获得者包括David Baker, Trey Ideker以及Aviv Regev等计算生物学领军人物,而彭健教授也是该奖项20年来的唯一华人得主。

今年6月,看到了领域内正在发生的质变,在张亚勤旗下清华大学人工智能产业研究院孵化之下,正式创办华深智药。很快便完成了千万美元级天使轮融资。

创办伊始,华深智药就明确要打造新一代人工智能科学计算平台,并结合自研高通量生物实验技术,为研发人员提供微观世界分子计算、模拟与设计的智能系统。

彭健明确,在新药开发领域,特别是大分子药物开发,华深智药希望用创新性地使用AI重构药物开发流程,从而极大程度上提高新药研发速度和效率。

而HeliXonAI平台,就是华深智药第一阶段的成果。

并且HeliXonAI平台的产业应用,也已经开始展现,因为该平台集成了包含蛋白质交互,蛋白质动态建模,抗体关键区域建模,靶点查询,蛋白质设计等一整套生命建模流程体系……

于是在针对新冠病毒变异株的抗体设计和免疫逃逸位点检测等任务中,也能发挥作用。

据说,相关成果已经进入产业转换阶段了。

CAMEO传送门:

https://www.cameo3d.org/modeling/1-week/difficulty/all/?to_date=2021-12-04

AlphaFold2被超越!中国团队刷新全球蛋白质结构预测纪录,大牛彭健创业项目一鸣惊人...相关推荐

  1. 华中科技大学和华为云瑶光造就中国团队全球首冠

    [摘要] 近日,在第12届 DIMACS 算法挑战赛(12th Implementation Challenge on Vehicle Routing Problems)中,华为云瑶光调度算法团队联合 ...

  2. 密歇根大学张阳团队开发全球首个蛋白质和RNA分子通用结构比对算法

    把已知生物大分子的结构进行精准比较,这样一个看似简单的问题,在AI高度发展的今天,居然是分子生物学里面一个悬而未决的数学问题.最近,密歇根大学和耶鲁大学的科学家合作在Nature Methods上发布 ...

  3. 爆 曝安克产品主图被恶意篡改;TikTok超越谷歌登上全球流量榜首;中国-东南亚运费暴涨10倍...|洞悉跨境

    "人民币印制发行有严格的工作程序和技术标准,中国人民银行一直依法依规开展相关工作.我行对造谣.传谣行为严厉谴责,已经向公安机关报案. " 每晚八点·洞悉跨境 [央行:网传中国印钞造 ...

  4. DEFCON CTF 2017圆满收关,三支中国战队闯入全球前五

    作为CTF界最知名影响范围最广的比赛,为期三天的DefCon CTF 2017在热闹喧嚣中落下了帷幕,经过整整三天两夜52个小时不停歇的比赛,比赛结果最终揭晓,美国PPP战队再次夺冠!这已经是PPP战 ...

  5. CVPR 2020学术竞赛大盘点,中国团队揽获众多冠军

    2020-06-23 03:20:03 作者 | 蒋宝尚 编辑 | 丛 末 CVPR 2020已经落下帷幕,除了为期三天的主会议,还穿插着同为期三天的Workshop,这些研讨会有一些是讨论性质的,还 ...

  6. 对话 Contributor| 中国团队贡献的开源项目, 当然要支持

     点亮 ⭐️ Star · 照亮开源之路 GitHub:https://github.com/apache/dolphinscheduler 夏日炎炎,高温可能会影响我们的食欲或者上班的心情,但却挡不 ...

  7. 《科学》:媲美AlphaFold2的蛋白质结构预测新工具问世,一台游戏计算机十分钟出结果,完全免费...

    来源:学术头条本文约2000字,建议阅读5分钟 整个研究学界都将受益. 如今,人工智能已经渗透到人们生活的方方面面,各种深度学习算法也越来越多地应用于各个领域.尤其在生物和医学领域,人工智能技术可以说 ...

  8. 7分钟分析人类全基因组,他们刷新全球纪录,此前最快也要24小时

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 7分钟,这是来自中国的一支团队"合力出成绩".一举打破的世界纪录: 全球首次将人类全基因组分析,推进分钟级时代. 这支团 ...

  9. 7月10日云栖精选夜读丨ApsaraCache开源之路,阿里云Redis团队LC3全球顶级开源峰会获CRUG开源社区最具影响力奖...

    近日由The Linux Foundation主办的全球开源盛会LinuxCon + ContainerCon + CloudOpen(LC3)中国在北京国家会议中心举行,阿里云Redis团队也受邀参 ...

最新文章

  1. (0018)iOS 开发之Github 使用技巧
  2. leetcode 739. 每日温度 单调栈解法和暴力法及其优化 c代码
  3. getResource(String name)用法及源码分析
  4. python 学习(1)
  5. png文件合并_png格式图片和jpg格式图片有什么区别?
  6. 解析5G背后的核心技术:波束成形
  7. ONNX系列七 --- 在Python中使用可移植的ONNX AI模型
  8. java回收内存_JAVA之内存回收
  9. css宋体代码_family【CSS 字体】(宋体 黑体 微软雅黑)CSS文字字体
  10. 抖音地球html代码,抖音短视频征服海外 1/6的地球移动网民活跃
  11. 效能评估软件解决方案
  12. 【docker】如何在docker中执行redis命令
  13. 整理出的安卓国家码,简称,语言的Json文件,可以一一对应国旗
  14. 博士申请 | 美国明尼苏达大学葛畅教授招收隐私数据管理方向全奖博士/硕士/博后/访问学者...
  15. Cybertec PostgreSQL透明加密解析
  16. 时间线故事脚本_时间轴的创意脚本
  17. 宝塔服务器之堡塔应用管理器的使用【php消息队列】
  18. countifs函数的使用方法,多条件函数运用
  19. android人脸情绪识别器,Emotion Recognition微软人脸情绪识别器
  20. 求二叉树的深度 题目编号:376

热门文章

  1. 为什么indexOf在数组IE8上不起作用?
  2. 如何在JavaScript中将字符串转换为布尔值?
  3. 为什么Java大神,都在看Spring Boot和Spring Cloud的书?
  4. 教你如何成为一名区块链工程师!
  5. 补第四周作业总结——8 puzzle
  6. Noticaition 1.0 正式发布了
  7. float 属性详解
  8. Swift中出现“no such module cocoa”的错误
  9. 01--swift之基本运算符
  10. Redis Sentinel机制与用法