来源|雷锋网

作者|贝爽

AI在生物科学领域再次取得重大突破!

美国时间11月30日,谷歌母公司Alphabet旗下人工智能公司DeepMind公开宣布,生物学界50年来的重大难题——蛋白质折叠预测,已被其成功攻克。

而攻克这一难题的正是其2018年一经推出便震惊科学界的AI系统——AlphaFold。

DeepMind在官方博客中称:AlphaFold的最新版本,在通过氨基酸序列精确预测蛋白质折叠结构方面,已经获得权威蛋白质结构预测评估机构(Critical Assessment of protein Structure Prediction,CASP)的认可。

此消息一出,立刻登上了Nature杂志封面,标题直接评论为:“它将改变一切!”。

同一时间,谷歌CEO兼首席执行官桑达尔·皮查伊 (Sundar Pichai)、斯坦福教授李飞飞、马斯克等众多科技大佬也在第一时间转推祝贺!

那么这场惊动科技圈、生物学界和科学界的重大突破,到底是一项怎样的研究?

01

AlphaFold:攻克50年生物学难题

首先要了解为什么要预测蛋白质折叠结构?

众多周知,蛋白质对于生命至关重要。几乎所有疾病,包括癌症、痴呆症都与蛋白质的功能有关。而蛋白质的功能由它的3D结构决定。

1972年诺贝尔化学奖得主克里斯蒂安·安芬森(Christian Anfinsen)曾提出,基于蛋白质的1D氨基酸序列可计算并预测蛋白质的3D结构。

但一个现实挑战是,蛋白质的3D结构在形成之前会有数以亿计的折叠方式。

美国分子生物学家Cyrus Levinthal指出,如果用蛮力来计算蛋白质所有可能的构型所需要的时间可能比宇宙的时间都要长,一个典型的蛋白质可能有10∧300种可能的构型。

因此,从1972年至今,如何准确预测蛋白质的折叠方式一直是生物学界的一项重大挑战。

然而,困扰生物学界50年的重大挑战昨日被DeepMind的成功攻克。该公司的最新AlphaFold系统,在第14次CASP评估中的总体中位数得分达到了92.4GDT。

这意味着AlphaFold预测的平均误差(RMSD)仅为1.6 埃(1埃等于0.1nm),相当于一个原子的宽度。

更重要的是,即使对于最具挑战性的蛋白质——自由建模类蛋白质 ,AlphaFold的中值得分也达到87.0 GDT

▲CASP中自由建模类预测精度值不断提高(GDT)

▲自由建模类蛋白质靶标的两个示例

对此,CASP主席John Moult教授在新闻发布会上说,

DeepMind的AlphaFold系统在蛋白质结构预测中达到了无与伦比的准确性。50年来,计算机科学领域的巨大挑战已得到很大程度的解决。

需要说明的是,CASP是评估蛋白质结构预测技术全球范围内最权威的机构。它由John Moult和Krzysztof Fidelis两位教授创立于1994年,每两年进行一次盲审。其中,GDT(Global Distance Test ) 是CASP 用来测量预测准确性的主要指标,其范围是从0-100。

简单地说,GDT 可以大致地被认为是氨基酸残基在阈值距离内与正确位置的百分比,90分左右的 GDT 可以被认为是与实验方法得到的结果相竞争的。

对此,CALICO创始人兼首席执行官亚瑟·D·莱文森高度评价称:

AlphaFold是上一代产品中的佼佼者,它以惊人的速度和精度预测蛋白质结构。这一飞跃证明了计算方法将转变生物学研究,并为加速药物发现过程具有广阔的前景。

02

AlphaFold背后的AI机制

折叠的蛋白质可以看作是一个“空间图形”,其中残基是节点和边紧密连接在一起。

该图代表了AlphaFold系统的神经网络模型体系结构。该模型对蛋白质序列和氨基酸残基进行操作——在两种表示之间传递迭代信息以生成结构。

这一过程对于理解蛋白质内部的物理相互作用以及它们的进化史很重要。

对于AlphaFold的最新版本,研究人员创建了一个基于注意力机制的神经网络系统,经过端到端的训练来试图解释这个图的结构,同时对它所构建的隐式图进行推理。它通过使用多重序列对齐 (MSA) 和氨基酸残基对的表示来精化这个图形结构。

通过迭代这个过程,系统可以对蛋白质的基本物理结构做出准确的预测,并能够在几天的时间内确定高度精确的结构。此外,AlphaFold 还可以使用内部置信度来预测每个预测的蛋白质结构的哪些部分是可靠的。

AlphaFold系统所使用的数据,来自包括约170,000个蛋白质结构,以及未知结构的蛋白质序列的大型数据库。在训练时,它使用了大约128个 TPU v3内核 (大致相当于100-200个GPU) ,并仅运行了数周。这在当今机器学习中使用的大多数最先进的大型模型的上下文中是相对较小的计算量。

03

第二代AlphaFold

DeepMind联合创始人兼首席,执行官Demis Hassabis表示:“ DeepMind的最终愿景一直是构建通用AI,以此加快科学发现的步伐,帮助我们更好地了解周围的世界”。

此次,AlphaFold系统攻克50年来的重大难题,意味着DeepMind又朝这一愿景迈出了坚实的一步。

2018年,AlphaFold首次推出便一鸣惊人。在当时参加的“蛋白质结构预测奥运会”CASP比赛中,AlphaFold在所有参赛者中达到了最高的精确度,而且是第二名的8倍之多。

经过两年的努力,DeepMind基于新的深度学习结构体系更新了AlphaFold,再次刷新了自己的记录——从60GDT一跃上升为92.4GDT。

而与其他同类AI相比,AlphaFold的准确率也同样遥遥领先。

DeepMind开发团队表示,AlphaFold之能够达到前所未有的精确度,其研究方法是受到了来自生物学、物理学和机器学习领域的启发,另外过去半个多世纪有关蛋白质折叠的研究成果野发挥了重要作用。

作为科学界的AI工具,AlphaFold的应用场景和价值已经得以显现。

在今年疫情不断蔓延下,DeepMind研究人员利用AlphaFold预测了冠状病毒SARS-CoV-2的几种蛋白质结构,包括ORF3a、ORF8等。

尽管这点蛋白结构具有挑战性且相关序列很少,但与实验确定的结构相比,AlphaFold在两个预测中均获得了很高的准确性。

除了加深对已知疾病的了解之外,AlphaFold的应用潜力还将扩展到未知的生物学领域。

由于DNA指定了构成蛋白质结构的氨基酸序列,研究人员从自然界大规模读取蛋白质序列,可能要在数以亿计的通用蛋白质数据库(UniProt)中进行计数。更重要的是,该蛋白质数据库可能只有约170000存在3D结构。

而AlphaFold这样的AI技术可以帮助研究人员发现尚未确定的蛋白质。

引用链接:

【1】https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

【2】https://www.cnbc.com/2020/11/30/deepmind-solves-protein-folding-grand-challenge-with-alphafold-ai.html

RECOMMEND

网易智能有12个不同垂直领域社群等你来

添加智能菌微信:kaiwu_club

扫码了解更多

震惊科学界!DeepMind AI破解「蛋白质折叠」难题相关推荐

  1. 下围棋的 DeepMind 成了「药神」,这事儿和你我都有关

    AI 介入医学让救治变得更高效,同时也在颠覆人类认识科学的方式. 「这将改变医学,改变研究,改变生物工程,」生物学家 Andrei Lupas 这样评价 Alphabet 旗下的 DeepMind 最 ...

  2. AI版「按图索骥」,比猜画小歌更复杂的的AI交互游戏

    郑集杨 发自 凹非寺  量子位 报道 | 公众号 QbitAI 你能在时间结束前根据Emoji找到你身边的物品吗?大概,像这样: 跟我玩?不不不,是你自己跟这个AI玩,找出东西然后让AI辨认它. 这并 ...

  3. 当 AI 掌握「读心术」:DeepMind AI 已经学会相互理解

    有时候,我们会觉得 Siri 或 Alexa 等数字助理非常令人失望,因为它们根本不懂我们人类.它们需要懂点被心理学家称为「心智理论」(theory of mind)的东西,搞清楚别人的信念和意图.最 ...

  4. AI 复活「她」! GPT-3 帮美国小哥复刻逝去未婚妻,但又夺走她……

    整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 今年 7 月,一名33岁的美国小哥 Joshua Barbeau 在未婚妻去世后,根据她在 Facebook 和 twitter ...

  5. 马斯克:我有一个大胆的想法!给红绿灯加个AI视觉「外挂」

      转载自:视学算法   编辑:好困 [导读]大半夜的,四下无人又没车,为何还要我等这么久的红灯?这两天,马斯克也在思考这个问题. 对于社畜来说,大城市的交通无非分为两种: 白天不让上班:晚上不让回家 ...

  6. AI复活「她」!用GPT-3复刻逝去未婚妻,美国小哥让挚爱以数字形态永生

    转载自:新智元 「死亡不是真正的逝去,遗忘才是永恒的消亡.」 即便逝去,也不要遗忘. 近日,一位美国男子 Joshua Barbeau 在未婚妻去世后,重建了一个AI聊天机器人以复刻死去的未婚妻. J ...

  7. GPT-5将死于GPT-4背刺?牛津剑桥研究警告:AI训AI成「剧毒」,会让模型崩溃!

    [导读]最差的人类语料,也要胜过AI生成的文本. 随着GPT-4.Stable Diffusion和Midjourney的爆火,越来越多的人开始在工作和生活中引入生成式AI技术. 甚至,有人已经开始尝 ...

  8. AI版「女娲」来了!文字生成图像、视频,8类任务一个模型搞定

    来源丨机器之心 作者丨陈萍.小舟 AI会是未来的「造物者」吗? 近来,视觉合成任务备受关注.几天前英伟达的 GauGAN 刚刚上新了 2.0 版本,现在一个新视觉合成模型 Nüwa(女娲)也火了. 相 ...

  9. AI领域「听风者」:声纹识别5大核心知识点!

    https://www.toutiao.com/a6691897670778225160/ 在移动互联网大行其道的时代,人们不用出门不用见面就可以完成很多事情,比如购物.生活缴费.投资理财等,在享受着 ...

最新文章

  1. Unsupported major.minor version (jdk版本错误)解决方案
  2. Linux工具之curl与wget高级使用
  3. C#与.NET程序员面试宝典 1.3.1 网络应聘(图)
  4. Java后端,应该日常翻看的中文技术网站
  5. 类中定义自身类的对象
  6. 6月第1周全球域名注册商(国际域名)新增注册量TOP15
  7. python flv转mp4_ffmpeg将多个flv文件合成为mp4(python版)
  8. Python实例讲解 -- 图片处理
  9. MTK 平台修改或查看USB驱动能力有三种方法
  10. C语言libcurl:RTSP(Real Time Streaming Protocol),RFC2326,实时流传输协议
  11. html网页中获取vf数据到mysql_怎样从HTML网页中获取SQL数据库里的数据
  12. 银河麒麟系统如何取得终端的root权限和查看所有服务状态
  13. 【SSM - Spring篇06】Spring数据库编程 - JdbcTemplate(Spring jdbc模板)
  14. C#用Socket和S7.net实现安卓手机APP读写西门子PLC数据(安卓APP使用的E4A中文编程软件)
  15. 《自卑与超越》的优秀读后感作文4000字
  16. xp计算机组策略怎么打开,WinXP系统打开组策略的命令是什么?
  17. 分布式缓存Hazelcast详解及原理探究
  18. vue未登录跳转至登录页面
  19. 红遍全网的SD-WAN,到底是什么?
  20. python实现图片读取为向量详解

热门文章

  1. Maxthon,TheWorld,MyIE等多标签浏览器的Flash缓存问题
  2. 【GlobalMapper精品教程】025:影像数据集的建立与巧妙使用
  3. JS任务机制 - springboot实战电商项目mall4j
  4. css设置按钮样式_使用CSS设置按钮样式的快速指南
  5. HTML静态分页(形如:首页,上一页,下一页,尾页)
  6. Qt之QThread(深入理解)
  7. 爱普生打印机怎么安装使用
  8. 【FPGA-DSP】第一期:DSP基础
  9. 我用Echarts图表分析巴西队历年战绩,预测卡塔尔世界杯能否夺冠
  10. Jsoup爬取网络内容(包括图片文件),保存到本地和保存到数据库(一)