晓查 明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI

AI在生物学领域再次立功了。

今天,Science封面刊登了AI在预测RNA分子结构上的重大进展。

来自斯坦福大学的研究团队,使用一种叫做ARES的几何深度学习,在预测RNA三级结构上达到了前所未有的准确度。

一个月前,AlphaFold 2预测人类98.5%的蛋白质,惊艳了全世界。

但是与蛋白质相比,同样是生物分子的RNA,人类对它的研究主要还停留在二级结构上,对三级结构知之甚少。

加州大学欧文分校的药物学家Robert Spitale说,我们对大部分RNA结构几乎一无所知。

一无所知到什么程度呢?

人类基因转录为RNA的数量是蛋白质数量的30倍。迄今为止实验已经确定了数千种蛋白质的三级结构,而人类测定三级结构的RNA不到蛋白质的1%,大约只有几十种

现在ARES已经预测了1500种RNA分子结构,从过去的将精度提高了4Å左右(1Å等于0.1纳米),平均误差为12Å。,当相比之前的方法有了显著提升。

虽然和AlphaFold 2预测35种蛋白质相去甚远,也达不到原子级精度(大约1Å),但这足以称为一项开创性研究。

因为斯坦福大学的科学家们的训练集只有18个结构数据,少得可怜,取得如此大幅的提升实属不易。

ARES的出现,让AI预测RNA三级结构的细节成为可能。

论文的第一作者、斯坦福大学博士Raphael Townshend说:“结构生物学是对分子形状的研究,在生物学中有一句名言,即结构决定功能。”

因此,这项研究有助于科学家们去发现RNA的生物学功能,并为发现新型RNA靶向药物铺平道路。

为何要研究RNA

为什么要研究RNA呢?

这与它在整个生命活动中发挥的重要作用离不开关系。

在生物体内,RNA具有十分重要的细胞功能,包括合成蛋白质、催化反应、调节基因表达、调节先天免疫和感知小分子等。

一方面,RNA是遗传信息表达的重要一环。

只有通过RNA的转录、翻译,DNA中的信息才能在蛋白质中表达。

RNA转录

另一方面,RNA还能调节一些重要生命活动。

核糖RNA可以催化肽链的生成,为转移RNA提供结合位点,参与核糖体大小亚单位的结合、校正阅读等等功能。

而且,参与遗传信息表达的RNA只占RNA总量的20%不到,这意味着有大部分遗传信息都还没有被表达出来。

还有一些病毒是以RNA作为遗传信息的载体,比如引起新冠肺炎的SARS-CoV-2,就是一种RNA病毒。

因此,研究RNA是探索生命奥秘的必经之路。

除了研究层面,在实际应用上RNA能发挥的作用也越来越多。

依据致病基因的序列信息,科学家开发出了RNA药物、RNA疫苗。

它们可以从基因层面就发挥作用,靶向抑制致病蛋白的表达,在医学领域具有非常广泛的应用前景。

RNA研究难点在哪

结构生物学有一个信条,即结构决定功能,RNA也不例外。

在知道RNA对生命活动发挥如此大作用后,科学家首先要做的,就是探究RNA的结构。

这也是RNA研究的一大难点。

不同于DNA稳定的双链结构,RNA绝大多数情况下都以单链形式存在。

但是单链RNA可以通过折叠形成双链结构,再折叠形成三级结构。

而且RNA的糖环上有3个自由烃基,而DNA由于脱氧只有两个,所以RNA的化学性质也更加活泼,也就是更容易发生反应。

此外,RNA还更容易被自己的分解酶降解。

这些原因使得RNA在实验过程中操作难度也更高。

事实上,到目前为止人类已知的RNA结构只有几十种。既然实验难以测定,所以科学家开始把目光放在了AI预测RNA结构上。

和AlphaFold 2的不同

近来深度学习技术的重大进展,往往都需要大量数据来进行训练。

但是可以给ARES预测的RNA结构只有18种,这些数据显然不足以使用传统方法。

斯坦福的科学家们想到了几何深度学习,开发了ARES(Atomic Rotationally Equivariant Scorer)。

顾名思义,这种方法并非直接针对RNA的特殊情况,而是细化到分子中的原子,参数只给出原子坐标和元素类型。

ARES被输入一小组已知RNA的真实结构,以及这些RNA的大量替代(不正确)结构。

在这个过程中,ARES了解每个原子的功能、几何排列以及这些元素相互之间彼此定位。神经网络中逐渐从原子级小尺度学习到分子大尺度的特征。

就这样,ARES一开始并不了解RNA,随着训练过程的进行,它学会了RNA的碱基配对模式、RNA螺旋的最佳几何形状。

接下来还有个问题,人类已知RNA种类太少,如何去评估ARES的预测未知RNA能力呢?

斯坦福大学的研究人员编制了一个基准数据集,包含七年来在结构预测竞赛RNA-Puzzles中获胜的作品。

根据RNA-Puzzles的规则,当科学家通过实验发现新的RNA结构时,他们不会公开细节,直到RNA-Puzzles参与者提交了他们的预测结果,然后将二者的结果进行对比。

经过测试集的检验,ARES对4种RNA结构的预测全都达到了最高准确度。

接下来,科学家使用采样软件生成了至少1500个RNA结构模型。然后,他们用ARES和其他三种软件对模型进行预测。

当使用ARES时,有62%结果接近原生RNA模型(平均误差<2Å),而
Rosetta、RASP和3dRNAscore分别只有43%、33%和5%的结果接近。

在ARES生成的10个最好模型中包括至少一个接近原生模型的有81%,而Rosetta、RASP和3dRNAscore分别只有48%、48%和33%。

虽然ARES还没有达到能精确预测靶点、辅助药物研发的精度,但研究人员说,他们的算法还有进步的空间

未来,他们计划输入除原子坐标和元素类型之外的更多信息,增加信息或许能进一步提高ARES的性能。

通过与低温电子显微镜等实验数据结合,ARES也可能得到进一步改进。

另外,本文的第一作者Raphael Townshend已经创立了一家生物学AI公司Atomic AI,使用AI技术设计药物分子。

Townshend刚刚在个人Twitter上发布了招聘信息,看来他是准备AI药物领域大展拳脚了。

参考链接:
[1]https://science.sciencemag.org/content/373/6558/1047
[2]https://science.sciencemag.org/content/373/6558/964.full
[3]https://www.scienceboard.net/index.aspx?sec=ser&sub=def&pag=dis&ItemID=3190
[4]https://www.eurekalert.org/news-releases/926246

AI预测RNA结构登上Science封面,论文一作已成立药物公司开始招人相关推荐

  1. Science公布2020十大科学突破,AI预测蛋白结构等上榜 | AI日报

    2020 ACM杰出科学家名单出炉:智源学者叶杰平.崔鹏等26位华人学者上榜 近日,ACM(国际计算机协会)公布了2020年度ACM杰出科学家(Distinguished Member)名单! 今年全 ...

  2. 哈佛新研究登上Science封面:这个机械外骨骼,是一条“轻功”短裤

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 刚刚,Science封面刊发外骨骼穿戴设备的最新研究. 这是一款"神奇"的设备,能像穿短裤(方便)一样穿在身上(简洁) ...

  3. 打一针就可修复受损心脏,“癌症克星”CAR-T跨界疗法登上Science封面

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 用"打疫苗"的方式修复心脏损伤,你能想象吗? 这项来自宾夕法尼亚大学的研究,现已登上Science封面: 已存的一些疗法 ...

  4. 小鼠脑立体定位图谱_脑科学日报|JAMA:保健品不能预防抑郁症;一只会唱歌的小鼠,登上Science封面;为什么不撒谎?自私谎言背后个体神经机制差异...

     第 247 期    脑科学日报 2019年3月9日 科  学  时  讯 1,一只会唱歌的小鼠,何以登上Science的封面? 来源:原理 纽约大学医学院的神经科学家 Michael Long 和 ...

  5. 中国新冠研究登上Science封面,全球首次揭示新冠病毒人体蛋白受体结构

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:新智元 [导读]日前,西湖大学周强实验室的一项关于新冠病毒的研究登上了最新一期S ...

  6. 西湖大学新冠研究登上Science封面,解析ACE2全长结构,是他们看清了新冠病毒如何入侵人体...

    郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 西湖大学周强团队的此前成功解析了新冠病毒受体ACE2全长结构,现在,这一成果登上了Science封面. 这篇论文最早在一个多月前发表在了预 ...

  7. 遇事不决,量子力学:谷歌量子计算模拟化学反应登上Science封面

    视学算法报道 编辑:张倩.杜伟 转载自公众号:机器之心 原子和分子是受量子力学控制的系统,用量子计算模拟化学反应,或许是最好的方法. 去年 10 月,谷歌宣布实现「量子优越性」的论文登上了<自然 ...

  8. MIT“人造肌肉”登上Science封面,能提起自重650倍的物体,伸缩10000次都不坏

    郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 两种普普通通的材料,结合在一起却能爆发出惊人的力量. MIT造出的这种"人造肌肉",只要稍微加热十几度,就能自由伸缩 ...

  9. AlphaZero登上Science封面:从小白开始制霸多个游戏

    DeepMind 推出的 AlphaGo 曾在围棋项目中取得了超越人类的表现,其研究曾经两次登上 Nature.近日,AlphaGo 的「完全自我博弈加强版」AlphaZero 的论文又登上另一大顶级 ...

最新文章

  1. dsp处理浮点数_关于IQMATH和浮点数在DSP的深入理解
  2. python接口测试上传文件_python https 接口测试 上传文件
  3. 计算机网络-基本概念(1)【网络层】-ARP协议以及数据传输过程
  4. MVC视图之间调用方法总结
  5. 二叉排序树或二叉搜索树
  6. Starling框架帮助手册中文版(PDF下载)
  7. 循环与函数及相关例子
  8. 关于iPhone 11系列、A13芯片 知乎网友是这么说的
  9. 阿里云技术白皮书_2019年云计算发展白皮书发布 阿里云保持优势成亚太最大云服务商...
  10. [导入]C#中WebService里的回车符\r丢失问题
  11. UVA - 10820欧拉函数的应用
  12. 纯js手写一个element的弹窗,方便修改自己想要的样式
  13. android开发简历,轻松拿到了阿里Android高级开发工程师的offer
  14. 硬件工程师和软件工程师哪个更有前途?我会告诉你嵌入式工程师更有前途
  15. idea 注释 rendered view
  16. 【镀金与沉金工艺的区别,今后得选“沉金”】
  17. 7-1 统计字符串中不同种类的字符个数 (10 分)
  18. 微软七月十四日发行四个安全补丁
  19. 流程图各个形状代表的含义
  20. Staubli HCB08.7202/IC/JS3

热门文章

  1. 解决UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 问题(转)
  2. 如何在React Native中记录日志?
  3. 除非换行符在格式字符串中,否则为什么在调用后printf不会刷新?
  4. Objective-C中的常量
  5. 按属性值对对象数组进行排序
  6. 在JavaScript中创建多行字符串
  7. java并发编程学习6--并行流
  8. Java常用实体类--System类
  9. IDEA中PlantUML的使用
  10. Vlan中的 PVID vid tag untag 常识理论