AI预测RNA结构登上Science封面,论文一作已成立药物公司开始招人
晓查 明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI
AI在生物学领域再次立功了。
今天,Science封面刊登了AI在预测RNA分子结构上的重大进展。
来自斯坦福大学的研究团队,使用一种叫做ARES的几何深度学习,在预测RNA三级结构上达到了前所未有的准确度。
一个月前,AlphaFold 2预测人类98.5%的蛋白质,惊艳了全世界。
但是与蛋白质相比,同样是生物分子的RNA,人类对它的研究主要还停留在二级结构上,对三级结构知之甚少。
加州大学欧文分校的药物学家Robert Spitale说,我们对大部分RNA结构几乎一无所知。
一无所知到什么程度呢?
人类基因转录为RNA的数量是蛋白质数量的30倍。迄今为止实验已经确定了数千种蛋白质的三级结构,而人类测定三级结构的RNA不到蛋白质的1%,大约只有几十种。
现在ARES已经预测了1500种RNA分子结构,从过去的将精度提高了4Å左右(1Å等于0.1纳米),平均误差为12Å。,当相比之前的方法有了显著提升。
虽然和AlphaFold 2预测35种蛋白质相去甚远,也达不到原子级精度(大约1Å),但这足以称为一项开创性研究。
因为斯坦福大学的科学家们的训练集只有18个结构数据,少得可怜,取得如此大幅的提升实属不易。
ARES的出现,让AI预测RNA三级结构的细节成为可能。
论文的第一作者、斯坦福大学博士Raphael Townshend说:“结构生物学是对分子形状的研究,在生物学中有一句名言,即结构决定功能。”
因此,这项研究有助于科学家们去发现RNA的生物学功能,并为发现新型RNA靶向药物铺平道路。
为何要研究RNA
为什么要研究RNA呢?
这与它在整个生命活动中发挥的重要作用离不开关系。
在生物体内,RNA具有十分重要的细胞功能,包括合成蛋白质、催化反应、调节基因表达、调节先天免疫和感知小分子等。
一方面,RNA是遗传信息表达的重要一环。
只有通过RNA的转录、翻译,DNA中的信息才能在蛋白质中表达。
△RNA转录
另一方面,RNA还能调节一些重要生命活动。
核糖RNA可以催化肽链的生成,为转移RNA提供结合位点,参与核糖体大小亚单位的结合、校正阅读等等功能。
而且,参与遗传信息表达的RNA只占RNA总量的20%不到,这意味着有大部分遗传信息都还没有被表达出来。
还有一些病毒是以RNA作为遗传信息的载体,比如引起新冠肺炎的SARS-CoV-2,就是一种RNA病毒。
因此,研究RNA是探索生命奥秘的必经之路。
除了研究层面,在实际应用上RNA能发挥的作用也越来越多。
依据致病基因的序列信息,科学家开发出了RNA药物、RNA疫苗。
它们可以从基因层面就发挥作用,靶向抑制致病蛋白的表达,在医学领域具有非常广泛的应用前景。
RNA研究难点在哪
结构生物学有一个信条,即结构决定功能,RNA也不例外。
在知道RNA对生命活动发挥如此大作用后,科学家首先要做的,就是探究RNA的结构。
这也是RNA研究的一大难点。
不同于DNA稳定的双链结构,RNA绝大多数情况下都以单链形式存在。
但是单链RNA可以通过折叠形成双链结构,再折叠形成三级结构。
而且RNA的糖环上有3个自由烃基,而DNA由于脱氧只有两个,所以RNA的化学性质也更加活泼,也就是更容易发生反应。
此外,RNA还更容易被自己的分解酶降解。
这些原因使得RNA在实验过程中操作难度也更高。
事实上,到目前为止人类已知的RNA结构只有几十种。既然实验难以测定,所以科学家开始把目光放在了AI预测RNA结构上。
和AlphaFold 2的不同
近来深度学习技术的重大进展,往往都需要大量数据来进行训练。
但是可以给ARES预测的RNA结构只有18种,这些数据显然不足以使用传统方法。
斯坦福的科学家们想到了几何深度学习,开发了ARES(Atomic Rotationally Equivariant Scorer)。
顾名思义,这种方法并非直接针对RNA的特殊情况,而是细化到分子中的原子,参数只给出原子坐标和元素类型。
ARES被输入一小组已知RNA的真实结构,以及这些RNA的大量替代(不正确)结构。
在这个过程中,ARES了解每个原子的功能、几何排列以及这些元素相互之间彼此定位。神经网络中逐渐从原子级小尺度学习到分子大尺度的特征。
就这样,ARES一开始并不了解RNA,随着训练过程的进行,它学会了RNA的碱基配对模式、RNA螺旋的最佳几何形状。
接下来还有个问题,人类已知RNA种类太少,如何去评估ARES的预测未知RNA能力呢?
斯坦福大学的研究人员编制了一个基准数据集,包含七年来在结构预测竞赛RNA-Puzzles中获胜的作品。
根据RNA-Puzzles的规则,当科学家通过实验发现新的RNA结构时,他们不会公开细节,直到RNA-Puzzles参与者提交了他们的预测结果,然后将二者的结果进行对比。
经过测试集的检验,ARES对4种RNA结构的预测全都达到了最高准确度。
接下来,科学家使用采样软件生成了至少1500个RNA结构模型。然后,他们用ARES和其他三种软件对模型进行预测。
当使用ARES时,有62%结果接近原生RNA模型(平均误差<2Å),而
Rosetta、RASP和3dRNAscore分别只有43%、33%和5%的结果接近。
在ARES生成的10个最好模型中包括至少一个接近原生模型的有81%,而Rosetta、RASP和3dRNAscore分别只有48%、48%和33%。
虽然ARES还没有达到能精确预测靶点、辅助药物研发的精度,但研究人员说,他们的算法还有进步的空间
未来,他们计划输入除原子坐标和元素类型之外的更多信息,增加信息或许能进一步提高ARES的性能。
通过与低温电子显微镜等实验数据结合,ARES也可能得到进一步改进。
另外,本文的第一作者Raphael Townshend已经创立了一家生物学AI公司Atomic AI,使用AI技术设计药物分子。
Townshend刚刚在个人Twitter上发布了招聘信息,看来他是准备AI药物领域大展拳脚了。
参考链接:
[1]https://science.sciencemag.org/content/373/6558/1047
[2]https://science.sciencemag.org/content/373/6558/964.full
[3]https://www.scienceboard.net/index.aspx?sec=ser&sub=def&pag=dis&ItemID=3190
[4]https://www.eurekalert.org/news-releases/926246
AI预测RNA结构登上Science封面,论文一作已成立药物公司开始招人相关推荐
- Science公布2020十大科学突破,AI预测蛋白结构等上榜 | AI日报
2020 ACM杰出科学家名单出炉:智源学者叶杰平.崔鹏等26位华人学者上榜 近日,ACM(国际计算机协会)公布了2020年度ACM杰出科学家(Distinguished Member)名单! 今年全 ...
- 哈佛新研究登上Science封面:这个机械外骨骼,是一条“轻功”短裤
乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI 刚刚,Science封面刊发外骨骼穿戴设备的最新研究. 这是一款"神奇"的设备,能像穿短裤(方便)一样穿在身上(简洁) ...
- 打一针就可修复受损心脏,“癌症克星”CAR-T跨界疗法登上Science封面
博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 用"打疫苗"的方式修复心脏损伤,你能想象吗? 这项来自宾夕法尼亚大学的研究,现已登上Science封面: 已存的一些疗法 ...
- 小鼠脑立体定位图谱_脑科学日报|JAMA:保健品不能预防抑郁症;一只会唱歌的小鼠,登上Science封面;为什么不撒谎?自私谎言背后个体神经机制差异...
第 247 期 脑科学日报 2019年3月9日 科 学 时 讯 1,一只会唱歌的小鼠,何以登上Science的封面? 来源:原理 纽约大学医学院的神经科学家 Michael Long 和 ...
- 中国新冠研究登上Science封面,全球首次揭示新冠病毒人体蛋白受体结构
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:新智元 [导读]日前,西湖大学周强实验室的一项关于新冠病毒的研究登上了最新一期S ...
- 西湖大学新冠研究登上Science封面,解析ACE2全长结构,是他们看清了新冠病毒如何入侵人体...
郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 西湖大学周强团队的此前成功解析了新冠病毒受体ACE2全长结构,现在,这一成果登上了Science封面. 这篇论文最早在一个多月前发表在了预 ...
- 遇事不决,量子力学:谷歌量子计算模拟化学反应登上Science封面
视学算法报道 编辑:张倩.杜伟 转载自公众号:机器之心 原子和分子是受量子力学控制的系统,用量子计算模拟化学反应,或许是最好的方法. 去年 10 月,谷歌宣布实现「量子优越性」的论文登上了<自然 ...
- MIT“人造肌肉”登上Science封面,能提起自重650倍的物体,伸缩10000次都不坏
郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI 两种普普通通的材料,结合在一起却能爆发出惊人的力量. MIT造出的这种"人造肌肉",只要稍微加热十几度,就能自由伸缩 ...
- AlphaZero登上Science封面:从小白开始制霸多个游戏
DeepMind 推出的 AlphaGo 曾在围棋项目中取得了超越人类的表现,其研究曾经两次登上 Nature.近日,AlphaGo 的「完全自我博弈加强版」AlphaZero 的论文又登上另一大顶级 ...
最新文章
- dsp处理浮点数_关于IQMATH和浮点数在DSP的深入理解
- python接口测试上传文件_python https 接口测试 上传文件
- 计算机网络-基本概念(1)【网络层】-ARP协议以及数据传输过程
- MVC视图之间调用方法总结
- 二叉排序树或二叉搜索树
- Starling框架帮助手册中文版(PDF下载)
- 循环与函数及相关例子
- 关于iPhone 11系列、A13芯片 知乎网友是这么说的
- 阿里云技术白皮书_2019年云计算发展白皮书发布 阿里云保持优势成亚太最大云服务商...
- [导入]C#中WebService里的回车符\r丢失问题
- UVA - 10820欧拉函数的应用
- 纯js手写一个element的弹窗,方便修改自己想要的样式
- android开发简历,轻松拿到了阿里Android高级开发工程师的offer
- 硬件工程师和软件工程师哪个更有前途?我会告诉你嵌入式工程师更有前途
- idea 注释 rendered view
- 【镀金与沉金工艺的区别,今后得选“沉金”】
- 7-1 统计字符串中不同种类的字符个数 (10 分)
- 微软七月十四日发行四个安全补丁
- 流程图各个形状代表的含义
- Staubli HCB08.7202/IC/JS3
热门文章
- 解决UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 问题(转)
- 如何在React Native中记录日志?
- 除非换行符在格式字符串中,否则为什么在调用后printf不会刷新?
- Objective-C中的常量
- 按属性值对对象数组进行排序
- 在JavaScript中创建多行字符串
- java并发编程学习6--并行流
- Java常用实体类--System类
- IDEA中PlantUML的使用
- Vlan中的 PVID vid tag untag 常识理论