梦晨 边策 明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI

98.5%的人类蛋白质结构被AlphaFold2预测出来了!

而且还做成了数据集,全部免费开放!

在开源AlphaFold2仅一周后,DeepMind震撼发布AlphaFold数据集,再次引爆科研圈!

数据集中预测的所有氨基酸残基中,有58%达到可信水平,其中更有35.7%达到高置信度。

而在这之前科学家们数十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸残基

除了人类蛋白质组,数据集中还包括大肠杆菌、果蝇、小鼠等20个具有科研常用生物的蛋白质组数据,总计超过35万个蛋白质的结构。

最重要的是,这些全都免费开放!交给欧洲生物信息学研究所托管。

“这是人类基因组图谱之后最重要的数据集”,这样的评价来自Ewan Birney,他领导了人类基因组计划的后续项目:人类基因元件百科全书(ENCODE)。

DeepMind创始人哈撒比斯在官网发布题为《把AlphaFold的力量交到全世界手中》的文章,同时也在推特上表达了他抑制不住地兴奋:

这是我一生中梦寐以求的日子,也是创办Deepmind的初衷:用AI推进科学发展并造福人类。

造福人类整体的另一面,是对当前结构生物学相关从业者的巨大冲击。

有人对与AI赛跑这件事感到绝望。

还有人吐槽,都开源了免费了没法申报经费了。

但也有人提出了不同的看法:21世纪不只是生物学的世纪,更是合成生物学的世纪啊!

在结构生物学实验室工作过的知乎网友@sorrySorui有点骚也认为AlphaFold的出现为科研人员节省大量时间和精力

他认为使用AlphaFold得出来的结果,可以帮助进行药物设计等进一步的研究。

那么这次预测结果中有哪些蛋白质能开辟新的研究方向?

几个重点预测

AlphaFold 2预测的结果总共有35万个,DeepMind在论文中挑出了3种典型的蛋白质结构预测,这些预测都是从头开始的。

虽然结果最终要通过实验来验证,但是这些预测还是为生物学家提供了很多有用的结果。

1、葡萄糖-6-磷酸酶(Glucose-6-phosphatase):发现了一种新的蛋白质门控机制

这是一种膜结合酶,可催化葡萄糖合成的最后一步,对维持血糖水平至关重要。以前没有该蛋白质的实验结构。AlphaFold预测具有非常高的可信度并给出了一个九螺旋拓扑结构。

DeepMind发现,在这种预测的结构中,谷氨酸可以稳定封闭构象的结合位点,因此可能存在门控功能,而这种新的机制是过去没有发现过的。

2、二酰基甘油O-酰基转移酶2(Diacylglycerol O-acyltransferase 2):寻找抑制酶的结合位点

这种酶负责将多余的代谢能量储存为脂肪,它( DGAT2)是催化过程中最终酰基添加的两种必需酰基转移酶之一,之前的研究显示抑制DGAT2可改善肝病小鼠模型中的肝功能。

凭借AlphaFold高度可信的预测结构(中值 pLDDT 95.9),可以确定该蛋白与抑制剂的结合位点。

3、Wolframin:寻找遗传病的成因

Wolframin是一种定位于ER的跨膜蛋白,与遗传病Wolfram综合征有关。Wolfram综合征是一种神经退行性疾病,其特征是早发性糖尿病、逐渐视力和听力丧失以及早逝。

虽然AlphaFold完整预测结果的置信度较低(中值 pLDDT 81.7),但是可用于识别该蛋白质结构特殊区域,一样能获得有用的结果。

比如,最近的进化分析研究了Wolframin的一个区域,AlphaFold的预测在很大程度上支持了他们的结论。

AlphaFold的预测表明,由于Wolfram综合征患者缺乏Wolframin中的半胱氨酸,可能会在蛋白质中形成二硫键交联。分析结果对帮助我们理解这种遗传疾病的原理很重要。

加速癌症、HIV等疾病治疗

目前,AlphaFold数据库中大约有36.5万个结构预测。

研究人员表示,接下来他们会将预测范围进一步扩大,预计在今年年底将预测数量增加到1.3亿个。

这个数量已经达到了人类已知蛋白质总数的一半。

这样震撼的成果,也让谷歌CEO Pichai再一次为AlphaFold站台:

AlphaFold数据库展现了AI加速科学进步的巨大潜力,它能在一夜之间就大幅提升我们对蛋白质结构和人类蛋白质组的认识。

蛋白质有着结构决定功能的特性,通过对它结构的研究,科学家能够掌握更多其功能、机理上的信息。

比如可以了解蛋白质是如何与其他化学物质相互作用的,以及在什么位置上发生反应。

这有助于科学家了解突变蛋白质是如何改变其功能的,从而展开对癌症、HIV、遗传性疾病的进一步探索。

此外,AlphaFold2能够将预测的准确性提升到了原子级别。

也就是说,人类现在可以更快速精准地确定酶的活性位点,这对药物开发也有着重大意义。

欧洲分子生物学实验室(EMBL)的负责人Edith Heard就说道:

我们相信这对理解生命体是如何运作有着变革性的影响。

哥伦比亚大学的计算生物学家Mohammed AlQuraishi表示,此前蛋白质结构预测领域总是要花费大量时间在一些基础工作上,浪费了学者的很多精力,现在他们可以更加专注于对蛋白质结构的研究了。

之前我们做研究都要依赖于氨基酸序列,现在可以直接从蛋白质结构上入手了。

事实上,一些与DeepMind展开合作的研究团队,已经通过AlphaFold加速了研究进程。

比如DNDi(被忽视疾病药物开发组织)就表示,AlphaFold2推动了他们在热带疾病药物开发方面的研究。

朴茨茅斯大学酶创新中心(CEI)也表示,他们正在利用AlphaFold2开发一些新的酶,可以用来降解污染环境的一次性塑料。

科罗拉多大学波尔德分校的生化学家Marcelo Sousa则利用AlphaFold来制作蛋白质结构模型,开展一项关于抗生素的研究。

加州大学旧金山分校的一个团队则表示,AlphaFold2可以帮助他们更好理解SARS-CoV-2的生物学机制。

蛋白质组学

AlphaFold2获得巨大成功的背后,离不开蛋白质组学(Proteomics)的研究。

蛋白质组指在特定时间由基因组、细胞、组织或有机体表达的全部蛋白质。

在90年代,人类基因组计划开始成形时,科学家意识到光掌握基因的碱基排列是不够的,还必须了解基因的产物蛋白质。

由此,澳大利亚遗传学家马克·威尔金斯提出了破译人类蛋白质组的想法。

2001年人类基因组框架图发布的同时,人类蛋白质组研究组织(HUPO)也正式成立。

直到2014年,慕尼黑工业大学和约翰霍普金斯大学终于绘制出人类蛋白质组草图。

随后人类蛋白质组数据库逐渐被完善,AlphaFold此次使用的就是目前收录最广泛和注释信息最全面Uniprot数据库。

想了解更多AlphaFold的技术细节可参考下面链接????:

《AlphaFold2成功秘诀:注意力机制取代卷积网络,预测准确性提升超30%》

论文地址:
https://www.nature.com/articles/s41586-021-03828-1

数据集:
https://alphafold.ebi.ac.uk

知乎授权回答:
@sorrySorui有点骚:https://www.zhihu.com/question/474094187/answer/2014736529

参考链接:
[1]https://deepmind.com/blog/article/putting-the-power-of-alphafold-into-the-worlds-hands
[2]https://twitter.com/demishassabis/status/1418226238888448004?s=20
[3]https://www.nature.com/articles/d41586-021-02025-4
[4]https://www.sciencemag.org/news/2021/07/new-public-database-ai-predicted-protein-structures-could-transform-biology

巨大冲击!AlphaFold2再登Nature,从业者都懵了:人类98.5%的蛋白质,全都被预测了一遍...相关推荐

  1. 复旦的新衣再登Nature!穿在身上能为手机充电,可水洗可弯折,刀戳车撵都不坏...

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 杨净 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今天,一件来自中国的 ...

  2. 清华类脑计算成果再登Nature:张悠慧施路平团队出品,有望打破冯诺依曼瓶颈...

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 清华类脑计算研究成果,再登Nature. 新研究的关键词是:类脑计算.新计算机系统框架.通用人工智能(AGI). 它的重要性,在于有希望打 ...

  3. 复旦的新衣再登Nature!穿在身上能为手机充电

    近日,一件来自中国的衣服登上了Nature. 没看出有什么特别?别眨眼,下一秒神奇的事情就发生了(注意那个手机). 没错,这件衣服正在给手机无!线!充!电! 不是把充电宝缝进了衣服里,而是这件可以正常 ...

  4. 潘建伟团队再登Nature:建成全球首个集成量子通信网,全长4600公里

    开发者社区技术周刊又和大家见面了,快来看看这周有哪些值得我们开发者关注的重要新闻吧. MariaDB为Java开发者加入R2DBC连接器 潘建伟团队再登Nature:建成全球首个集成量子通信网,全长4 ...

  5. 21℃室温超导引爆物理圈,曾被撤稿再登Nature,真能实现吗?附完整现场视频!...

    ‍ 昨天下午在微信群,看到有网友发了一个聊天记录,大概一看,说是一个科学家制造出了一种新的超导材料,可以在常温下实现超导,超导这个概念大家都知道,但印象之前是在很低温的环境下,绝对零度才能实现的,内容 ...

  6. 潘建伟团队再登Nature:全球首次实现器件无关量子随机数,量子保密通信安全再升级...

    岳排槐 编辑 量子位 出品 | 公众号 QbitAI 据消息,潘建伟团队日前成功实现了器件无关的量子随机数,将在数值模拟.密码学等领域广泛应用,并有望形成新的随机数国际标准. 相关研究成果于北京时间2 ...

  7. cnn 准确率无法提升_清华类脑芯片再登Nature: 全球首款基于忆阻器的CNN存算一体芯片...

    传统计算架构中计算与存储在不同电路单元中完成,造成大量数据搬运功耗增加和额外延迟,被认为是冯·诺依曼计算架构的核心瓶颈. 人类的大脑却并非如此,而是直接在记忆体里计算.被认为具有「存算一体」潜力的忆阻 ...

  8. 前所未有:用AI控制核聚变,DeepMind再登Nature

    点击上方"CSDN精品课",选择"置顶公众号" 第一时间获取精品编程教程 毫无疑问,DeepMind 正在加速将其 AI 算法应用于最前沿的科学问题上. 继此前 ...

  9. DeepMind再登Nature封面!推出AlphaTensor:强化学习发现矩阵乘法算法

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 转载自:机器之心 DeepMind 的 Alpha 系列 AI 智能体家族又多了一个成员--AlphaTen ...

最新文章

  1. visio 画类图时 方法里如何加参数
  2. 肠·道 | 刘洋彧:重建肠道菌群生态网络
  3. jquery之图片懒加载(总结)
  4. php投票系统制作,php简单的投票系统[原创]
  5. AngularJS学习---REST和自定义服务(REST and Custom Services) ngResource step 11
  6. 【匈牙利算法】指引(jzoj 2319)
  7. 【渝粤题库】国家开放大学2021春1018国际公法题目
  8. 8月全球搜索引擎市场:百度位居第四 份额大涨
  9. Spring JPA 使用@CreatedDate、@CreatedBy、@LastModifiedDate、@LastModifiedBy 自动生成时间和修改者...
  10. 无线网radius服务器ip,怎么设置无线路由器的radius服务器ip地址
  11. 面试官:为什么选择做测试?我对测试特别感兴趣,我喜欢软件测试
  12. 解决用电脑连接宽带给手机开热点的问题
  13. 校园市场应该怎样做,看看小米有什么新招式
  14. RS-485总线布线规范
  15. 【CodeForces - 1647D】Madoka and the Best School in Russia(分类讨论,因数分解)
  16. python创建目录\文件夹
  17. memcpy、memmove
  18. Java毕设项目-商城管理系统-基于J2EE/SSM化妆品商城系统的设计与实现
  19. FF首次适应算法与BF最佳适应算法(C++实现)
  20. 中国首位 K8s ingress-nginx reviewer 同时提名成为 Apache APISIX committer

热门文章

  1. 删除highcharts.com点数链接
  2. 实际上,Python 3.3中新的“ yield from”语法的主要用途是什么?
  3. 学习Vim有什么好处? [关闭]
  4. 如何在JQuery $ .each函数中编辑全局变量?
  5. 阿里云安全中心:自动化安全闭环实现全方位默认安全防护
  6. 关于adb devices连不上手机的几种情况
  7. Apache服务器和tomcat服务器有什么区别?
  8. PYTHON线程知识再研习F---队列同步Queue
  9. 【推荐】大型网站图片服务器架构的演进
  10. 对于访问IIS元数据库失败的解决方案