AlphaFold 2的问世可谓是生物学界海啸级地震,让蛋白质结构预测走上另一个新阶段。同时,AlphaFold的开创性方法也对其他研究产生深远的影响。这不,清华和MIT研究团队在最新研究中就用上了它。

>>>>

2020年末,DeepMind开发的第二代深度学习神经网络AlphaFold 2的问世震惊了结构生物学界。

AlphaFold解决了困扰科学家几十年的蛋白质折叠问题。

最近的研究表明,AlphaFold开创的方法正在向更广泛的生物学界蔓延。

在《美国国家科学院院刊》上发表的一篇论文 Deep learning guided optimization of human antibody against SARS-CoV-2 variants with broad neutralization。

论文中,科学家描述了修改一种已知的COVID-19抗体的方式,以提高其对多种疾病变体的疗效。

地址:https://www.pnas.org/doi/10.1073/pnas.2122954119

科学家们写道,「我们可以使抗体宽度以及sars-cov-2变体 (包括 Delta) 的效力提高10到600倍」。他们甚至发现了该方法可以对抗奥密克戎(Omicron)变体迹象的希冀。

深度学习增强新冠抗体

这项研究是由清华大学、伊利诺伊大学厄巴纳-香槟分校和麻省理工学院的研究人员共同完成, 他们利用深度学习进行研究有两个重要的原因。

一个是扩大所谓的搜索空间,即修改抗体的一组潜在解决方案。现有的方法,例如随机突变,虽然很有价值,但费时费力。

使用深度学习是一种自动化的方法,从而加快工作速度。

其次,像随机突变这样的方法可以在带来好处的同时带走抗体好的那一部分,结果可能不是最理想的。

通过使用深度学习的方法,作者希望扩展功效的同时保留已经取得的成果。

图嵌入注意程序,用于查找对预测结合亲和力具有重要意义的残基对

他们的方法采用了AlphaFold2的基本技术: 一个图形网络,以及一种称为注意力机制的变量处理方法

图形网络是指一些事物的集合可以根据它们之间的关系进行评估,比如社交网络中的人。

AlphaFold 2利用蛋白质的信息构建了一个不同氨基酸之间距离的图表。然后通过注意力机制操纵这些图,计算每个氨基酸与另一个氨基酸的关系。

Shan和他的同事采取了同样的方法,他们把这种方法应用到病毒的氨基酸、抗原以及抗体的氨基酸上。

他们将所谓的野生型与两者的突变形式进行比较,以确定抗体与抗原的结合如何随着野生型和突变型之间的氨基酸对的变化而变化。

为了训练一个深度神经网络实现这一点,他们设置了一个目标。在机器学习领域被称作目标函数,该函数正是神经网络要复制的目标。

在这一例中,目标函数是自由能量的变化,即蛋白质中的能量从野生型变到突变型,由希腊字母delta-delta、G和ΔΔG。

给定一个目标自由能,神经网络可以可靠地预测哪一组氨基酸配对的变化和目标自由能的变化最相符。

Shan和他的同事表示,为了评估变异对蛋白质复合体的效果,我们首先通过重新包装突变周围的侧链,预测了蛋白质复合体的结构,之后解码了野生型和突变型复合体,并利用该网络来获得野生型和突变型复合体的嵌入。

之后,通过额外的神经网络层和两部分嵌入的比较来预测突变的影响(用ΔΔG衡量)。

虽然Shan和他的团队提到了AlphaFold2,他们也使用了AlphaFold2所使用的方法,但他们没用DeepMind的代码。

麻省理工学院的Bonnie Berger是该研究的联合作者,他表示,「关于ΔΔG预测器的研究完全是从零开始的。」

因为ΔΔG预测器和AlphaFold2都是开源的,每个人都可以亲自去体验,去看看二者的比较。ΔΔG预测器的代码在GitHub,AlphaFold2的代码在它自己的网站。

在训练神经网络预测重要的抗体和抗原之后,作者们从新型冠状病毒的α、β和γ版本中找到抗体已经成功的证据,并据此开始进行反向工作。

他们使用这些数据来预测哪些突变的抗体能够延长疗效。

作者表示,我们的办法生成了一个用电脑模拟的抗体CDR的突变库,通过训练几何中立网络进行排序。这样不仅能提高抗体和Delta RBD的结合,还能维持抗体和其它所关注变体的RBD的结合。

CDR,全称为互补性决定区,是和抗原结合的一部分或是抗体。RBD,全称为受体结合区,是病毒上的重要靶点。

研究人员得到了双重、三重,甚至四重的变异抗体。他们在实验室里用合成的病毒来测试这些抗体。他们发现,随着突变的合成,降低抗原浓度的效果越来越强。

他们得出结论,认为存在一种物质能更好的让突变抗体和病毒相结合。

他们写道,「有三到四次突变的抗体HX001-020、HX001-033和HX001-034也比有两次突变的HX001-034要强。亲合力的提高可能会让这些抗体的中和活性在遇到非典或新冠的野生病毒或变体病毒时增加。」

有一个引人深思的发现是,一个突变的抗体能够避免病毒的突变,其目的是提高效率。在一份结构分析中,他们发现原始抗体的一部分和抗原的一个特定部分擦肩而过,二者相互排斥。

这是因为抗体的粒子R103和抗原的粒子R436都有非常长的侧链,并且都携带正电子,这两种粒子之间的亲和性会产生一种强大的推力,这股力量会削弱抗体和抗原之间的结合度。

科学家们替换普通的抗体粒子之后,就观察不到R346和Delta RBD的直接作用了。该因素也许能解释针对Delta变体的中和效果为什么能够大大改善。

作者们在研究的抗体正好是由Shan和他的同事们去年引入的。这一事实让整个研究变得更加有趣。

名叫P36-5D2的抗体是从一名患过新冠病毒的康复患者的血清中提取出来的。Shan和他的团队通过动物模型研究,发现这种抗体是一种适用面广、有效、具有保护性的抗体。

因此,这项新研究标志着人工智能领域的一个里程碑。即借助电脑,把传统的生物产品进行改进,从而扩展传统的生物安全实验室治疗传染性疾病的办法。

AlphaFold足以改变人类?

2021年年底,人工智能预测蛋白质结构AlphaFold被评Science评为2021十大科学突破之首。

人工智能正在催生新的科研范式,AI for Science已经成为许多科学家的共识。

长期以来,蛋白质都是生命科学工作者研究的重点。

因为蛋白质是生命活动的主要承担者,甚至毫不夸张的说,没有蛋白质就没有生命。

而其中,蛋白质的结构更是众多生命科学工作者研究的热点,毕竟其主要功能是由结构决定的。

2020年,AlphaFold2的问世成为生物学界海啸级的地震。

紧接着DeepMind开源了AlphaFold2,并能够预测出98.5%的蛋白质结构,让学术圈再次沸腾。

不仅如此,研究人员还将其做成了数据集,将其免费开放。

对蛋白质进行系统深入的研究,能让人类从更深层次诠释生命体的构成和运作变化规律,进而全面揭示生命运行、发展的机制,激发生物科学、药物研发、合成生物学方面的发展。

另一方面,将人工智能方法应用到蛋白质预测,可以让科研人员从中得到许多借鉴,站在神经网络与深度学习的技术巨人的肩膀上,推动生物界的发展与研究。

「AI+生物」团队强强联合

可以说,清华这个「AI+生物」的打造,是当前新冠中和抗体研究打造的最佳团队。

它充分利用了清华大学的校内科研资源优势,联合清华大学医学院与清华大学智能产业研究院(AIR),进行强强联合,「AI+生物」集中攻关。

张林琦教授,来自清华大学医学院,是该研究的领衔人物之一。

此前,张林琦教授一直致力于挖掘新冠免疫保护机制,开创药物和疫苗研发。

据清华大学医学院官网介绍,张林琦教授于1992年获得英国爱丁堡大学分子病毒学博士学位,之后在美国纽约大学和洛克菲勒大学担任助理教授和副教授,2007年全职任教于清华大学,现为清华大学医学院长聘教授,北京协和医学院兼职教授,博士生导师,清华大学艾滋病综合研究中心主任。

张林琦教授是首位中国籍非洲科学院院士,于2016年当选。

2014年非洲爆发了大规模的埃博拉病毒,作为国内外传染病研究专家,张林琦教授带着一名研究人员的初心和使命,致力于病毒研究。

然而,新冠病毒的肆虐远比我们想象地要猖狂!

面对这样的困境,研究人员毫不畏缩,大胆尝试,将计算机科学前沿成果与研究方法运用到传统生物研究上。

彭健,清华大学智能产业研究院高级访问教授,同样是该研究的领衔人物之一。

彭健博士的主要研究领域为信息学,他从生物化学领域找到了学科交叉点,在生物信息学、化学信息学和机器学习方面,包括蛋白质结构预测技术的关键测试(CASP),及转化医学和药物基因组学的DREAM 挑战等,取得了备受瞩目的成就。

清华AIR引领人工智能赋能生命科学,这是吸引彭健博士加入清华大学智能产业研究院的重要原因

此前,彭健于2013年获芝加哥大学丰田技术学院计算机科学博士,接着,在MIT计算机科学与人工智能实验室从事博士后研究,然后,担任美国伊利诺伊大学厄巴纳-香槟分校计算机科学系副教授。

彭健说:「交叉学科人才的培养尤其重要」!这不,加入不到1年时间,就已开花结果。

参考资料:

https://www.med.tsinghua.edu.cn/info/1049/3926.htm

https://air.tsinghua.edu.cn/info/1001/1005.htm

https://www.zdnet.com/article/mit-and-tsinghua-scholars-use-deepminds-alphafold-approach-to-boost-covid-19-antibodies/

https://www.pnas.org/doi/10.1073/pnas.2122954119

—版权声明—

来源:新智元,编辑:nhyilin

仅用于学术分享,版权属于原作者。

若有侵权,请联系微信号:Eternalhui或nhyilin删除或修改!

—THE END—

文章推荐

☞马克思的数学手稿

☞大学排名居然是一家快倒闭的二流杂志搞出来的自救项目?

☞丘成桐谈几何:从黎曼、爱因斯坦到弦论

☞相对论的根源

☞赫胥黎的焦虑与美丽新世界

☞因数学而发现的行星--海王星

AlphaFold2立功!清华团队用深度学习增强新冠抗体,创AI里程碑相关推荐

  1. 基于深度学习的新冠疫情数据分析

    摘要:在全球抗击新型冠状病毒肺炎(COVID-19)疫情的过程中,合理的疫情传播预测对于疫情防控有重要参考意义.为了对病毒传播进行合理预测,针对传统疫情传播预测模型存在的不足,在BP神经网络提出一种组 ...

  2. Nature 子刊重磅:腾讯与钟南山团队发布新冠危重症 AI 预测模型

    当前,新冠肺炎疫情仍在蔓延,全球已确诊病例数突破 1437 万,死亡数超过 60 万,并存在进一步爆发的风险.在感染 COVID-19 的患者中,大多数呈轻度至中度症状,但也有一部分患者的病情初期表现 ...

  3. Nature 子刊重磅:腾讯与钟南山团队发布新冠危重症 AI 预测模型 Cox

    日前,钟南山院士团队与腾讯AI Lab披露了利用AI预测COVID-19患者病情发展至危重概率的研究成果--深度学习生存Cox模型,可分别预测5天.10天和30天内病情危重的概率,有助合理地为病人进行 ...

  4. 钟南山团队携手腾讯研发新冠重症AI预测 成果登上Nature子刊

    钟南山院士团队与腾讯AI Lab日前披露了利用AI预测COVID-19患者病情发展至危重概率的研究成果,可分别预测5天.10天和30天内病情危重的概率,有助合理地为病人进行早期分诊.这项研究已在202 ...

  5. 谷歌和哈佛团队用深度学习预测余震;谷歌移交 Kubernetes 管理权,并承诺资助 900 万美元...

    (点击上方蓝字,快速关注我们) 转自:开源中国.solidot.cnBeta.腾讯科技等 0.谷歌和哈佛团队利用深度学习来预测地震余震 科学家可以在一定程度上预测这些余震的大小和时间,但确定位置始终具 ...

  6. 神经网络+深度学习+增强学习

    神经网络+深度学习+增强学习 神经网络 像飞机的灵感来源于鸟类,雷达的灵感来源于蝙蝠,红外线的灵盖来源于蛇,而本文要讨论的神经网络灵感来源于我们自己,人类大脑的神经元结构.从神经元结构被提出,到时下火 ...

  7. 基于NVIDIA GPUs的深度学习训练新优化

    基于NVIDIA GPUs的深度学习训练新优化 New Optimizations To Accelerate Deep Learning Training on NVIDIA GPUs 不同行业采用 ...

  8. [深度学习]实现一个博弈型的AI,从五子棋开始(1)

    好久没有写过博客了,多久,大概8年???最近重新把写作这事儿捡起来--最近在折腾AI,写个AI相关的给团队的小伙伴们看吧. 搞了这么多年的机器学习,从分类到聚类,从朴素贝叶斯到SVM,从神经网络到深度 ...

  9. 知识图谱与深度学习(新时代·技术新未来)

    作者:刘知远,韩旭,孙茂松 出版社:清华大学出版社 品牌:清华大学出版社 出版时间:2020-05-01 知识图谱与深度学习(新时代·技术新未来)

最新文章

  1. 【Python】0/1背包、动态规划
  2. linux下mysql的基本用法
  3. 电感器在交流电路中的作用
  4. python基础-字典(8)
  5. java synchronized块_Java多线程同步代码块Synchronized
  6. 图解 Kafka,看本篇就足够啦
  7. Unity调试外部DLL
  8. 运用计算机计算电力系统潮流分布时,电力系统【第四章:复杂电力系统潮流分布的计算机算法】...
  9. java php cms_内容管理系统的开发策略研究——以PHP CMS、Node.js CMS、Java CMS为例
  10. 王校长撩妹不成反被锤爆?再有钱的舔狗也只是舔狗【Python爬虫实战:微博评论采取】
  11. 回忆我的网络生活(一)
  12. Linq 2 DataSet
  13. Java检查日期格式是否正确
  14. 如何用活字格定制监狱管理系统
  15. 百度旋转验证码打码模块,集成鱼刺模块类
  16. 计算机指令的操作码和地址,操作码和地址码
  17. Ubuntu 20.04上编译OpenSSL的编译选项设置
  18. 【盘点】最受欢迎十大中国风歌曲
  19. 地铁 综合监控设备 及其所属子系统
  20. 硬盘服务器与硬盘阵列,磁盘阵列和硬盘的区别是什么

热门文章

  1. TensorFlow学习之——checkpoints
  2. 《Python 黑科技》10万粉丝头像千图成像(撩对象)
  3. Struts2源码阅读(二)_ActionContext及CleanUP Filter
  4. jsp 页面获取action 属性的方法
  5. java 操作db2_java操作DB2,增删改查
  6. springcloud 创建子父项目_idea搭建springCloud----搭建父子项目(二)
  7. PID:我应该何时计算积分项?
  8. C语言学习及应用笔记之七:C语言中的回调函数及使用方式
  9. php重复点击按钮无效,完美解决UIButton按钮重复点击、多次响应的问题
  10. php factory interface,PHP设计模式之工厂方法*解读