子豪 发自 凹非寺
量子位 报道 | 公众号 QbitAI

你以为GAN只能用来生成虚假的人脸吗?现在GAN又有了新用途。

它还可以用来生成功能蛋白序列

这一工具叫做ProteinGAN,可以处理和学习不同的天然蛋白质序列,随后利用获取的信息生成新的序列。

值得注意的是,它应用于功能蛋白序列,减少了非功能蛋白序列的实验消耗;还有效保证了蛋白质活性;并且只需几周时间,可以显著提高药物研发的速度。

ProteinGAN由立陶宛维尔纽斯大学和瑞典查尔默斯理工大学共同开发,研究论文已经在Nature子刊《机器智能》上发表。

功能蛋白,是指携带能够完成人体的生理功能的蛋白质,它们主要完成人体的各种代谢活动。

蛋白质序列,通常表示为字母串,列出了氨基末端开始至羧基末端的氨基酸,其顺序最终决定蛋白质的3D结构、理化性质和分子功能。

蛋白质设计,可以分为结构预测、固定骨架设计、全从头设计三种。

不同于AlphaFold根据序列预测蛋白质结构,ProteinGAN是用于生成蛋白质序列。

过去的方法依赖于将随机突变引入蛋白质序列。但是这通常会导致蛋白质活性下降,甚至丧失,必须进行多轮昂贵且耗时的实验,设计过程非常缓慢。

因此,功能蛋白的设计一直是蛋白质工程的难题。ProteinGAN是怎样做到的?

基本原理

ProteinGAN模型包含两个部分:判别器和生成器。

判别器和生成器的网络结构示意图

生成器网络通过给定的随机输入向量,生成蛋白质序列;

判别器网络区分生成的数据(例如:蛋白质序列)与真实数据,将二者进行比较并评分。

ProteinGAN训练过程

能够生成多样化的蛋白质序列

为了评估模型的性能,研究团队用苹果酸脱氢酶(MDH)训练模型,并且通过计算生成序列和自然序列的相似性来评估训练进度,最终是二者达到高度的一致性。

模型生成的序列与天然蛋白质序列具相似的物理性质,显示出与天然序列高度相似的氨基酸组成

对于每个生成的序列,从训练集中选择前100个匹配项。然后将选定的序列进行比对,并针对多重序列比对(MSA)中的每个位置,计算同源序列中氨基酸的频率。

红色的氨基酸表示在MSA中很少发生(<5%),而黄色的氨基酸表示在MSA中经常观察到。

右图显示了残基的出现(x轴)及其与蛋白质表面的距离(y轴),表明生成的序列残基跨越整个蛋白质结构。结果表明:

ProteinGAN能产生高度多样化的蛋白质序列。

并且,通过测量NADH(还原型辅酶)氧化后在340纳米处吸光度的下降程度,确定反应速率,得到结论:

生成的功能蛋白序列有24%可溶,表现出苹果酸脱氢酶(MDH)催化活性。

这意味着,ProteinGAN可能在医学和研究中有广泛应用,尤其是对于开发工业酶、抗体和疫苗等新型蛋白质药物等,有着巨大的潜力。

网友关注

对此,有网友认为:要谨慎地对待蛋白质工程的研究和应用。

“蛋白质设计的进步具有巨大的经济潜力,但是我们必须谨慎……

将新序列放入把一个新的序列放入质粒中进行表征是很容易的,但如果这个质粒进入野生细菌中,这些细菌可以用它来降解或合成化学物质,就会出现严重的问题。”

另一位网友回复道:

“这确实存在着很大的危险,但是新型蛋白的重要性不容忽视,我们必须保持谨慎和警惕,同时不能因陷入恐惧而退缩。”

研究团队表示,模型能够降低蛋白质工程设计的速度,降低酶催化剂的开发成本。目前,他们致力于提高模型稳定性,并且用AI生成的有机物解决塑料污染等问题。

ProteinGAN在GitHub上开源,感兴趣的读者可通过链接查看。

参考链接:
[1]https://www.nature.com/articles/s42256-021-00310-5
[2]https://github.com/Biomatter-Designs/ProteinGAN
[3]https://phys.org/news/2021-04-proteingan-adversarial-network-functional-protein.html

用GAN创造新蛋白只需几周,大幅缩短制药周期 | Nature子刊相关推荐

  1. 流量易得情怀难守?董宇辉爆火用半年,新东方“暴雷”只需一周?

    你敢信吗?同一个人,五月还是刘畊宏女孩,六月就变成了王心凌男孩,稍不留神,六月过半又成了董宇辉小迷妹--从这也能看得出,直播圈的"刷新率"还是很高的,顶流的交椅"烫屁股& ...

  2. AI帮60年代老技术解决面料数字化难题,王华民团队新方法只需3分钟数据采集复刻面料真实效果...

    杨净 发自 凹非寺 量子位 | 公众号 QbitAI 当人人谈论元宇宙时,大家都在关心什么?空间是否热闹丰富,交互是否丝滑-- NoNoNo其实都不是,而是真实感与沉浸感. △饱受批评的小扎自拍 作为 ...

  3. 3D卷积GAN飞起!微软“可缩放”新框架只需2D数据即可生成逼真3D模型

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自新智元.   新智元报道   来源:VB 编辑:元子 [新智元导读]Microsoft Research近日发表论文介绍了一种通过2D数据生成 ...

  4. 何恺明团队12页论文新作剑指AIGC!“新CLIP”只需一个trick,训练速度快3.7倍!性能不降反升...

    杨净 艳艳 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明团队又上新了. 这次,他们的成果围绕当下最火的AIGC背后的CLIP展开. --只在该模型的极简结构上,施加了一个简单的mask,就让 ...

  5. 大脑衰老可逆转,只需注入年轻脑脊液,“返老还童”登Nature

    明敏 金磊 发自 凹非寺 量子位 | 公众号 QbitAI "老喽,记不住喽." 随着年龄的不断增长,不少人都会发出这样的感叹--记忆力逐渐下降. 那么是否存在一种方法,可以让这种 ...

  6. 把「光」存储1小时,中科大新研究破世界纪录,保真度高达96.4% | Nature子刊

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 把光"封印"1小时,放出来后还是"活"的,这可能吗? 现在,来自中科大的郭光灿院士团队真的做到了. ...

  7. 全球首次!AI研制新药物仅需18个月,李开复梁颕宇:AI医疗已突破,但只打1分...

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI "比DeepMind的AlphaFold,要更加完整." "传统新药研发需10年,它却只用了18个月.&quo ...

  8. GAN做衣服只需几天,完美生成复古小黑裙

    MIT研究人员开发了一种能够设计出独特黑色小礼服的AI,使用GAN来生成图像,经过设计师的剪裁后,制作出非常有设计感的衣服. GAN终于可以干掉服装设计师了. 麻省理工学院的两位研究人员开发了一种能够 ...

  9. 新方法破解Wi-Fi WPA2加密平均只需10分钟

    原文地址:https://www.mozhe.cn/news/detail/461 随着Wi-Fi劫持等各类事件的频发,人们不难意识到传统的Wi-Fi变得不再安全.近日Hashcat的首席开发人员Je ...

最新文章

  1. python版本越高越好吗-Python 3.8 已发布,现在是切换至新版本的好时机吗?
  2. 智能合约开发环境搭建及 Hello World 合约
  3. oracle索引对模糊查询,Oracle索引
  4. 在oracle中的日期类型与String类型
  5. 抱歉!我不太会修电脑 | 2018年中国程序员研究报告
  6. 《菜菜的机器学习sklearn课堂》学习笔记 + 课件
  7. mysql数据库实现修改密码代码_MySQL数据库的更改密码(附源代码)
  8. Kubernetes 搭建 ES 集群(存储使用 cephfs)
  9. 光电转换模块_针对100G QSFP28 SR4光模块的特征及工作原理进行分析
  10. PL/SQL中导出整个表、表结构、部分数据、以及导入整个表
  11. c语言程序设计网站有哪些,C语言编程软件有哪些?
  12. wps页眉怎么设置不同页码_wps版word怎么从第二页设置页眉页脚
  13. SQLServer身份证号或手机号字段隐藏某几位显示
  14. keep-alive实现原理
  15. 小程序开发框架_mpvue(六)卡通照片的实现思路
  16. KL,JS,Wasserstein距离
  17. CSS2:宽度与高度疑难点解析
  18. 三一重能科创板上市:年营收102亿 梁稳根持股为56.7%
  19. 管理员中心-权限部分用户故事
  20. ORACLE RAC+DG(单实例)

热门文章

  1. C ++中的POD类型是什么?
  2. Oracle微服务框架 Helidon尝鲜(一)!~
  3. BZOJ5319 洛谷4559 LOJ2551:[JSOI2018]军训列队——题解
  4. 让按钮倒计时5秒以后才能再次点击提交 倒计时按钮
  5. 文件及文件夹更改通知/监测软件TheFolderSpy
  6. 温故一下Linux CentOS的VI/VIM命令
  7. Flask驱动的静态站点生成器(译)
  8. PHP 之 函数 sprintf() 的学习
  9. centos 查看mysql 服务器配置_在CentOS上MySQL数据库服务器配置方法
  10. mysql 二十条记录_记 MySQL优化 20条