丰色 发自 凹非寺
量子位 | 公众号 QbitAI

没想到,图像生成领域的大明星——

扩散模型,这么快就被用来做蛋白质结构生成了!

而且结果在复杂度和结构上都和天然蛋白质有的一拼。

消息一出,不少人都称赞这个组合简直非常妙。

还有人表示:我早就猜到了,生成模型能做的真的不仅是图像和视频。

所以,AlphaFold这是可能有新的挑战者了?

具体是怎么回事?

来看看斯坦福大学和微软的这项最新研究成果到底怎么说。

扩散模型vs蛋白质结构生成

说起研究的初衷,作者表示:

尽管蛋白质结构预测已经取得了非常好的成绩,但要从神经网络中直接生成多结构多样又新颖的蛋白质结构仍然很困难。

他们想到用基于扩散的生成模型来挑战这一任务,并通过镜像蛋白质自然折叠过程来设计蛋白质主链结构。

具体来说,就是将蛋白质主链结构看成一系列连续的角度,这些角度会捕捉组成氨基酸残基的相对方向。

进而通过从随机、未折叠状态到稳定折叠结构的去噪就可以生成新结构。

作者表示,这一设计不仅可以反映蛋白质如何在生物学上扭曲成能量上有利的结构(how proteins biologically twist into energetically favorable conformations),这种表示的固有位移和旋转不变性也可以极大地减轻模型对复杂等变网络的需要。

在实现上,作者仅用一个简单的transformer作为backbone就训练出了一个去噪扩散概率模型。

最终证明它可以无条件地生成高度真实的蛋白质结构,其复杂性和结构模式类似于天然蛋白质的结构模式。

如下图Ramachandran plot(拉氏图,专门用于检测蛋白质构象是否合理)所示,左右分别为测试集和生成的蛋白质主干的(φ,ψ)二面角。

可以看到,三个主要结构元素、以及一些不太常见的角度组合都在他们用扩散模型生成的主干中得到了呈现。

目前,基于以上成果,作者已公开发布了首个用于蛋白质结构扩散的开源代码库和训练模型,详情可戳文末链接。

不过,作为一个初步探索,他们也指明这项成果还存在几个局限性,比如:

1、与通常有几百个残基的天然蛋白质相比,模型生成的结构仍然相对较短(最多128个残基);

2、由于没有处理多链复合物或配体相互作用,模型无法捕获蛋白质的动态性质,只能生成静态结构;

3、将蛋白质表述为一系列角度的框架设计会造成一些累积误差,最终显著改变生成的整体结构。

最后一个问题则可以对未来工作提供思路,比如试着用几何信息架构中使用的方法来解决相关问题。

最后,除了再次刷新我们对扩散模型的认知,一位毕业于ETH的研究人员看完这项成果后还大胆预测道:

未来5年内,可能渐渐没有人会对全新的蛋白质序列或折叠感到兴奋了。

因为潜在的新酶和治疗性抗体将通过文本提示生成

对于这项成果,你有什么想说的?

论文地址:
https://arxiv.org/abs/2209.15611

代码:
https://github.com/microsoft/foldingdiff

妙啊!用扩散模型生成蛋白质结构,结果不输天然蛋白质|来自斯坦福微软相关推荐

  1. 图像生成之扩散模型:靠加入类别条件,效果直达SOTA

    来源:AI蜗牛车 本文约1300字,建议阅读7分钟 比GAN更真实.还懂全景局部多角度构图. OpenAI去年年末推出的新作GLIDE,又让扩散模型小火了一把. 这个基于扩散模型的文本图像生成大模型参 ...

  2. 图像生成王者不是GAN?扩散模型最近有点火:靠加入类别条件,效果直达SOTA

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI OpenAI刚刚推出的年末新作GLIDE,又让扩散模型小火了一把. 这个基于扩散模型的文本图像生成大模型参数规模更小,但生成的图像质量却更高 ...

  3. 不用GAN、VAE,谷歌发明视频生成的扩散模型,实现新SOTA

    关注公众号,发现CV技术之美 本文转自机器之心,编辑:杜伟.陈萍. 扩散模型正在不断的「攻城略地」. 扩散模型并不是一个崭新的概念,早在2015年就已经被提出.其核心应用领域包括音频建模.语音合成.时 ...

  4. 李沐论文精读系列五:DALL·E2(生成模型串讲,从GANs、VE/VAE/VQ-VAE/DALL·E到扩散模型DDPM/ADM)

    文章目录 一. 前言 1.1 DALL·E简介 1.2 DALL·E2简介 1.3 文生图模型进展 二. 引言 2.1 摘要 2.2 引言&模型结构 三. 算法铺垫 3.1 GANs 3.2 ...

  5. 使用扩散模型从文本提示中生成3D点云

    点击进入->3D视觉工坊学习交流群 摘要 虽然最近关于根据文本提示生成 3D点云的工作已经显示出可喜的结果,但最先进的方法通常需要多个 GPU 小时来生成单个样本.这与最先进的生成图像模型形成鲜 ...

  6. 1. 深度生成模型-扩散模型(非均衡热力学的深度无监督学习)

    扩散模型:利用非均衡热力学的深度无监督学习 Deep Unsupervised Learning using Nonequilibrium Thermodynamics 扩散模型:利用非均衡热力学的深 ...

  7. 证件照转数字人只需几秒钟,微软实现首个3D扩散模型高质量生成效果,换装改形象一句话搞定 | CVPR 2023...

    转载自 微软亚洲研究院 量子位 | 公众号 QbitAI 一张2D证件照,几秒钟就能设计出3D游戏化身! 这是扩散模型在3D领域的最新成果.例如,只需一张法国雕塑家罗丹的旧照,就能分分钟把他" ...

  8. OpenAI新研究:扩散模型在图像合成质量上击败BigGAN,多样性还更佳

    来源:AI科技评论本文约3600字,建议阅读5分钟本文介绍了OpenAI新研究:扩散模型在图像合成的最新技术. 新模型在ImageNet512×512上实现了3.85FID,甚至在每个样本只有25次正 ...

  9. 扩散模型的基本内容介绍

    点击上方"AI公园",关注公众号,选择加"星标"或"置顶" 作者:Ryan O'Connor 编译:ronghuaiyang 导读 本文从原 ...

最新文章

  1. Qt消息机制与window程序消息的对比分析
  2. JS模块化编程require.js简介
  3. php修改数据库字段为空,为何修改信息后数据库表中内容为空
  4. 项目中最困难的部分_微服务最难的部分是什么? 您的资料
  5. **【校招速递】入职鹅厂,算法大赛优秀选手开启职场新生活**
  6. Bailian2688 求字母的个数【输入流】
  7. opencv 训练人脸对比_Page21-树莓派4B人脸检测与识别(opencv)
  8. 快速中值滤波利用VC++和OpenCV调用其封装的动态链接库出现的错误和处理
  9. 左移寄存器vhdl_用VHDL实现的通用循环移位寄存器
  10. linux自动实现项目跑,利用Linux中的crontab实现分布式项目定时任务功能
  11. GIS中坐标系的基本概念
  12. Windows下Scintilla的编译,使用
  13. 关于上兴远程监控的使用
  14. Unity 本地化比较实用的实现方案
  15. 软件测试---UI界面测试点
  16. hdmi线推荐微型计算机,几款高清线对比下来,这款mini dp转HDMI最实用
  17. 【总目录】人工智能、机器学习、深度学习总结大全----目录.未完待续...
  18. MBR与GPT分区扫盲,希捷2T、3T硬盘测评(多图杀猫)
  19. 矮子当中的巨人,让你在面试者中脱颖而出
  20. 笔记本电脑移动办公平台网络解决方案

热门文章

  1. 程序自动化 linux_自动化Windows子系统Linux安装程序
  2. chromium笔记
  3. Android自动化测试之MonkeyRunner MonkeyDevice MonkeyImage API使用详解 脚本编写 脚本录制回放
  4. JMeter 5.0安装配置(win10)
  5. 坚持写博客以来的感受和改变
  6. Tensorflow入门——自制数据集:将未经处理的图片制成npy格式的数据集
  7. 服务器挂微信显示登陆异常怎么办,王者荣耀微信大区登录异常怎么办 王者荣耀微信提示网络繁忙/登录失败如何解决...
  8. Android10无法访问根目录文件解决
  9. Threaded Binary Tree
  10. 【NIPS2018】实时联合目标检测与语义分割网络