2022 ICLR | Geodiff:分子构象几何扩散生成模型

温馨提示,扩散模型公式比较复杂,若没有基础可以先参考blog或者deep_thoughts老师的视频


本文是由蒙特利尔学习算法研究所唐建团队于2022 ICLR 发表的一篇论文。在这篇论文中,作者受热力学粒子扩散模型的启发,提出了新的生成模型GEODIFF。GEODIFF将每个原子视为一个粒子,并学会直接逆转扩散过程。在多个基准上的实验表明,GEODIFF优于或可与现有的最先进的方法相媲美,特别是在大分子上。作者还在理论上证明了具有等变马尔可夫核的马尔可夫链可以设计出不变分布,并进一步提出了马尔可夫核的构造块来保持理想的等方差特性。

目前方法存在的问题

目前的方法主要通过利用中间几何变量(如原子距离、键和扭转角)来避免直接建模原子坐标,这些中间几何变量是旋转平移不变量。 因此,他们能够实现非常引人注目的性能。然而,由于所有这些方法都寻求间接建模中间几何变量,它们在训练或推理过程中都有固有的局限性。因此,理想的解决方案仍然是直接建模原子坐标,同时考虑旋转平移不变性。

作者思路
作者从理论上证明了由旋转平移不变先验分布出发,以旋转平移等变马尔可夫核演化的马尔可夫过程可以诱导出旋转平移不变密度函数。进一步提供实用的参数化来定义旋转平移不变先验分布和强加等方差约束的马尔可夫核。此外,还导出了分子构象条件似然的一个加权变分下界,该下界同时具有旋转平移不变性,可以有效地优化。

该方法有几个关键的优点:

  • 模型可以自然地进行端到端训练,而不涉及任何复杂的技术
  • 避免了任何中间误差的积累,因此可以得到更准确的结构预测
  • 模拟复杂构象分布方面具有较高的能力

模型

分子构象生成任务本质上是条件生成问题,作者的目标是对于给定的分子图G生成稳定的分子构象C。

图1:GEODIFF扩散和反向过程示意图

扩散过程

根据固定的方差β,....,βT\beta ,...., \beta_Tβ,....,βT​将其定义为马尔可夫链

其中β是固定的数值, 其时间步t条件概率的近似形式:

逆扩散过程

从噪声粒子CTp(CT)C^T~p(C^T)CT p(CT)开始, 给定特定的分子图ggg, 目标是学习从白噪声CTC^TCT中恢复构象C0C^0C0。

等变反向生成过程

建立对旋转和平移变换不变的密度pθ(C0)p_θ(C^0)pθ​(C0), 形式上,设TgT_gTg​为元素g∈SE(3)g \in SE(3)g∈SE(3)的旋转平移变换,得到如下表述
Proposition 1.

这命题表明,从不变的标准密度出发,沿着等变高斯马尔可夫核的动力学可以产生不变的密度。在此基础上,给出了一种实际的基于扩散去噪框架的GEODIFF算法

Invariant Initial Density
在这种情况下,各向同性高斯显然是围绕zero CoM的旋转的不变性。通过考虑CoM-free系统,将粒子移至zero CoM可以始终确保转化不变性。

Equivariant Markov Kernels
CoM-free高斯函数保证了马尔科夫核的平移不变性。因此,为了实现命题1中定义的等变性质,只关注旋转等方差。

因此,为了保证μθ(g,Ct,t)μ_θ(g,C^t,t)μθ​(g,Ct,t)是旋转-平移等变的w.r.tCtw.r.t C^tw.r.tCt。作者考虑μθμ_θμθ​的以下参数化:

将问题转化为构造ϵθ\epsilon_\thetaϵθ​为旋转平移等变,GFN以节点嵌入hl∈Rn×bh^l \in R^{n \times b}hl∈Rn×b(b为特征维数)和对应的坐标嵌入xl∈Rn×3x^l \in R^{n \times 3}xl∈Rn×3为输入,输出hl+1h^{l+1}hl+1和xl+1x^{l+1}xl+1如下

改进的训练目标

在生成过程和模型参数化之后,开始反向训练目标。由于直接优化对数似然是很困难的,通常做法是最大化变分下界((ELBO)。

下面是公式4的参数化形式:

为了使得ELBO过程具有所需要的等变性,作者提供两种方式修正观测噪音信号。第一种是alignment方式,还有一种chain-rule的方式。

采样

下面是整个采样过程的伪代码。它逐渐地将先前的噪声位置移向平衡态,采样过程本质上是马尔可夫链。

数据集

  • GEQM-QM9
  • GEOM-Drugs

基线

CVGAE,GRAPHDG和CGCF等六种最新的模型作为基线。

结果

构象生成任务

为了测试不同模型所生成构象的质量和多样性。作者评估了建立在两原子坐标矩阵的Frobenius范数基础上的四项指标。

结果显示,GEODIFF在所有的数据集和所有的指标上都比其他的模型表现的要好。


作者使用force field(FF)对结构进行优化,并与同样使用FF进行优化的RDKIT模型进行比较,结果如表3所示。
结果表明GEODIFF+FF有着优越的多样性(Recall metrics)同时显著地提高了准确率(Precision metrics)。

性质预测任务


结果表明:由于性质对于几何结构非常敏感,GEODIFF能够更准确的预测不同分子的构象。

2022 ICLR | Geodiff:分子构象几何扩散生成模型相关推荐

  1. Diffusion Model (扩散生成模型)的基本原理详解(三)Stochastic Differential Equation(SDE)

    本篇是<Diffusion Model (扩散生成模型)的基本原理详解(二)Score-Based Generative Modeling(SGM)>的续写,继续介绍有关diffusion ...

  2. ICLR 2023 | 扩散生成模型新方法:极度简化,一步生成

    ©作者 | 刘星超 单位 | 德州大学奥斯汀分校 研究方向 | 生成式模型 Diffusion Generative Models(扩散式生成模型)已经在各种生成式建模任务中大放异彩,但是,其复杂的数 ...

  3. Diffusion Model (扩散生成模型)的基本原理详解(一)Denoising Diffusion Probabilistic Models(DDPM)

    本章开始笔者来陆续的介绍最近爆火的Diffusion Model的近期发展. 本篇的学习内容与图片均来自于对文章Diffusion Models: A Comprehensive Survey of ...

  4. 由浅入深理解latent diffusion/stable diffusion(2):扩散生成模型的工作原理

    Diffusion Models专栏文章汇总:入门与实战 前言: 关于如何使用stable diffusion的文章已经够多了,但是由浅入深探索stable diffusion models背后原理, ...

  5. 微软提出CoDi:开创性多模态扩散生成模型,实现4种模态任意输入输出

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[多模态和Transformer]交流群 萧箫 发自 凹非寺 转载自:量子位(QbitAI ...

  6. ICLR 2023 | 首个3D人像视频生成模型!仅需1张2D人像,眨眼、口型都能改变

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[计算机视觉]微信技术交流群 zcxu 投稿 转载自:量子位(QbitAI) 只需1张普通 ...

  7. ICLR要搞深度生成模型大讨论,Max Welling和AAAI百万美元大奖得主都来了,Bengio是组织者之一...

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 用深度生成模型搞科学发现,是不少AI大牛最近的研究新动向. 就在最新一届ICLR 2022上,包括Max Welling和Regina Barzi ...

  8. 李沐论文精读系列五:DALL·E2(生成模型串讲,从GANs、VE/VAE/VQ-VAE/DALL·E到扩散模型DDPM/ADM)

    文章目录 一. 前言 1.1 DALL·E简介 1.2 DALL·E2简介 1.3 文生图模型进展 二. 引言 2.1 摘要 2.2 引言&模型结构 三. 算法铺垫 3.1 GANs 3.2 ...

  9. 扩散模型与生成模型详解

    扩散模型与其他生成模型 什么是扩散模型 扩散模型的简介 生成建模是理解自然数据分布的开创性任务之一.VAE.GAN和Flow系列模型因其实用性能而在过去几年中占据了该领域的主导地位.尽管取得了商业上的 ...

最新文章

  1. VS调试时提示此项目已经过期
  2. SpringBoot启动如何加载application.yml配置文件
  3. 成熟就是深谙世故却不世故
  4. ASP.NET Core(十)Configuration 配置优先级详解
  5. 第一次作业-李纯锐201731084433
  6. python的三大错误类型_学习Python时要避免的三个错误
  7. ANT打包时记录本地版本SVN信息
  8. TinyWeb:C#中的简单Web服务器
  9. appium分层自动化的封装
  10. Lucene多字段排序备忘(Sorting by multiple fields)
  11. redis常用命令与常用api
  12. oracle11g数据库登录01017,连接oracle数据库报错ORA-01017、重置用户的密码
  13. Windows下安装Ruby及配置镜像源
  14. 标志设计|标识设计|商标设计|logo设计|的起源
  15. Scratch少儿编程与游戏:圣骑士之魔法森林
  16. pure-ftpd安装与使用
  17. android多个switch可,能刷安卓,任天堂 Switch 再跑个 Win10 如何?
  18. URLEncode原理
  19. Profinet现场总线耦合器模拟量扩展IO
  20. VMware 安装CentOS以及安装多个linux系统

热门文章

  1. C语言程序设计-算数运算符、赋值运算符、逗号运算符及表达式
  2. os的概念,基本特征
  3. 腾讯是如何做Unity手游性能优化的
  4. 广汽丰田-“饮水思源”活动专题网站
  5. 你必须知道的最好的开源WEB 资源
  6. [Python]如何快速知道要使用哪些python模块和有哪些功能
  7. 2017全国计算机二级报考,2017年全国计算机等级考试报考须知
  8. 想靠“免费”搅局智能家居,小度添添智能健身镜凭什么?
  9. 缓存通俗解释_在超市购买牛奶解释了网络缓存
  10. fieldset lengend