作者:北京大学博士后 刘钰

图生成模型(Graph Generative Models)是复杂网络和图数据管理领域近几十年来的研究热点之一,其主要研究符合真实应用图数据结构性质的随机图生成模型、快速生成算法以及真实图的相关性质等。

其中,过去几十年的研究主要关注传统图模型,即通过对真实图性质的观察、分析和建模,提出一些图生成机制、模型和算法,并证明模型符合的某些重要性质(如度分布的幂律性质)。

传统图模型的优点在于揭示了某种真实图重要的结构性质,并且已有较多面向大规模图生成的高效算法;然而,其缺点在于仅能建模少量图性质,生成的随机图与真实应用图数据在图结构性质上有较大差距。

代表性图模型包括Endos-Renyi(ER)图、Stochasticblock模型、基于Preferential Attachment的图模型(如Barabasi-Albert模型)、递归图模型(如R-MAT和Kronecker图模型)等。例如,Stochasticblock模型建模了真实图的多社区性质;Barabasi-Albert(BA)模型建模了真实图的幂律度分布性质;递归图模型主要关注图的层叠社区(communities-within- communities)性质。

与此不同的是,近几年随着深度学习和图表示学习的发展,图模型领域与深度生成模型(Deep Generative Models)产生结合,不少研究提出了深度图生成模型(Deep Graph Generative Models)。通过对一系列(假设取自同一分布的)训练图数据进行学习,得到某个神经网络作为图生成模型。总体来讲,根据采用的深度生成模型技术,可大致分为基于variational encoder的模型、基于GAN的模型和autoregressive模型。

基于variational encoder的代表性工作是GraphVAE,其通过encoder-decoder结构对训练图进行学习。

基于GAN的模型如MolGAN将图结构与生成对抗网络结合。其生成器以一个随机噪声向量为输入,通过多层感知机(MLP)实现;而判别器以图神经网络实现(如GCN和R-GCN),并通过节点向量聚合得到图向量(graph-level embedding)作为判别器的输入。

自回归(autoregressive)图模型的代表性工作如基于RNN的模型GraphRNN。其假设每个节点及其所有邻居是顺序插入图的,故使用一个图层面的RNN序列建模当前图的信息,并在每次新节点插入后更新;用一个边层面的RNN序列建模每个节点的邻居信息。

目前,基于自回归模型的代表性工作(state of the art)是Google在ICML 2020发表的BiGG模型。其基本图模型假设与GraphRNN类似(即节点顺序插入),基本思路包括(1)利用递归图模型的思想,对每个节点的邻接表使用树状结构生成以降低复杂度;(2)将所有节点的邻接表生成用自回归方式实现。

具体来讲,对每个节点的邻居(即邻接矩阵中的某一行),将其生成过程建模成一棵树。对每个树节点,使用bottom向量表示其子树中的所有结构信息,而使用top向量表示从父节点得到的全部(先验)信息,例如已生成的部分图的信息。模型使用树状LSTM(Tree-LSTM)组织树状递归网络。

为了在不同节点的邻接表间建立自回归结构,模型仍然以类似森林的层级结构为基础,将每个树根的bottom向量作为叶子节点,使用LSTM建立节点之间的关系。

为了对训练过程进行加速,论文仔细分析了可并行执行的操作。其关键在于,对于树结构的每一层,基本可以并行计算。论文也考虑了多GPU间并行的技术细节。

然而,对于模型推断阶段,即图生成阶段,只能使用串行方式进行;这是因为模型生成过程中任一树节点的右孩子生成(top向量)依赖于左孩子生成后提供的结构化信息。

在实验验证部分,论文使用了类似GraphRNN的衡量标准Meximum MeanDiscrepancy(MMD),结果表明在小规模图上算法的效果更优:

此外,模型还验证了其扩展性。该模型是目前扩展性最好的深度图生成模型,可生成约10万个点的图。

论文导读 | 深度图生成模型简介相关推荐

  1. 论文导读 | 图生成模型综述

    北京大学 叶心怡 问题定义: 生成有真实世界中的图的性质的图 真实世界中图的性质: ThePowerLaw:真实世界中图的度分布多为幂律分布.即顶点的度是i的概率与成正比.检查是否符合ThePower ...

  2. 基于流的(Flow-based)生成模型简介

    基于流的(Flow-based)生成模型简介 生成任务 我们先回顾一下所谓的生成任务,究竟是做什么事情.我们认为,世界上所有的图片,是符合某种分布 pdata(x)p_{data}(x)pdata​( ...

  3. Generative Models(生成模型)简介

    著名物理学家费曼说过: What I cannot create, I do not understand. 所以我们要真正做到了解图像影音等,就必须要能创造它们. Pixel RNN 收集一大堆图片 ...

  4. 【论文阅读-3】生成模型——变分自编码器(Variational Auto-Encoder,VAE)

    [论文阅读]生成模型--变分自编码器 1. VAE设计思路:从PCA到VAE 1.1 PCA 1.2 自编码器(Auto-Encoder, AE) 1.3 从AE到VAE 2. VAE模型框架 2.1 ...

  5. ACM SIGKDD | MoFlow:基于流的分子图生成模型

    今天给大家介绍的是康奈尔大学医学院(Weill Cornell Medicine)健康科学系(Department of Population Health Sciences)的博士后研究助理臧承熙于 ...

  6. Nat. Biotech.|药物设计的AI生成模型

    今天介绍2020年1月30日发表在Nature Biotechnology上的评论,作者为Relay Therapeutics公司的Walters和Murcko,该论文评价了当前几种基于AI的药物生成 ...

  7. 《预训练周刊》第14期:World-GAN:Minecraft 世界的生成模型、CMU博士论文探究可控文本生成...

    No.14 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第14期&l ...

  8. 李沐论文精读系列五:DALL·E2(生成模型串讲,从GANs、VE/VAE/VQ-VAE/DALL·E到扩散模型DDPM/ADM)

    文章目录 一. 前言 1.1 DALL·E简介 1.2 DALL·E2简介 1.3 文生图模型进展 二. 引言 2.1 摘要 2.2 引言&模型结构 三. 算法铺垫 3.1 GANs 3.2 ...

  9. LoveLive!出了一篇AI论文:生成模型自动写曲谱

    视学算法报道 编辑:泽南.小舟 我们终于知道那些折磨人的乐谱是怎么来的了 -- 都是 AI 生成的. 知名偶像企划 LoveLive! 发 AI 论文了,是的没错. 最近,预印版论文平台 arXiv ...

最新文章

  1. 通过Spring配置文件中bean中的property赋值
  2. virtualBox使用nat模式下ssh连接
  3. 【转】C++ vector的reserve和resize详解
  4. 【Python】集合的交、并、补、差集怎么算?
  5. [蓝桥杯2019初赛]修改数组-并查集
  6. 在树洞里,渝粤题库在线整理
  7. 程序员都在用的IDEA插件(不断更新)
  8. mysql optimize 参数查看_Mysql High Performance:Optimize Setting
  9. 图像识别 RGB HSV
  10. Android开发笔记(一百六十七)Android8.0的画中画模式
  11. 圣诞好礼之Grid视频
  12. 监督分类空白处也被分类了_如何兼容自训练与预训练:更高效的半监督文本分类模型...
  13. 华为路由与交换 eSight 基本功能学习笔记
  14. acu风格是什么意思_acu 是什么意思,是一个品牌吗???
  15. Ubuntu赋予root权限
  16. 站长VS微商 你选择哪个?
  17. 深入分析QQ键盘保护技术
  18. python是黑客攻防第一语言么_为什么选择python编程语言入门黑客攻防 给你几个理由!...
  19. Spark学习之路 (三)Spark之RDD
  20. 计算机主机放到什么位置最好,电脑桌放在哪个位置好 这些建议你一定要看

热门文章

  1. 关于搜狗双核浏览器2.0
  2. 数据仓库(5)数仓Kimball与Inmon架构的对比
  3. java毕业设计-SpringBoot火车订票管理系统 火车票预订系统
  4. 实例:python爬取某地历史天气预报
  5. 9. 用两个栈实现队列
  6. nginx根据域名转发服务
  7. JS三元运算和多条件运算
  8. html 如何改变图片形状,用css绘制各种形状
  9. Kafka的应用场景
  10. activity工作流流程部署(自动部署与动态BPMN部署)