Normalizing Flows (NF) - 流模型 - 研究方向
Normalizing Flows: An Introduction and Review of Current Methods (2020 TPAMI)
Open problems and possible research directions
NFs研究方向
Inductive biases (归纳性偏置) | |
role of the base measure (基准测量的作用) | |
Form of diffeomorphisms (微分同胚的形式) | |
loss function |
|
Generalisation to non-Euclidean spaces(非欧几里得空间的泛化) | |
flows on manifolds |
|
discrete distributions (离散分布) 去量化dequantization,(即在离散数据中加入噪声,使其成为连续数据) |
1. Inductive biases (归纳性偏差)
1.1 role of the base measure (基准测量的作用)
一般来说,normalizing flow的基本度量被认为是一个简单的分布(例如,uniform或高斯)。然而,这并不需要是这样的。任何我们可以轻松抽取样本并计算出对数概率密度函数log probability density function都是可能的,这个分布的参数可以在训练中学习。
理论上说,base measure不应该是重要的:任何可以计算出CDF的分布都可以成为任何可以计算出 CDF 的分布,都可以通过应用inverse CDF 来模拟simulate。然而,在实践中,如果structure在base measure中被提供,所产生的变换可能会变得更容易学习。换句话说,base measure的选择可以被看作是对分布的一种先验或归纳偏见其本身也可能是有用的。例如,[Jaini等人,2019b]在建模尾部行为modelling tail behaviour的背景下探讨了生成转换的复杂性和base measure的形式之间的trade-off。
1.2 Form of diffeomorphisms (微分同胚的形式)
探索的大部分flows是三角流triangular flows(耦合coupling或自回归架构autoregressive)。Residual networks和neural ODEs 也正在积极研究和应用。一个自然的问题是:有没有其他有效的微分同胚建模model diffeomorphisms方法计算?架构有什么归纳偏差可以施加?例如,斯潘蒂尼等人[2017] 调查三角流的稀疏性与目标分布的马尔可夫性质。
一个相关的问题是,当人们需要学习a conditional probability distribution时,如何以最佳方式建立conditional normalizing flows? 特里佩和特纳[2017] 建议对每个条件使用不同的flows,但是这种方法没有利用权重共享weigt sharing,所以在内存和数据使用方面效率低下。阿塔诺夫等[2019] 提出使用仿射耦合层affine coupling layer,其中参数 θ 取决于条件。条件分布特别适用于时间序列建模,其中需要找到 p(yt|y<t) [Kumar et al., 2019]。
1.3 loss function
大多数现有的flows是通过minimization源分布source和目标分布target distribution之间的KL-divergence来训练的(或者,等同于,用对数可能性最大化log-likelihood maximization)。然而,也可以使用其他损失,这将使normalizing flows在更广泛的最优传输理论optimal transport theory的背景下进行。在这个方向上已经完成了有趣的工作包括Flow-GAN和Wasserstein距离的最小化minimization,suggested by[Arjovsky等人,2017;Tolstikhin等人,2018]。
2. Generalisation to non-Euclidean spaces(非欧几里得空间的泛化)
2.1 flows on manifolds (
在manifolds上modelling probability distributions在许多领域都有应用,包括机器人学、分子生物学、光学、流体力学和等离子体物理学。如何更好地在一个general differentiable manifold上面构建一个normalizing flow仍然是一个开放的问题。在manifold上应用normalizing flow framework的一种方法是,在欧氏空间上找到一个基分布base distribution,并将其转移到manifold of interest。有两种主要的方法。1)将manifold嵌入Euclidean space,并 "restrict "the measure。或者2)induce the measure from the tangent。我们将依次简要地讨论这两种方法。
2.2 discrete distributions (离散分布)
对离散空间上的分布进行建模很重要,然而,在一系列问题中,将normalizing flows推广到离散分布仍然是一个在实践中开放的问题。离散潜变量discrete latent variables由丁等人[2019] 作为沿着分段双射映射piece-bijective map推进连续随机变量continuous random variables的辅助工具。 但是,如果我们的一个或两个分布是离散的, 我们可以定义normalizing flows吗? 这对许多应用是有用的,包括自然语言建模、图的生成和其他。
为此,Tran等人[2019] 在有限集合finite set上建立了双射函数模型 model bijective functions,并表明在这种情况下,变量的变化the change of variables由以下公式给出:pY(y) = pZ(g-1(y)),即,没有雅各布项Jacobian term(与定义1比较)。对于具有离散变量的函数的反向传播,他们使用直通梯度估计器straight-through gradient estimator. 然而,这种方法不能扩展到具有大量元素的分布。
另外,Hoogeboom等人[2019b]在ZD上直接建立加性耦合层additive coupling layers的双射bijections模型。其他方法将离散变量discrete variable转化为连续潜伏变量continuous latent variable,然后在连续潜势空间中continuous latent space中应用normalizing flows。
一种不同的方法是去量化dequantization,(即在离散数据中加入噪声,使其成为连续数据),它可以用于序数变量ordinal variables,如离散的像素强度discretized pixel intensities。噪声可以是均匀的uniform,但也可以是其他形式同时这种非量化甚至可以作为一个潜在的变量latent variable模型被学习。Hoogeboom等人[2020]分析了不同选择的去量子化目标和去量子化分布的不同选择对性能的影响。
Normalizing Flows (NF) - 流模型 - 研究方向相关推荐
- Normalizing Flows for Probabilistic Modeling and Inference翻译
摘要 normalizing flows提供了一种定义复杂概率分布的通用机制,仅需要指定一个基本分布(非常简单)和一系列双映射变换.最近有很多关于使用normalizing flows的工作,范围从提 ...
- 点云生成-PointFlow: 3D Point Cloud Generation with Continuous Normalizing Flows
点云生成-PointFlow: 3D Point Cloud Generation with Continuous Normalizing Flows 简介 论文 摘要 1.introduction ...
- 人脸和宇宙是啥关系?看物理学家怎样用重整化群流模型重新理解视觉
导语 深度学习技术,尤其是生成模型在图像问题处理上大放异彩. 而生成模型之所以展现出强大的多层信号处理能力,与物理学中的重整化群理论密切相关.研究者结合重整化群方法和流模型,开发出可以发现自然作用力的 ...
- RealNVP与Glow:流模型的传承与升华
作者丨苏剑林 单位丨广州火焰信息科技有限公司 研究方向丨NLP,神经网络 个人主页丨kexue.fm 话在开头 在上一篇文章细水长flow之NICE:流模型的基本概念与实现中,我们介绍了 flow 模 ...
- 细水长flow之NICE:流模型的基本概念与实现
作者丨苏剑林 单位丨广州火焰信息科技有限公司 研究方向丨NLP,神经网络 个人主页丨kexue.fm 前言:自从在机器之心上看到了 Glow 模型之后(下一个GAN?OpenAI提出可逆生成模型Glo ...
- 论文推荐 | 综述:自动驾驶背景下的交通流模型研究
导读 题目:<Automated vehicle-involved traffic flow studies: A survey of assumptions, models, speculat ...
- html流动模型,javascript的事件流模型都有什么?
事件流:当你在页面触发一个点击事件后,页面上不仅仅有一个元素响应该事件而是多个元素响应同一个事件,因为元素是在容器中的.事件发生的顺序就是事件流,不同的浏览器对事件流的处理不同. JavaScript ...
- 交通流模型仿真(Traffic flow)
交通流模型,主要包括:宏观模型.微观模型.混合模型 交通模拟的一个 重要部分:是在不同的细节水平上描述车辆的运动.交通流建模与仿真的早期研究可以追溯到20世纪50年代,当时分别提出了宏观交通模型.微观 ...
- 【生成模型】简述概率密度函数可处理流模型
本期将介绍第二种非常优雅的生成模型-流模型,它也是一种概率密度函数可处理的生成模型.本文将对其原理进行介绍,并对nice模型的源码进行讲解. 作者&编辑 | 小米粥 1 流模型 这是一种想法比 ...
最新文章
- http和ftp下载的区别
- git之工作区、版本区、远程仓库之间相互操作
- openstack 使用集锦
- Linux电源管理(5)_Hibernate和Sleep功能介绍【转】
- 【mysql】显式加锁
- ios弧形进度条_iOS手把手教你实现圆形进度条
- 大数据时代能否保证足够的安全
- 面试官解答:BAT等大厂最需要怎样的程序员
- React-Native 双平台应用的测试发布和 CodePush 热更新部署
- 均方根误差RMSE 均方根值(RMS)+ 均方根误差(RMSE)+标准差(Standard Deviation)
- 视频剪辑软件产品调研分析
- 2022美团CTF个人决赛WP
- jsp获取服务器中信息,jsp 获取服务器主机名
- C# richTextBox的换行分页打印
- 一个简单的连续变焦红外镜头的从零开始的设计过程(zemax)(二)进一步优化,公差分析
- Linux sed在某行前一行和后一行添加内容
- gsoap 命令参数介绍(wsdl2和soapcpp)
- 按键精灵打怪学习-自动回城路线的判断
- 上海大学计算机学院邢稹,【CES·毕业季】学霸寝室||相约一起“上岸”,我们是最亲密的战友!...
- 微信小程序-公廉租房维保系统