NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)

[1] Complex Gated Recurrent Neural Networks

Moritz Wolter, Angela Yao

University of Bonn, National University of Singapore

https://papers.nips.cc/paper/8253-complex-gated-recurrent-neural-networks.pdf

复数在数字信号处理中起了非常重要的作用，但是复数表示在深度学习结构中很少出现。

循环神经网络，在时间序列和序贯信息中广泛使用，这种网络结合复数表示会从中得益许多。这篇文章提出一种新的复数域门限循环单元，这种单元利用门限机制结合了复数域和保范数的状态变换。所得RNN稳定性非常好，并且收敛性也较好，在人工合成的记忆以及加法任务中表现卓越，在人类姿势预测中效果也较好。

该论文的主要贡献如下

相关导数计算方式及链式法则如下

激活函数Hirose表达式如下

激活函数modRELU的表达式如下

两种函数的等值表面图如下

本文方法跟其他两种方法在两种问题上的效果对比如下

其中1对应的论文为

Unitary evolution recurrent neural networks, ICML 2016

4对应的论文为

Learning phrase representations using RNN encoder–decoder for statistical machine translation, EMNLP 2014

40对应的论文为

Full-capacity unitary recurrent neural networks, NIPS 2016

代码地址

https://github.com/stwisdom/urnn

非线性与保范数状态转换矩阵对cgRNN的影响对比如下

人类姿势识别中的效果对比如下

其中28对应的论文为

On human motion prediction using recurrent neural networks. CVPR 2017

代码地址

https://github.com/v0lta/Complex-gated-recurrent-neural-networks

[2] Bias and Generalization in Deep Generative Models: An Empirical Study

Shengjia Zhao, Hongyu Ren, Arianna Yuan, Jiaming Song, Noah Goodman, Stefano Ermon

Stanford University

https://papers.nips.cc/paper/8277-bias-and-generalization-in-deep-generative-models-an-empirical-study.pdf

在高维空间中，密度估计算法主要依赖归纳偏差。虽然深度学习在经验上是成功的，但是深层生成模型的归纳偏差并没有得到很好的理解。

这篇文章提出一种框架，该框架能够系统的分析深层生成模型用于图像时的偏差和泛化能力。受到认知心理学中实验方法的启发，作者们利用精心设计的训练数据集探索每个学习算法，用来研究现有模型何时以及如何生成新的属性及其组合。

作者们确定了这些模式与人类心理学的相似之处，并验证了这些模式在常用模型和体系结构中是否一致。

本文研究的问题图示如下

训练和生成的结果图示如下

GAN/VAE的precision和recall在两个数据集上的对比如下

代码地址

https://github.com/ermongroup/BiasAndGeneralization

[3] Transfer of Deep Reactive Policies for MDP Planning

Aniket Bajpai, Sankalp Garg, Mausam

Indian Institute of Technology, Delhi

https://papers.nips.cc/paper/8293-transfer-of-deep-reactive-policies-for-mdp-planning.pdf

不依赖域的概率规划方法以诸如PPDDL（Probabilistic Planning Domain Description Language）或RDDL（Relational Dynamic Influence Diagram Language ）之类的因式表示语言输入MDP（Markov Decision Processes）描述，并利用该表示的细节来加快规划。

传统算法独立地对每个问题实例进行操作，在这些算法中不存在用于将经验从域的其他实例的策略转移到新实例的好方法。

最近，研究人员已经开始探索将深度强化学习（RL）训练的深度反应策略用于MDP规划领域。深层反应政策的优势之一在于它们更适合迁移学习。

在本文中，作者们提出了第一个与RDDL表示中表达的MDP规划域的域独立传输算法。本文的体系结构利用域的符号状态配置和转换功能，这些可以通过RDDL获得，来学习域的所有问题实例的状态和状态 - 动作对的共享嵌入空间。

然后，作者们在嵌入空间中学习RL代理，使得近乎零镜头的传输成为可能，如此一来，对新实例没有太多训练，并且根本不使用域模拟器。三个不同基准域上的实验强调了本文传输算法的价值。与从零开始的规划和最先进的RL传输算法相比，本文的传输解决方案具有显著优越的学习曲线。

本文的主要贡献如下

其中TORPIDO 为Transfer of Reactive Policies Independent of Domains

本文的模型框架如下

其中SE为state encoder

Tr为transition module

RL为RL module

IC为instance classifier

SAD为action decoder

几种方法的效果对比如下

其中A3C为 Asynchronous Advantage Actor-Critic，是一种deep RL engine

A2T为 Attend-Adapt-Transfer，是一种deep RL transfer algorithm

几种方法的学习曲线对比如下

各个元素带来的增量值对比如下

容易看出SAD带来的增量效果最显著

代码地址

https://github.com/dair-iitd/torpido

我是分割线

NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)相关推荐

无需训练 RNN 或生成模型，如何编写一个快速且通用的 AI “讲故事”项目？
作者 | Andre Ye 译者 | 弯月,责编 | 郭芮头图 | CSDN 下载自视觉中国出品 | CSDN(ID:CSDNnews) 以下为译文: 这段日子里,我们都被隔离了,就特别想听故事. ...
无需训练RNN或生成模型，我写了一个AI来讲故事
作者 | Andre Ye 译者 | 弯月出品 | AI科技大本营(ID:rgznai100) 这段日子里,我们都被隔离了,就特别想听故事.然而,我们并非对所有故事都感兴趣,有些人喜欢浪漫的故事,他 ...
3分钟看完一篇论文，这个AI文本生成模型把今年NeurIPS 2300+篇总结了个遍
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达行早发自凹非寺量子位报道 | 公众号 QbitAI 今年Ne ...
深度学习系列27：VAE生成模型
1. AE AE(Autoencoder),自动编码器.自编码器的初衷是为了数据降维,假设原始特征x维度过高,那么我们希望通过编码器E将其编码成低维特征向量z=E(x),编码的原则是尽可能保留原始信息 ...
自然语言处理深度生成模型相关资源、会议和论文分享
本资源整理了自然语言处理相关深度生成模型资源,会议和相关的一些前沿论文,分享给需要的朋友. 本资源整理自:https://github.com/FranxYao/Deep-Generative-Mod ...
JCIM| 基于双向RNN的分子生成模型
今天给大家介绍的是被誉为"欧陆第一名校"苏黎世联邦理工学院(ETH Zurich)化学与应用生物科学系博士生Francesca Grisoni和制药行业顾问Gisbert Schn ...
AI做不了“真”3D图像？试试Google的新生成模型
编译 | 若名出品 | AI科技大本营用 AI 生成逼真三维物体模型并不像人们以为的那么困难. 近日,在 NeurIPS 2018 会议上接收的论文" 视觉对象网络:图像生成与分离式的3 ...
《预训练周刊》第6期：GAN人脸预训练模型、通过深度生成模型进行蛋白序列设计
No.06 智源社区预训练组预训练研究观点资源活动关于周刊超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第6期< ...
扩散模型与生成模型详解
扩散模型与其他生成模型什么是扩散模型扩散模型的简介生成建模是理解自然数据分布的开创性任务之一.VAE.GAN和Flow系列模型因其实用性能而在过去几年中占据了该领域的主导地位.尽管取得了商业上的 ...

NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)

NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)相关推荐

最新文章

热门文章