NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)
[1] Complex Gated Recurrent Neural Networks
Moritz Wolter, Angela Yao
University of Bonn, National University of Singapore
https://papers.nips.cc/paper/8253-complex-gated-recurrent-neural-networks.pdf
复数在数字信号处理中起了非常重要的作用,但是复数表示在深度学习结构中很少出现。
循环神经网络,在时间序列和序贯信息中广泛使用,这种网络结合复数表示会从中得益许多。这篇文章提出一种新的复数域门限循环单元,这种单元利用门限机制结合了复数域和保范数的状态变换。所得RNN稳定性非常好,并且收敛性也较好,在人工合成的记忆以及加法任务中表现卓越,在人类姿势预测中效果也较好。
该论文的主要贡献如下
相关导数计算方式及链式法则如下
激活函数Hirose表达式如下
激活函数modRELU的表达式如下
两种函数的等值表面图如下
本文方法跟其他两种方法在两种问题上的效果对比如下
其中1对应的论文为
Unitary evolution recurrent neural networks, ICML 2016
4对应的论文为
Learning phrase representations using RNN encoder–decoder for statistical machine translation, EMNLP 2014
40对应的论文为
Full-capacity unitary recurrent neural networks, NIPS 2016
代码地址
https://github.com/stwisdom/urnn
非线性与保范数状态转换矩阵对cgRNN的影响对比如下
人类姿势识别中的效果对比如下
其中28对应的论文为
On human motion prediction using recurrent neural networks. CVPR 2017
代码地址
https://github.com/v0lta/Complex-gated-recurrent-neural-networks
[2] Bias and Generalization in Deep Generative Models: An Empirical Study
Shengjia Zhao, Hongyu Ren, Arianna Yuan, Jiaming Song, Noah Goodman, Stefano Ermon
Stanford University
https://papers.nips.cc/paper/8277-bias-and-generalization-in-deep-generative-models-an-empirical-study.pdf
在高维空间中,密度估计算法主要依赖归纳偏差。虽然深度学习在经验上是成功的,但是深层生成模型的归纳偏差并没有得到很好的理解。
这篇文章提出一种框架,该框架能够系统的分析深层生成模型用于图像时的偏差和泛化能力。受到认知心理学中实验方法的启发,作者们利用精心设计的训练数据集探索每个学习算法,用来研究现有模型何时以及如何生成新的属性及其组合。
作者们确定了这些模式与人类心理学的相似之处,并验证了这些模式在常用模型和体系结构中是否一致。
本文研究的问题图示如下
训练和生成的结果图示如下
GAN/VAE的precision和recall在两个数据集上的对比如下
代码地址
https://github.com/ermongroup/BiasAndGeneralization
[3] Transfer of Deep Reactive Policies for MDP Planning
Aniket Bajpai, Sankalp Garg, Mausam
Indian Institute of Technology, Delhi
https://papers.nips.cc/paper/8293-transfer-of-deep-reactive-policies-for-mdp-planning.pdf
不依赖域的概率规划方法以诸如PPDDL(Probabilistic Planning Domain Description Language)或RDDL(Relational Dynamic Influence Diagram Language )之类的因式表示语言输入MDP(Markov Decision Processes)描述,并利用该表示的细节来加快规划。
传统算法独立地对每个问题实例进行操作,在这些算法中不存在用于将经验从域的其他实例的策略转移到新实例的好方法。
最近,研究人员已经开始探索将深度强化学习(RL)训练的深度反应策略用于MDP规划领域。深层反应政策的优势之一在于它们更适合迁移学习。
在本文中,作者们提出了第一个与RDDL表示中表达的MDP规划域的域独立传输算法。本文的体系结构利用域的符号状态配置和转换功能,这些可以通过RDDL获得,来学习域的所有问题实例的状态和状态 - 动作对的共享嵌入空间。
然后,作者们在嵌入空间中学习RL代理,使得近乎零镜头的传输成为可能,如此一来,对新实例没有太多训练,并且根本不使用域模拟器。三个不同基准域上的实验强调了本文传输算法的价值。与从零开始的规划和最先进的RL传输算法相比,本文的传输解决方案具有显著优越的学习曲线。
本文的主要贡献如下
其中TORPIDO 为Transfer of Reactive Policies Independent of Domains
本文的模型框架如下
其中SE为state encoder
Tr为transition module
RL为RL module
IC为instance classifier
SAD为action decoder
几种方法的效果对比如下
其中A3C为 Asynchronous Advantage Actor-Critic,是一种deep RL engine
A2T为 Attend-Adapt-Transfer,是一种deep RL transfer algorithm
几种方法的学习曲线对比如下
各个元素带来的增量值对比如下
容易看出SAD带来的增量效果最显著
代码地址
https://github.com/dair-iitd/torpido
我是分割线
您可能感兴趣
AAAI2020|结合时空信息的分层注意力网络在大规模社交网络中的应用
ICDE2020|基于深度学习的关系抽取
只有正样本和无标签样本时如何构建分类器
ICDE2020|图卷积网络在价格感知推荐中的应用
WSDM2020|基于强化学习的多轮对话推荐系统(EAR, 即将开源)
WWW2020|如何利用未来数据协助训练基于会话的推荐(GRec)
ICML2018|基于自注意力的序列推荐模型SASRec(已开源)
IJCAI2018|分层时空LSTM在位置预测中的应用(HST-LSTM)
IJCAI2019|基于会话和注意力机制的CTR预估模型DSIN(已开源)
AISTATS2018|密歇根大学提出新型在线boosting算法用于多标签排序(已开源)
AAAI2020|一种新型高效兼容多行为的推荐系统模型EHCF(已开源)
ICML2007|深度学习用于协同过滤的开篇作之一(出自深度学习鼻祖之一Hinton)
SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)
SIGIR2019|深度学习如何更好地用于学习排序(LTR)(已开源)
SIGIR2019|利用DeepSHAP来解释神经检索模型(已开源)
KDD2018|基于GBM的动态定价回归模型
KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)
RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET
SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)
IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN
聊聊CatBoost
聊聊XGBoost CatBoost LightGBM RF GBDT
顶会中深度学习用于CTR预估的论文及代码集锦 (3)
ICML 2018 深度学习论文及代码集锦(5)
深度学习用于文本摘要的论文及代码集锦
深度学习用于机器翻译的论文及代码集锦
深度学习用于序列标注中的论文及代码集锦
深度学习在推荐系统中的应用及代码集锦(4)
深度学习在OCR中的应用论文及代码集锦 (2)
NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)相关推荐
- 无需训练 RNN 或生成模型,如何编写一个快速且通用的 AI “讲故事”项目?
作者 | Andre Ye 译者 | 弯月,责编 | 郭芮 头图 | CSDN 下载自视觉中国 出品 | CSDN(ID:CSDNnews) 以下为译文: 这段日子里,我们都被隔离了,就特别想听故事. ...
- 无需训练RNN或生成模型,我写了一个AI来讲故事
作者 | Andre Ye 译者 | 弯月 出品 | AI科技大本营(ID:rgznai100) 这段日子里,我们都被隔离了,就特别想听故事.然而,我们并非对所有故事都感兴趣,有些人喜欢浪漫的故事,他 ...
- 3分钟看完一篇论文,这个AI文本生成模型把今年NeurIPS 2300+篇总结了个遍
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 行早 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今年Ne ...
- 深度学习系列27:VAE生成模型
1. AE AE(Autoencoder),自动编码器.自编码器的初衷是为了数据降维,假设原始特征x维度过高,那么我们希望通过编码器E将其编码成低维特征向量z=E(x),编码的原则是尽可能保留原始信息 ...
- 自然语言处理深度生成模型相关资源、会议和论文分享
本资源整理了自然语言处理相关深度生成模型资源,会议和相关的一些前沿论文,分享给需要的朋友. 本资源整理自:https://github.com/FranxYao/Deep-Generative-Mod ...
- JCIM| 基于双向RNN的分子生成模型
今天给大家介绍的是被誉为"欧陆第一名校"苏黎世联邦理工学院(ETH Zurich)化学与应用生物科学系博士生Francesca Grisoni和制药行业顾问Gisbert Schn ...
- AI做不了“真”3D图像?试试Google的新生成模型
编译 | 若名 出品 | AI科技大本营 用 AI 生成逼真三维物体模型并不像人们以为的那么困难. 近日,在 NeurIPS 2018 会议上接收的论文" 视觉对象网络:图像生成与分离式的3 ...
- 《预训练周刊》第6期:GAN人脸预训练模型、通过深度生成模型进行蛋白序列设计
No.06 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第6期< ...
- 扩散模型与生成模型详解
扩散模型与其他生成模型 什么是扩散模型 扩散模型的简介 生成建模是理解自然数据分布的开创性任务之一.VAE.GAN和Flow系列模型因其实用性能而在过去几年中占据了该领域的主导地位.尽管取得了商业上的 ...
最新文章
- 简单几步让CentOS系统时间同步
- 请收下这份NLP热门词汇解读
- MATLAB把型线图画静水力曲线,静水力曲线图
- J2EE中一些常用的名词【简】
- Concurrent包工具类使用
- 在分析了47,251个依赖关系之后,2016年排名前100的Java库
- java定时器克隆方式,Java-DropWizard指标计量器与计时器
- 学校如何把表格里的成绩,让学生以二维码的方式去扫描查询呢?
- 《2022产业互联网安全十大趋势》正式发布
- 游戏机制新设计工具(Machinations)工作原理
- java多线程Thread.sleep方法用法详解
- python数据分析百度云资源_数据分析师视频教程百度云网盘下载
- 最适合管理的计算机语言,PLC 编程语言的优劣,哪种语言更适合编程
- 如何编写一份高质量的测试报告
- Java中成员变量的超详解
- 从美国创业者的成功看行业趋势
- Could not build wheels for xx which use PEP 517 and cannot be installed directly
- 2017湖湘杯Writeup
- 【等级测评师】等级测评师怎么报名?多少分及格?
- Java中的Hash值到底是怎么计算的