【ICLR 2018录用结果出炉】23篇oral干货，强化学习、对抗网络、可解释性最受关注...

Oral Papers：23篇

1、AmbientGAN: Generative models from lossy measurements

（AmbientGAN：来自有损测量的生成模型）

作者：Ashish Bora, Eric Price, Alexandros G. Dimakis（德州大学）

论文地址：https://openreview.net/forum?id=Hy7fDog0b

评分：7.33

简介：如何从嘈杂、扭曲、局部的观察中学习GAN；

关键词：生成模型，对抗网络，有损测量

2、Beyond Word Importance: Contextual Decomposition to Extract Interactions from LSTMs

作者：W. James Murdoch, Peter J. Liu, Bin Yu（伯克利大学、谷歌）

论文地址：https://openreview.net/forum?id=rkRwGg-0Z

评分：5.56

简介：这篇论文引入了“语境分解”，一种LSTM解释算法，能够提取单词、短语和交互级别的重要性分数。

关键词：可解释性，LSTM，自然语言处理，情感分析，交互

3、Zero-Shot Visual Imitation

作者：Deepak Pathak, Parsa Mahmoudieh, Michael Luo, Pulkit Agrawal, Dian Chen, Fred Shentu, Evan Shelhamer, Jitendra Malik, Alexei A. Efros, Trevor Darrell（伯克利大学）

论文地址：https://openreview.net/forum?id=BkisuzWRW

评分：6.91

简介：智能体在训练时在没有任何形式的监督的情况下从自己的经验学习，并在测试时学习模仿单纯的视觉演示（没有动作）。

关键词：模仿，zero shot，自我监督，机器人，技能，导航，操纵

4、Variance Reduction for Policy Gradient with Action-Dependent Factorized Baselines

作者：Cathy Wu, Aravind Rajeswaran, Yan Duan, Vikash Kumar, Alexandre M Bayen, Sham Kakade, Igor Mordatch, Pieter Abbeel（伯克利大学、华盛顿大学）
论文地址：https://openreview.net/forum?id=H1tSsb-AW
评分：6.91

简介：依赖于动作的基线可以是无偏倚的，并且可以产生比策略梯度方法的只依赖于状态基线更大的方差缩减。
关键词：强化学习，策略梯度，方差缩减，基线，控制变量

5、Progressive Growing of GANs for Improved Quality, Stability, and Variation

作者：Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen（英伟达）

论文地址：https://openreview.net/forum?id=Hk99zCeAb
评分：5.67

简介：该研究以渐进的方式训练生成对抗网络，从而能够生成高质量的高分辨率图像。

关键词：生成对抗网络，无监督学习，层级方法

6、Neural Sketch Learning for Conditional Program Generation

作者：Vijayaraghavan Murali, Letao Qi, Swarat Chaudhuri, Chris Jermaine（莱斯大学）

论文地址：https://openreview.net/forum?id=HkfXMz-Ab
评分：7.44

简介：这篇文章提出一种用类似Java语言生成类型安全程序的方法，只需给出少量关于所需代码的语法信息。

关键词：程序生成，源代码，程序综合，深度生成模型

7、Boosting Dilated Convolutional Networks with Mixed Tensor Decompositions

作者：Nadav Cohen, Ronen Tamari, Amnon Shashua

论文地址：https://openreview.net/forum?id=S1JHhv6TW
评分：8.00

简介：引入混合张量分解的概念，并用它证明相互连接的扩张的卷积网络提升了它们的表达能力。

关键词：深度学习，表现效率，扩张卷积，张量分解

8、Continuous Adaptation via Meta-Learning in Nonstationary and Competitive Environments

作者：Maruan Al-Shedivat, Trapit Bansal, Yura Burda, Ilya Sutskever, Igor Mordatch, Pieter Abbeel（CMU、UMASS、OpenAI、berkeley）

论文地址：https://openreview.net/forum?id=Sk2u1g-0-
评分：7.80

简介：将持续适应问题转换为learning-to learn框架，开发了一个简单的基于梯度的meta-learning算法，适应动态变化和对抗情况。

关键词：强化学习，非平稳性，meta-learning，迁移学习，多智能体

9、Breaking the Softmax Bottleneck: A High-Rank RNN Language Model

作者：Zhilin Yang, Zihang Dai, Ruslan Salakhutdinov, William W. Cohen（CMU）

论文地址：https://openreview.net/forum?id=HkwZSG-CZ
评分：6.31

简介：将语言建模作为一个矩阵分解问题，并表明基于Softmax的模型（包括大多数神经语言模型）的表达能力受到Softmax瓶颈的限制，提出了一个简单而有效的方法来解决这个问题。

10、Characterizing Adversarial Subspaces Using Local Intrinsic Dimensionality

作者：Xingjun Ma, Bo Li, Yisen Wang, Sarah M. Erfani, Sudanthi Wijewickrema, Grant Schoenebeck, Michael E. Houle, Dawn Song, James Bailey（墨尔本大学）

论文地址：https://openreview.net/forum?id=B1gJ1L2aW
评分：7.25

简介：我们通过使用局部本质维数（LID）描述对抗样本中对抗子空间的维度属性，并且证明这些特征可以有效地区分对抗样本。

关键词：对抗子空间，局部本质维数，对抗防御，深度神经网络

11、Learning to Represent Programs with Graphs

作者：Miltiadis Allamanis, Marc Brockschmidt, Mahmoud Khademi（微软、SFU）

论文地址：https://openreview.net/forum?id=BJOFETxR-
评分：8.00

简介：程序具有可以表示为图形的结构，图神经网络可以学习在这些图形上发现bug

关键词：程序，源代码，图神经网络

12、Spectral Normalization for Generative Adversarial Networks

作者：Takeru Miyato, Toshiki Kataoka, Masanori Koyama, Yuichi Yoshida
论文地址：https://openreview.net/forum?id=B1QRgziT-
评分：7.33

简介：我们提出一种称为spectral normalization的新的权重归一化技术，以稳定GAN鉴别器的训练。

关键词：生成对抗网络，深度生成模型，无监督学习

13、Wasserstein Auto-Encoders

作者：Ilya Tolstikhin, Olivier Bousquet, Sylvain Gelly, Bernhard Schoelkopf

论文地址：https://openreview.net/forum?id=HkL7n1-0b
评分：8.00

简介：我们提出了一种基于Wasserstein距离的自动编码器，改进了VAE的采样性能。

关键词：自动编码器，生成模型，GAN，VAE，无监督学习

14、Deep Mean Field Games for Learning Optimal Behavior Policy of Large Populations

作者：Jiachen Yang, Xiaojing Ye, Rakshit Trivedi, Huan Xu, Hongyuan Zha

论文地址：https://openreview.net/forum?id=HktK4BeCZ
评分：8.50

简介：通过MFG和马尔可夫决策过程的综合推断大型群体行为的MFG模型。

关键词：平均场博弈，强化学习，马尔可夫决策过程，逆强化学习，深度学习，逆向最优控制，计算社会科学，群集建模

15、Certifiable Distributional Robustness with Principled Adversarial Training

作者：Aman Sinha, Hongseok Namkoong, John Duchi（斯坦福大学）

论文地址：https://openreview.net/forum?id=Hk6kPgZA-
评分：9.00

简介：本文提出一个快速、基于规则的对抗训练程序，具有计算和统计上的性能保证。

关键词：对抗训练，分布式鲁棒优化，深度学习，优化，学习理论

16、On the insufficiency of existing momentum schemes for Stochastic Optimization

作者：Rahul Kidambi, Praneeth Netrapalli, Prateek Jain, Sham M. Kakade

论文地址：https://openreview.net/forum?id=rJTutzbA-
评分：6.14

简介：现有的动量/加速方法，如胖球法（heavy ball method）和Nesterov加速梯度法不能改善随机梯度下降，尤其是在使用小的batch size时。

关键词：随机梯度下降，深度学习，动量，加速，heavy ball，Nesterov加速，随机优化，SGD，加速随机梯度下降

17、Ask the Right Questions: Active Question Reformulation with Reinforcement Learning

作者：Christian Buck, Jannis Bulian, Massimiliano Ciaramita, Wojciech Gajewski, Andrea Gesmundo, Neil Houlsby, Wei Wang.（谷歌）

论文地址：https://openreview.net/forum?id=S1CChZ-CZ
评分：5.83

简介：我们提出一个位于用户和黑箱问答系统之间的智能体，它学习重新构造问题以引出最好的答案。

关键词：机器翻译，转述，问答，强化学习，智能体

18、Spherical CNNs

作者：Taco S. Cohen, Mario Geiger, Jonas Köhler, Max Welling

论文地址：https://openreview.net/forum?id=Hkbd5xZRb
评分：7.57

简介：我们提出Spherical CNN，并将其应用于3D模型识别和分子能量回归。

关键词：深度学习，同变性，卷积，3D，视觉，形状识别

19、Emergence of Linguistic Communication from Referential Games with Symbolic and Pixel Input

作者：Angeliki Lazaridou, Karl Moritz Hermann, Karl Tuyls, Stephen Clark

论文地址：https://openreview.net/forum?id=HJGv1Z-AW
评分：6.85

简介：对应急通信协议中环境对性质的作用进行了对照研究。

关键词：解缠，通信，应急语言，合成，多代理

20、Training and Inference with Integers in Deep Neural Networks

作者：Shuang Wu, Guoqi Li, Luping Shi, Feng Chen（清华大学）

论文地址：https://openreview.net/forum?id=HJGXzmspb
评分：6.27

简介：我们在DNN中仅使用低位整数进行训练和推理

关键词：量化，训练，bitwidth，三元权重

21、Multi-Scale Dense Networks for Resource Efficient Image Classification

作者：Gao Huang, Danlu Chen, Tianhong Li, Felix Wu, Laurens van der Maaten, Kilian Weinberger（康奈尔大学、清华大学）

论文地址：https://openreview.net/forum?id=Hk2aImxAb
评分：8.33

简介：本文调查了图像分类与测试时间的计算资源限制。

关键词：高效学习，预算学习，深度学习，图像分类，卷积网络

22、Synthetic and Natural Noise Both Break Neural Machine Translation

作者：Yonatan Belinkov, Yonatan Bisk

论文地址：https://openreview.net/forum?id=BJ8vJebC-
评分：7.33

简介：NMT模型相当脆弱，容易受到噪音数据影响。本文用合成和自然的噪音作为NMT模型的对抗样本，探索提高模型鲁棒性的方法。

关键词：神经机器翻译，特征，噪声，对抗样本，稳健训练

23、On the Convergence of Adam and Beyond

作者：Sashank J. Reddi, Satyen Kale, Sanjiv Kumar（谷歌）

论文地址：https://openreview.net/forum?id=ryQu7f-RZ
评分：8.56

简介：我们研究了Adam，RMSProp等流行优化算法的收敛性，并提出了这些方法的新变体。

关键词：优化，深度学习，Adam，RMSProp

原文发布时间为：2018-01-31

本文作者：肖琴

本文来自云栖社区合作伙伴新智元，了解相关信息可以关注“AI_era”微信公众号

原文链接：【ICLR 2018录用结果出炉】23篇oral干货，强化学习、对抗网络、可解释性最受关注

【ICLR 2018录用结果出炉】23篇oral干货，强化学习、对抗网络、可解释性最受关注...相关推荐

2021年高考成绩查询永春一中,骄傲！2018高考成绩出炉！永春一中、侨中、美岭中学、三中、四中、五中、六中等优异成绩出炉！...
原标题:骄傲!2018高考成绩出炉!永春一中.侨中.美岭中学.三中.四中.五中.六中等优异成绩出炉! 就在昨天! 高考成绩终于放榜! 福建省.泉州市高考状元也陆续出炉啦! 一起来看看 2018年福建省 ...
ICLR 2019八大趋势：RNN正在失去光芒，强化学习仍最受欢迎
大数据文摘出品来源:huyenchip 编译:笪洁琼.周家乐 ICLR 2019过去有几天了,作为今年上半年表现最为亮眼的人工智能顶会共收到1591篇论文,录取率为31.7%. 为期4天的会议,共有 ...
【重磅整理】提前看287篇ICLR-2021 深度强化学习领域论文得分汇总列表
深度强化学习实验室来源:ICLR2021 编辑:DeepRL [1]. What Matters for On-Policy Deep Actor-Critic Methods? A Large-S ...
IJCAI 2018所有奖项出炉：AlphaGo获奖，中国人论文占46%，华人一作近2/3
来源:全球人工智能 IJCAI(国际人工智能联合会议)是人工智能领域历史最悠久的学术会议,也是最重要和最顶级的学术会议之一.第一届IJCAI于1969年举办,是1956年达特茅斯研讨会的延伸,也是有史 ...
顶会速递 | ICLR 2020录用论文之自然语言处理篇
抽空为大家整理了人工智能顶会ICLR 2020录用的自然语言处理相关的最新论文,内容涉及到知识图谱.语言建模.文本生成.机器翻译等热门领域,还有几篇关于BERT.Transformer模型优化的文章. ...
顶会速递 | ICLR 2020录用论文之图神经网络篇
抽空为大家整理了人工智能顶会ICLR 2020录用的图神经网络相关的最新论文,大牛论文非常多,感兴趣的朋友们赶紧Mark读起来吧! Composition-based Multi-Relational ...
解读72篇DeepMind深度强化学习论文
来源:王小惟的知乎https://zhuanlan.zhihu.com/p/70127847 编辑:DeepRL 论文下载方法:pdf合集下载见文章末尾 DRL领域交流与讨论加微信:NeuronDan ...
必看，61篇NeurIPS深度强化学习论文解读都这里了
作者 | DeepRL 来源 | 深度强化学习实验室(ID: Deep-RL) NeurIPS可谓人工智能年度最大盛会.每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大 ...
【重磅】61篇NIPS2019深度强化学习论文及部分解读
深度强化学习报道来源:NIPS2019 编辑:DeepRL NeurIPS(前称NIPS)可谓人工智能年度最大盛会.每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大会 ...

【ICLR 2018录用结果出炉】23篇oral干货，强化学习、对抗网络、可解释性最受关注...

【ICLR 2018录用结果出炉】23篇oral干货，强化学习、对抗网络、可解释性最受关注...相关推荐

最新文章

热门文章