Oral Papers:23篇

1、AmbientGAN: Generative models from lossy measurements

(AmbientGAN:来自有损测量的生成模型)

作者:Ashish Bora, Eric Price, Alexandros G. Dimakis(德州大学)

论文地址:https://openreview.net/forum?id=Hy7fDog0b

评分:7.33

简介:如何从嘈杂、扭曲、局部的观察中学习GAN;

关键词:生成模型,对抗网络,有损测量

2、Beyond Word Importance: Contextual Decomposition to Extract Interactions from LSTMs

作者:W. James Murdoch, Peter J. Liu, Bin Yu(伯克利大学、谷歌)

论文地址:https://openreview.net/forum?id=rkRwGg-0Z

评分:5.56

简介:这篇论文引入了“语境分解”,一种LSTM解释算法,能够提取单词、短语和交互级别的重要性分数。

关键词:可解释性,LSTM,自然语言处理,情感分析,交互

3、Zero-Shot Visual Imitation

作者:Deepak Pathak, Parsa Mahmoudieh, Michael Luo, Pulkit Agrawal, Dian Chen, Fred Shentu, Evan Shelhamer, Jitendra Malik, Alexei A. Efros, Trevor Darrell(伯克利大学)

论文地址:https://openreview.net/forum?id=BkisuzWRW

评分:6.91

简介:智能体在训练时在没有任何形式的监督的情况下从自己的经验学习,并在测试时学习模仿单纯的视觉演示(没有动作)。

关键词:模仿,zero shot,自我监督,机器人,技能,导航,操纵

4、Variance Reduction for Policy Gradient with Action-Dependent Factorized Baselines

作者:Cathy Wu, Aravind Rajeswaran, Yan Duan, Vikash Kumar, Alexandre M Bayen, Sham Kakade, Igor Mordatch, Pieter Abbeel(伯克利大学、华盛顿大学)
论文地址:https://openreview.net/forum?id=H1tSsb-AW
评分:6.91

简介:依赖于动作的基线可以是无偏倚的,并且可以产生比策略梯度方法的只依赖于状态基线更大的方差缩减。
关键词:强化学习,策略梯度,方差缩减,基线,控制变量

5、Progressive Growing of GANs for Improved Quality, Stability, and Variation

作者:Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen(英伟达)

论文地址:https://openreview.net/forum?id=Hk99zCeAb
评分:5.67

简介:该研究以渐进的方式训练生成对抗网络,从而能够生成高质量的高分辨率图像。

关键词:生成对抗网络,无监督学习,层级方法

6、Neural Sketch Learning for Conditional Program Generation

作者:Vijayaraghavan Murali, Letao Qi, Swarat Chaudhuri, Chris Jermaine(莱斯大学)

论文地址:https://openreview.net/forum?id=HkfXMz-Ab
评分:7.44

简介:这篇文章提出一种用类似Java语言生成类型安全程序的方法,只需给出少量关于所需代码的语法信息。

关键词:程序生成,源代码,程序综合,深度生成模型

7、Boosting Dilated Convolutional Networks with Mixed Tensor Decompositions

作者:Nadav Cohen, Ronen Tamari, Amnon Shashua

论文地址:https://openreview.net/forum?id=S1JHhv6TW
评分:8.00

简介:引入混合张量分解的概念,并用它证明相互连接的扩张的卷积网络提升了它们的表达能力。

关键词:深度学习,表现效率,扩张卷积,张量分解

8、Continuous Adaptation via Meta-Learning in Nonstationary and Competitive Environments

作者:Maruan Al-Shedivat, Trapit Bansal, Yura Burda, Ilya Sutskever, Igor Mordatch, Pieter Abbeel(CMU、UMASS、OpenAI、berkeley)

论文地址:https://openreview.net/forum?id=Sk2u1g-0-
评分:7.80

简介:将持续适应问题转换为learning-to learn框架,开发了一个简单的基于梯度的meta-learning算法,适应动态变化和对抗情况。

关键词:强化学习,非平稳性,meta-learning,迁移学习,多智能体

9、Breaking the Softmax Bottleneck: A High-Rank RNN Language Model

作者:Zhilin Yang, Zihang Dai, Ruslan Salakhutdinov, William W. Cohen(CMU)

论文地址:https://openreview.net/forum?id=HkwZSG-CZ
评分:6.31

简介:将语言建模作为一个矩阵分解问题,并表明基于Softmax的模型(包括大多数神经语言模型)的表达能力受到Softmax瓶颈的限制,提出了一个简单而有效的方法来解决这个问题。

10、Characterizing Adversarial Subspaces Using Local Intrinsic Dimensionality

作者:Xingjun Ma, Bo Li, Yisen Wang, Sarah M. Erfani, Sudanthi Wijewickrema, Grant Schoenebeck, Michael E. Houle, Dawn Song, James Bailey(墨尔本大学)

论文地址:https://openreview.net/forum?id=B1gJ1L2aW
评分:7.25

简介:我们通过使用局部本质维数(LID)描述对抗样本中对抗子空间的维度属性,并且证明这些特征可以有效地区分对抗样本。

关键词:对抗子空间,局部本质维数,对抗防御,深度神经网络

11、Learning to Represent Programs with Graphs

作者:Miltiadis Allamanis, Marc Brockschmidt, Mahmoud Khademi(微软、SFU)

论文地址:https://openreview.net/forum?id=BJOFETxR-
评分:8.00

简介:程序具有可以表示为图形的结构,图神经网络可以学习在这些图形上发现bug

关键词:程序,源代码,图神经网络

12、Spectral Normalization for Generative Adversarial Networks

作者:Takeru Miyato, Toshiki Kataoka, Masanori Koyama, Yuichi Yoshida
论文地址:https://openreview.net/forum?id=B1QRgziT-
评分:7.33

简介:我们提出一种称为spectral normalization的新的权重归一化技术,以稳定GAN鉴别器的训练。

关键词:生成对抗网络,深度生成模型,无监督学习

13、Wasserstein Auto-Encoders

作者:Ilya Tolstikhin, Olivier Bousquet, Sylvain Gelly, Bernhard Schoelkopf

论文地址:https://openreview.net/forum?id=HkL7n1-0b
评分:8.00

简介:我们提出了一种基于Wasserstein距离的自动编码器,改进了VAE的采样性能。

关键词:自动编码器,生成模型,GAN,VAE,无监督学习

14、Deep Mean Field Games for Learning Optimal Behavior Policy of Large Populations

作者:Jiachen Yang, Xiaojing Ye, Rakshit Trivedi, Huan Xu, Hongyuan Zha

论文地址:https://openreview.net/forum?id=HktK4BeCZ
评分:8.50

简介:通过MFG和马尔可夫决策过程的综合推断大型群体行为的MFG模型。

关键词:平均场博弈,强化学习,马尔可夫决策过程,逆强化学习,深度学习,逆向最优控制,计算社会科学,群集建模

15、Certifiable Distributional Robustness with Principled Adversarial Training

作者:Aman Sinha, Hongseok Namkoong, John Duchi(斯坦福大学)

论文地址:https://openreview.net/forum?id=Hk6kPgZA-
评分:9.00

简介:本文提出一个快速、基于规则的对抗训练程序,具有计算和统计上的性能保证。

关键词:对抗训练,分布式鲁棒优化,深度学习,优化,学习理论

16、On the insufficiency of existing momentum schemes for Stochastic Optimization

作者:Rahul Kidambi, Praneeth Netrapalli, Prateek Jain, Sham M. Kakade

论文地址:https://openreview.net/forum?id=rJTutzbA-
评分:6.14

简介:现有的动量/加速方法,如胖球法(heavy ball method)和Nesterov加速梯度法不能改善随机梯度下降,尤其是在使用小的batch size时。

关键词:随机梯度下降,深度学习,动量,加速,heavy ball,Nesterov加速,随机优化,SGD,加速随机梯度下降

17、Ask the Right Questions: Active Question Reformulation with Reinforcement Learning

作者:Christian Buck, Jannis Bulian, Massimiliano Ciaramita, Wojciech Gajewski, Andrea Gesmundo, Neil Houlsby, Wei Wang.(谷歌)

论文地址:https://openreview.net/forum?id=S1CChZ-CZ
评分:5.83

简介:我们提出一个位于用户和黑箱问答系统之间的智能体,它学习重新构造问题以引出最好的答案。

关键词:机器翻译,转述,问答,强化学习,智能体

18、Spherical CNNs

作者:Taco S. Cohen, Mario Geiger, Jonas Köhler, Max Welling

论文地址:https://openreview.net/forum?id=Hkbd5xZRb
评分:7.57

简介:我们提出Spherical CNN,并将其应用于3D模型识别和分子能量回归。

关键词:深度学习,同变性,卷积,3D,视觉,形状识别

19、Emergence of Linguistic Communication from Referential Games with Symbolic and Pixel Input

作者:Angeliki Lazaridou, Karl Moritz Hermann, Karl Tuyls, Stephen Clark

论文地址:https://openreview.net/forum?id=HJGv1Z-AW
评分:6.85

简介:对应急通信协议中环境对性质的作用进行了对照研究。

关键词:解缠,通信,应急语言,合成,多代理

20、Training and Inference with Integers in Deep Neural Networks

作者:Shuang Wu, Guoqi Li, Luping Shi, Feng Chen(清华大学)

论文地址:https://openreview.net/forum?id=HJGXzmspb
评分:6.27

简介:我们在DNN中仅使用低位整数进行训练和推理

关键词:量化,训练,bitwidth,三元权重

21、Multi-Scale Dense Networks for Resource Efficient Image Classification

作者:Gao Huang, Danlu Chen, Tianhong Li, Felix Wu, Laurens van der Maaten, Kilian Weinberger(康奈尔大学、清华大学)

论文地址:https://openreview.net/forum?id=Hk2aImxAb
评分:8.33

简介:本文调查了图像分类与测试时间的计算资源限制。

关键词:高效学习,预算学习,深度学习,图像分类,卷积网络

22、Synthetic and Natural Noise Both Break Neural Machine Translation

作者:Yonatan Belinkov, Yonatan Bisk

论文地址:https://openreview.net/forum?id=BJ8vJebC-
评分:7.33

简介:NMT模型相当脆弱,容易受到噪音数据影响。本文用合成和自然的噪音作为NMT模型的对抗样本,探索提高模型鲁棒性的方法。

关键词:神经机器翻译,特征,噪声,对抗样本,稳健训练

23、On the Convergence of Adam and Beyond

作者:Sashank J. Reddi, Satyen Kale, Sanjiv Kumar(谷歌)

论文地址:https://openreview.net/forum?id=ryQu7f-RZ
评分:8.56

简介:我们研究了Adam,RMSProp等流行优化算法的收敛性,并提出了这些方法的新变体。

关键词:优化,深度学习,Adam,RMSProp

原文发布时间为:2018-01-31

本文作者:肖琴

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【ICLR 2018录用结果出炉】23篇oral干货,强化学习、对抗网络、可解释性最受关注

【ICLR 2018录用结果出炉】23篇oral干货,强化学习、对抗网络、可解释性最受关注...相关推荐

  1. 2021年高考成绩查询永春一中,骄傲!2018高考成绩出炉!永春一中、侨中、美岭中学、三中、四中、五中、六中等优异成绩出炉!...

    原标题:骄傲!2018高考成绩出炉!永春一中.侨中.美岭中学.三中.四中.五中.六中等优异成绩出炉! 就在昨天! 高考成绩终于放榜! 福建省.泉州市高考状元也陆续出炉啦! 一起来看看 2018年福建省 ...

  2. ICLR 2019八大趋势:RNN正在失去光芒,强化学习仍最受欢迎

    大数据文摘出品 来源:huyenchip 编译:笪洁琼.周家乐 ICLR 2019过去有几天了,作为今年上半年表现最为亮眼的人工智能顶会共收到1591篇论文,录取率为31.7%. 为期4天的会议,共有 ...

  3. 【重磅整理】提前看287篇ICLR-2021 深度强化学习领域论文得分汇总列表

    深度强化学习实验室 来源:ICLR2021 编辑:DeepRL [1]. What Matters for On-Policy Deep Actor-Critic Methods? A Large-S ...

  4. IJCAI 2018所有奖项出炉:AlphaGo获奖,中国人论文占46%,华人一作近2/3

    来源:全球人工智能 IJCAI(国际人工智能联合会议)是人工智能领域历史最悠久的学术会议,也是最重要和最顶级的学术会议之一.第一届IJCAI于1969年举办,是1956年达特茅斯研讨会的延伸,也是有史 ...

  5. 顶会速递 | ICLR 2020录用论文之自然语言处理篇

    抽空为大家整理了人工智能顶会ICLR 2020录用的自然语言处理相关的最新论文,内容涉及到知识图谱.语言建模.文本生成.机器翻译等热门领域,还有几篇关于BERT.Transformer模型优化的文章. ...

  6. 顶会速递 | ICLR 2020录用论文之图神经网络篇

    抽空为大家整理了人工智能顶会ICLR 2020录用的图神经网络相关的最新论文,大牛论文非常多,感兴趣的朋友们赶紧Mark读起来吧! Composition-based Multi-Relational ...

  7. 解读72篇DeepMind深度强化学习论文

    来源:王小惟的知乎https://zhuanlan.zhihu.com/p/70127847 编辑:DeepRL 论文下载方法:pdf合集下载见文章末尾 DRL领域交流与讨论加微信:NeuronDan ...

  8. 必看,61篇NeurIPS深度强化学习论文解读都这里了

    作者 | DeepRL 来源 | 深度强化学习实验室(ID: Deep-RL) NeurIPS可谓人工智能年度最大盛会.每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大 ...

  9. 【重磅】61篇NIPS2019深度强化学习论文及部分解读

    深度强化学习报道 来源:NIPS2019 编辑:DeepRL NeurIPS(前称NIPS)可谓人工智能年度最大盛会.每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大会 ...

最新文章

  1. Web APi之控制器选择Action方法过程(九)
  2. 【采用】风控体系的一般架构
  3. Xcode8 消除部分警告
  4. 使用XStream注解处理复杂xml的属性及数据集合(xml转对象)
  5. Linux中tty框架与uart框架之间的调用关系剖析
  6. 防治计算机病毒教案,小学信息技术教案:《防治计算机病毒-计算机病毒》
  7. filebox管理php,filebox.php
  8. 【RDMA】intel 因特尔RDMA 驱动和ibverslib 库安装笔记
  9. C语言度化为度分秒的方法,一句话转换度:分:秒格式为度.度度度
  10. Jquery获取单选框与复选框选中的值
  11. 富爸爸系列全集图书清单
  12. SpaceX SN8飞船爆炸,马斯克:已拿到全部所需数据,火星,我们来了!
  13. Windows系统的基础上装Ubuntu双系统系统分区问题
  14. 2023速卖通开店入驻流程及费用,新店运营思路
  15. Android Scroller的使用
  16. Throttling - Django REST framework
  17. 2022年汽车配件市场分析
  18. python优化网站_5个Python脚本优化你的网站搜索引擎优化
  19. 图片预览-放大镜效果
  20. 一体化Mbus物联网主机上线问题总结

热门文章

  1. PassFab iPhone Backup Unlocker(itunes备份密码找回神器)官方中文版V5.2.10.2 | iphone备份密码解除工具下载 | itunes备份密码忘记怎么办
  2. 字符型常量和字符串常量的区别
  3. 徐小明20111120
  4. 职工信息管理系统的设计
  5. thinkphp下的图片上传
  6. 那些学校计算机专硕学费低,这5个专业学费很低,适合“家庭条件不好”的学生,但就业率很高...
  7. php soap调用webservice,php调用webservice的例子 - soapclient
  8. ORACLE中行列转换的问题解决
  9. 互动能量杯横空出世,对决中国瓶装水行业
  10. 2022中国眼博会,山东视力防控展会,近视镜,中国近视矫正展