【ICLR 2018录用结果出炉】23篇oral干货,强化学习、对抗网络、可解释性最受关注...
Oral Papers:23篇
1、AmbientGAN: Generative models from lossy measurements
(AmbientGAN:来自有损测量的生成模型)
作者:Ashish Bora, Eric Price, Alexandros G. Dimakis(德州大学)
论文地址:https://openreview.net/forum?id=Hy7fDog0b
评分:7.33
简介:如何从嘈杂、扭曲、局部的观察中学习GAN;
关键词:生成模型,对抗网络,有损测量
2、Beyond Word Importance: Contextual Decomposition to Extract Interactions from LSTMs
作者:W. James Murdoch, Peter J. Liu, Bin Yu(伯克利大学、谷歌)
论文地址:https://openreview.net/forum?id=rkRwGg-0Z
评分:5.56
简介:这篇论文引入了“语境分解”,一种LSTM解释算法,能够提取单词、短语和交互级别的重要性分数。
关键词:可解释性,LSTM,自然语言处理,情感分析,交互
3、Zero-Shot Visual Imitation
作者:Deepak Pathak, Parsa Mahmoudieh, Michael Luo, Pulkit Agrawal, Dian Chen, Fred Shentu, Evan Shelhamer, Jitendra Malik, Alexei A. Efros, Trevor Darrell(伯克利大学)
论文地址:https://openreview.net/forum?id=BkisuzWRW
评分:6.91
简介:智能体在训练时在没有任何形式的监督的情况下从自己的经验学习,并在测试时学习模仿单纯的视觉演示(没有动作)。
关键词:模仿,zero shot,自我监督,机器人,技能,导航,操纵
4、Variance Reduction for Policy Gradient with Action-Dependent Factorized Baselines
作者:Cathy Wu, Aravind Rajeswaran, Yan Duan, Vikash Kumar, Alexandre M Bayen, Sham Kakade, Igor Mordatch, Pieter Abbeel(伯克利大学、华盛顿大学)
论文地址:https://openreview.net/forum?id=H1tSsb-AW
评分:6.91
简介:依赖于动作的基线可以是无偏倚的,并且可以产生比策略梯度方法的只依赖于状态基线更大的方差缩减。
关键词:强化学习,策略梯度,方差缩减,基线,控制变量
5、Progressive Growing of GANs for Improved Quality, Stability, and Variation
作者:Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen(英伟达)
论文地址:https://openreview.net/forum?id=Hk99zCeAb
评分:5.67
简介:该研究以渐进的方式训练生成对抗网络,从而能够生成高质量的高分辨率图像。
关键词:生成对抗网络,无监督学习,层级方法
6、Neural Sketch Learning for Conditional Program Generation
作者:Vijayaraghavan Murali, Letao Qi, Swarat Chaudhuri, Chris Jermaine(莱斯大学)
论文地址:https://openreview.net/forum?id=HkfXMz-Ab
评分:7.44
简介:这篇文章提出一种用类似Java语言生成类型安全程序的方法,只需给出少量关于所需代码的语法信息。
关键词:程序生成,源代码,程序综合,深度生成模型
7、Boosting Dilated Convolutional Networks with Mixed Tensor Decompositions
作者:Nadav Cohen, Ronen Tamari, Amnon Shashua
论文地址:https://openreview.net/forum?id=S1JHhv6TW
评分:8.00
简介:引入混合张量分解的概念,并用它证明相互连接的扩张的卷积网络提升了它们的表达能力。
关键词:深度学习,表现效率,扩张卷积,张量分解
8、Continuous Adaptation via Meta-Learning in Nonstationary and Competitive Environments
作者:Maruan Al-Shedivat, Trapit Bansal, Yura Burda, Ilya Sutskever, Igor Mordatch, Pieter Abbeel(CMU、UMASS、OpenAI、berkeley)
论文地址:https://openreview.net/forum?id=Sk2u1g-0-
评分:7.80
简介:将持续适应问题转换为learning-to learn框架,开发了一个简单的基于梯度的meta-learning算法,适应动态变化和对抗情况。
关键词:强化学习,非平稳性,meta-learning,迁移学习,多智能体
9、Breaking the Softmax Bottleneck: A High-Rank RNN Language Model
作者:Zhilin Yang, Zihang Dai, Ruslan Salakhutdinov, William W. Cohen(CMU)
论文地址:https://openreview.net/forum?id=HkwZSG-CZ
评分:6.31
简介:将语言建模作为一个矩阵分解问题,并表明基于Softmax的模型(包括大多数神经语言模型)的表达能力受到Softmax瓶颈的限制,提出了一个简单而有效的方法来解决这个问题。
10、Characterizing Adversarial Subspaces Using Local Intrinsic Dimensionality
作者:Xingjun Ma, Bo Li, Yisen Wang, Sarah M. Erfani, Sudanthi Wijewickrema, Grant Schoenebeck, Michael E. Houle, Dawn Song, James Bailey(墨尔本大学)
论文地址:https://openreview.net/forum?id=B1gJ1L2aW
评分:7.25
简介:我们通过使用局部本质维数(LID)描述对抗样本中对抗子空间的维度属性,并且证明这些特征可以有效地区分对抗样本。
关键词:对抗子空间,局部本质维数,对抗防御,深度神经网络
11、Learning to Represent Programs with Graphs
作者:Miltiadis Allamanis, Marc Brockschmidt, Mahmoud Khademi(微软、SFU)
论文地址:https://openreview.net/forum?id=BJOFETxR-
评分:8.00
简介:程序具有可以表示为图形的结构,图神经网络可以学习在这些图形上发现bug
关键词:程序,源代码,图神经网络
12、Spectral Normalization for Generative Adversarial Networks
作者:Takeru Miyato, Toshiki Kataoka, Masanori Koyama, Yuichi Yoshida
论文地址:https://openreview.net/forum?id=B1QRgziT-
评分:7.33
简介:我们提出一种称为spectral normalization的新的权重归一化技术,以稳定GAN鉴别器的训练。
关键词:生成对抗网络,深度生成模型,无监督学习
13、Wasserstein Auto-Encoders
作者:Ilya Tolstikhin, Olivier Bousquet, Sylvain Gelly, Bernhard Schoelkopf
论文地址:https://openreview.net/forum?id=HkL7n1-0b
评分:8.00
简介:我们提出了一种基于Wasserstein距离的自动编码器,改进了VAE的采样性能。
关键词:自动编码器,生成模型,GAN,VAE,无监督学习
14、Deep Mean Field Games for Learning Optimal Behavior Policy of Large Populations
作者:Jiachen Yang, Xiaojing Ye, Rakshit Trivedi, Huan Xu, Hongyuan Zha
论文地址:https://openreview.net/forum?id=HktK4BeCZ
评分:8.50
简介:通过MFG和马尔可夫决策过程的综合推断大型群体行为的MFG模型。
关键词:平均场博弈,强化学习,马尔可夫决策过程,逆强化学习,深度学习,逆向最优控制,计算社会科学,群集建模
15、Certifiable Distributional Robustness with Principled Adversarial Training
作者:Aman Sinha, Hongseok Namkoong, John Duchi(斯坦福大学)
论文地址:https://openreview.net/forum?id=Hk6kPgZA-
评分:9.00
简介:本文提出一个快速、基于规则的对抗训练程序,具有计算和统计上的性能保证。
关键词:对抗训练,分布式鲁棒优化,深度学习,优化,学习理论
16、On the insufficiency of existing momentum schemes for Stochastic Optimization
作者:Rahul Kidambi, Praneeth Netrapalli, Prateek Jain, Sham M. Kakade
论文地址:https://openreview.net/forum?id=rJTutzbA-
评分:6.14
简介:现有的动量/加速方法,如胖球法(heavy ball method)和Nesterov加速梯度法不能改善随机梯度下降,尤其是在使用小的batch size时。
关键词:随机梯度下降,深度学习,动量,加速,heavy ball,Nesterov加速,随机优化,SGD,加速随机梯度下降
17、Ask the Right Questions: Active Question Reformulation with Reinforcement Learning
作者:Christian Buck, Jannis Bulian, Massimiliano Ciaramita, Wojciech Gajewski, Andrea Gesmundo, Neil Houlsby, Wei Wang.(谷歌)
论文地址:https://openreview.net/forum?id=S1CChZ-CZ
评分:5.83
简介:我们提出一个位于用户和黑箱问答系统之间的智能体,它学习重新构造问题以引出最好的答案。
关键词:机器翻译,转述,问答,强化学习,智能体
18、Spherical CNNs
作者:Taco S. Cohen, Mario Geiger, Jonas Köhler, Max Welling
论文地址:https://openreview.net/forum?id=Hkbd5xZRb
评分:7.57
简介:我们提出Spherical CNN,并将其应用于3D模型识别和分子能量回归。
关键词:深度学习,同变性,卷积,3D,视觉,形状识别
19、Emergence of Linguistic Communication from Referential Games with Symbolic and Pixel Input
作者:Angeliki Lazaridou, Karl Moritz Hermann, Karl Tuyls, Stephen Clark
论文地址:https://openreview.net/forum?id=HJGv1Z-AW
评分:6.85
简介:对应急通信协议中环境对性质的作用进行了对照研究。
关键词:解缠,通信,应急语言,合成,多代理
20、Training and Inference with Integers in Deep Neural Networks
作者:Shuang Wu, Guoqi Li, Luping Shi, Feng Chen(清华大学)
论文地址:https://openreview.net/forum?id=HJGXzmspb
评分:6.27
简介:我们在DNN中仅使用低位整数进行训练和推理
关键词:量化,训练,bitwidth,三元权重
21、Multi-Scale Dense Networks for Resource Efficient Image Classification
作者:Gao Huang, Danlu Chen, Tianhong Li, Felix Wu, Laurens van der Maaten, Kilian Weinberger(康奈尔大学、清华大学)
论文地址:https://openreview.net/forum?id=Hk2aImxAb
评分:8.33
简介:本文调查了图像分类与测试时间的计算资源限制。
关键词:高效学习,预算学习,深度学习,图像分类,卷积网络
22、Synthetic and Natural Noise Both Break Neural Machine Translation
作者:Yonatan Belinkov, Yonatan Bisk
论文地址:https://openreview.net/forum?id=BJ8vJebC-
评分:7.33
简介:NMT模型相当脆弱,容易受到噪音数据影响。本文用合成和自然的噪音作为NMT模型的对抗样本,探索提高模型鲁棒性的方法。
关键词:神经机器翻译,特征,噪声,对抗样本,稳健训练
23、On the Convergence of Adam and Beyond
作者:Sashank J. Reddi, Satyen Kale, Sanjiv Kumar(谷歌)
论文地址:https://openreview.net/forum?id=ryQu7f-RZ
评分:8.56
简介:我们研究了Adam,RMSProp等流行优化算法的收敛性,并提出了这些方法的新变体。
关键词:优化,深度学习,Adam,RMSProp
原文发布时间为:2018-01-31
本文作者:肖琴
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号
原文链接:【ICLR 2018录用结果出炉】23篇oral干货,强化学习、对抗网络、可解释性最受关注
【ICLR 2018录用结果出炉】23篇oral干货,强化学习、对抗网络、可解释性最受关注...相关推荐
- 2021年高考成绩查询永春一中,骄傲!2018高考成绩出炉!永春一中、侨中、美岭中学、三中、四中、五中、六中等优异成绩出炉!...
原标题:骄傲!2018高考成绩出炉!永春一中.侨中.美岭中学.三中.四中.五中.六中等优异成绩出炉! 就在昨天! 高考成绩终于放榜! 福建省.泉州市高考状元也陆续出炉啦! 一起来看看 2018年福建省 ...
- ICLR 2019八大趋势:RNN正在失去光芒,强化学习仍最受欢迎
大数据文摘出品 来源:huyenchip 编译:笪洁琼.周家乐 ICLR 2019过去有几天了,作为今年上半年表现最为亮眼的人工智能顶会共收到1591篇论文,录取率为31.7%. 为期4天的会议,共有 ...
- 【重磅整理】提前看287篇ICLR-2021 深度强化学习领域论文得分汇总列表
深度强化学习实验室 来源:ICLR2021 编辑:DeepRL [1]. What Matters for On-Policy Deep Actor-Critic Methods? A Large-S ...
- IJCAI 2018所有奖项出炉:AlphaGo获奖,中国人论文占46%,华人一作近2/3
来源:全球人工智能 IJCAI(国际人工智能联合会议)是人工智能领域历史最悠久的学术会议,也是最重要和最顶级的学术会议之一.第一届IJCAI于1969年举办,是1956年达特茅斯研讨会的延伸,也是有史 ...
- 顶会速递 | ICLR 2020录用论文之自然语言处理篇
抽空为大家整理了人工智能顶会ICLR 2020录用的自然语言处理相关的最新论文,内容涉及到知识图谱.语言建模.文本生成.机器翻译等热门领域,还有几篇关于BERT.Transformer模型优化的文章. ...
- 顶会速递 | ICLR 2020录用论文之图神经网络篇
抽空为大家整理了人工智能顶会ICLR 2020录用的图神经网络相关的最新论文,大牛论文非常多,感兴趣的朋友们赶紧Mark读起来吧! Composition-based Multi-Relational ...
- 解读72篇DeepMind深度强化学习论文
来源:王小惟的知乎https://zhuanlan.zhihu.com/p/70127847 编辑:DeepRL 论文下载方法:pdf合集下载见文章末尾 DRL领域交流与讨论加微信:NeuronDan ...
- 必看,61篇NeurIPS深度强化学习论文解读都这里了
作者 | DeepRL 来源 | 深度强化学习实验室(ID: Deep-RL) NeurIPS可谓人工智能年度最大盛会.每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大 ...
- 【重磅】61篇NIPS2019深度强化学习论文及部分解读
深度强化学习报道 来源:NIPS2019 编辑:DeepRL NeurIPS(前称NIPS)可谓人工智能年度最大盛会.每年全球的人工智能爱好者和科学家都会在这里聚集,发布最新研究,并进行热烈探讨,大会 ...
最新文章
- Web APi之控制器选择Action方法过程(九)
- 【采用】风控体系的一般架构
- Xcode8 消除部分警告
- 使用XStream注解处理复杂xml的属性及数据集合(xml转对象)
- Linux中tty框架与uart框架之间的调用关系剖析
- 防治计算机病毒教案,小学信息技术教案:《防治计算机病毒-计算机病毒》
- filebox管理php,filebox.php
- 【RDMA】intel 因特尔RDMA 驱动和ibverslib 库安装笔记
- C语言度化为度分秒的方法,一句话转换度:分:秒格式为度.度度度
- Jquery获取单选框与复选框选中的值
- 富爸爸系列全集图书清单
- SpaceX SN8飞船爆炸,马斯克:已拿到全部所需数据,火星,我们来了!
- Windows系统的基础上装Ubuntu双系统系统分区问题
- 2023速卖通开店入驻流程及费用,新店运营思路
- Android Scroller的使用
- Throttling - Django REST framework
- 2022年汽车配件市场分析
- python优化网站_5个Python脚本优化你的网站搜索引擎优化
- 图片预览-放大镜效果
- 一体化Mbus物联网主机上线问题总结
热门文章
- PassFab iPhone Backup Unlocker(itunes备份密码找回神器)官方中文版V5.2.10.2 | iphone备份密码解除工具下载 | itunes备份密码忘记怎么办
- 字符型常量和字符串常量的区别
- 徐小明20111120
- 职工信息管理系统的设计
- thinkphp下的图片上传
- 那些学校计算机专硕学费低,这5个专业学费很低,适合“家庭条件不好”的学生,但就业率很高...
- php soap调用webservice,php调用webservice的例子 - soapclient
- ORACLE中行列转换的问题解决
- 互动能量杯横空出世,对决中国瓶装水行业
- 2022中国眼博会,山东视力防控展会,近视镜,中国近视矫正展