本周最热 AI 论文大集合,还不快一键收藏?
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。
在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。
点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。
这是 PaperDaily 的第 97篇文章
Compositional Attention Networks for Machine Reasoning
@NoaRicky 推荐
#Machine Reasoning
本文是斯坦福大学发表于 ICLR 2018 的工作,论文解决了树状结构网络在机器阅读、机器推理问题中虽有良好表现,但模型训练时间过长的问题,同时幸运的是在精确度方面胜过了以往所有模型。它其中一名作者是斯坦福 CS224n 授课老师 Manning 教授,该文章模型已被 Stanford NLP 团队实现。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2207
源码链接
https://github.com/stanfordnlp/mac-network
Know What You Don't Know: Unanswerable Questions for SQuAD
@guohao916 推荐
#Machine Reading Comprehension
本文是斯坦福大学发表于 ACL 2018 的工作,论文在原来的 SQuAD(SQuAD 1.1)的十万个问题 - 答案对的基础上,SQuAD 2.0 中新增了超过五万个新增的、由人类众包者对抗性地设计的无法回答的问题。执行 SQuAD 2.0 阅读理解任务的模型不仅要能够在问题可回答时给出答案,还要判断哪些问题是阅读文本中没有材料支持的,并拒绝回答这些问题。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2180
源码链接
https://bit.ly/2rDHBgY
Learning-to-Ask: Knowledge Acquisition via 20 Questions
@yihongchen 推荐
#Knowledge Discovery
本文是清华大学、微软和阿里巴巴联合发表于 KDD 2018 的工作。为机器赋能知识是让机器具有智能的一种重要手段,通过提问获取知识是一种常见的方法,但如何保证提问的效率和有效性是一个核心问题,本文针对这些问题提出了一种基于深度强化学习和矩阵分解的 Learning-to-Ask 方法,并用贝叶斯方法表示知识来增强鲁棒性。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2174
Simple and Effective Multi-Paragraph Reading Comprehension
@guohao916 推荐
#Question Answering
本文将段落级的神经 QA 模型扩展到篇章级。在训练阶段采样了多个段落,并改造了目标函数使之产生全局正确的输出。当 QA 模型的输入为篇章时,处理方法可分为两类:流水线方法首先选择一个最相关的段落再预测答案跨度;基于置信的方法将模型使用在多个段落上返回最高的置信值。基于置信的方法对于段落选择的错误具有强鲁棒性,然而这要求模型对每一个段落计算出较精确的置信值。
本文将上述两个思路相结合,使流水线方法能够计算出各个段落更加精确的置信值。首先使用 TF-IDF 选择用于训练和测试的段落,针对语料的远程监督噪声较大的问题,将目标函数定义为所有可能的答案位置的边缘值;最后通过使用一个共享标准化目标函数,使答案选择基于篇章中各个段落的比较,有效提高了模型的鲁棒性。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2179
源码链接
https://github.com/allenai/document-qa
Towards Human-Machine Cooperation: Self-supervised Sample Mining for Object Detection
@kezewang 推荐
#Object Detection
近年来,随着互联网的快速发展和计算能力的提升,受益于大规模训练数据的深度学习技术取得了突破性的进步。物体检测作为计算机视觉领域的一个经典任务,检测精度取得了巨大的提升。以候选区域为基础的物体检测网络对一张输入的图像提取大量的候选物体区域,并对这些区域进行类别标注和位置回归,提升了物体检测的识别精度和识别速度。然而,神经网络的检测效果极其依赖训练网络的标注样本数据,因此,如何利用大规模的未标注或是少量标注的数据有效训练网络,提升其检测精度是亟待解决的问题。
为了使用更少的标注数据训练出高精度的检测模型,一般需要解决以下技术问题:
1. 在保证模型效果的同时,尽量减少人工样本标注。通常的神经网络训练,非常依赖大量人工标注的数据集,而比起其他视觉任务(例如,图像分类和动作识别),标注物体需要提供图片中所有物体的类别标签和物体所处区域的边框坐标。因此,对图像进行人工标注非常耗时耗力,发展自动标注无标签数据的方法是减少人工标注负担的关键步骤。
2. 挖掘能够显著提高分类器表现的特殊训练样本。现有的物体检测数据集通常包含了绝大多数普通的“简单”样本和少量有益的“困难”样本(即,富含各种光照,变形,遮挡和类内变化的信息量)。因为他们服从长尾分布,“困难”的例子是罕见的,为了利用这些能够最有效训练神经网络的“困难”样本,需要能够从大量样本中将其识别出来。
3. 抑制坏样本的负面影响。一些训练样本(例如,离群点或噪声样本)可能会使模型发生偏移,在训练时排除被数据集中的标注者标记为“混乱”的样本后,训练得到的物体检测性能可以得到大幅度的改进和提高。
为克服上述现有技术存在的不足,我们的研究动机在于提供一种基于自监督过程改进主动学习的通用物体检测系统及方法,以结合样本挖掘技术和深度学习物体检测技术,利用少量标注的样本和海量的未标注样本联合训练提升模型的检测性能以提高检测精度。 同时,可在减少大量的人力物力、节约成本基础上实现通用物体检测目的。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2177
源码链接
https://github.com/yanxp/SSM
Attention-Gated Networks for Improving Ultrasound Scan Plane Detection
@hsu 推荐
#Semantic Segmentation
本文是 Attention U-Net 的前序文章,论文提出了 Attention Gate,和主流方法一样使用的是 soft-attention 机制。文章将 Attention-Gate 应用于超声图像的分类问题,包括若干器官。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2198
源码链接
https://github.com/ozan-oktay/Attention-Gated-Networks
CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization
@yanjoy 推荐
#Model Compression
本文是西蒙弗雷泽大学发表于 CVPR 2018 的工作,论文提出先剪枝后量化的压缩框架,并且自动优化超参数。结果在 GoogLeNet 上有 10x 压缩,在 ResNet-50 有 15x 压缩,并不降低准确率。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2181
deepNF: deep network fusion for protein function prediction
@xuehansheng 推荐
#bioinformatics
本文将深度学习应用到多网络融合的过程中,并针对蛋白质功能预测的网络结构特点,提出了一种基于多模式深度自动编码器的网络融合方法——deepNF,从多个异构交互网络中提取蛋白质的高级特征。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2172
源码链接
https://github.com/VGligorijevic/deepNF
Large scale distributed neural network training through online distillation
@paulpeng 推荐
#Neural Networks
本文来自 Google,论文提出了一种大规模分布式神经网络的的改进方法。具体来说,作者提出了一种 distillation 模型的变种,一方面考虑是支持大规模数据的并行化处理,另一方面考虑是为预测模型提供了一种可重复的方法。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2205
RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems
@xuzhou 推荐
#Recommender Systems
本文是上海交大、微软亚洲研究院和香港理工大学联合发表于 CIKM 2018 的工作。为了解决协同过滤的稀疏性和冷启动问题,研究人员通常利用社交网络或项目属性等辅助信息来提高推荐效果。本文将知识图谱应用到推荐系统中,是一个很新颖的方法,给推荐系统提供了一个全新的思路。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2201
源码链接
https://github.com/hwwang55/RippleNet
MojiTalk: Generating Emotional Responses at Scale
@filterc 推荐
#Response Generation
本文是清华大学和 UCSB 发表于 ACL 2018 的工作,论文旨在教会机器生成有情绪的回答,比如当用户伤心的时候,机器回答一定不能很开心。这项工作的难点在于缺少大规模标注好的情感训练集,以及如何控制生成回答的情感。现有的情感数据集对深度模型都太小,并且只有有限的几个分类(生气、开心,或者正面、负面)。
本文解决方案如下:1. 使用含有 emoji(选择了 64 种)的 Twitter 数据来做自动情感标注(规模:600K) 2. 在生成回答时,根据给定的 emoji 来生成不同情感的回答
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2199
源码链接
https://github.com/Claude-Zhou/MojiTalk
A Minimal Span-Based Neural Constituency Parser
@godweiyang 推荐
#Constituency Parsing
本文提出了一种不同于传统方法的成分句法分析方法。传统的句法分析器需要预处理出语法规则集合,然后利用语法规则来进行各种句法分析,这类方法的弊端有很多,主要有三点:
1. 语法规则集合构造的好坏直接影响到分析效果的好坏;
2. 不仅如此,利用语法规则的方法时间复杂度高,因为每次都要遍历一遍语法规则集合来决定每个短语采用哪一条语法规则;
3. 还有一种弊端就是利用语法规则的方法无法产生新的产生式,也就是说如果测试集中的语法规则没有在训练集中出现过,那么是无法预测出来的。
本文提出的模型不需要预先构造出语法规则集合,只需要预测出每个短语的label和 split 就行了,这样就能构造出一棵完整的句法树。该模型分为编码与解码两部分,其中编码部分就是利用双向 LSTM 将每个词和短语表示成向量,解码部分提出了两种模型,一种是 chart 模型,类似于 CKY 算法,另一种是 top-down 模型,就是自顶向下的贪心算法。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2098
源码链接
https://github.com/mitchellstern/minimal-span-parser
Learning Structural Node Embeddings via Diffusion Wavelets
@xuehansheng 推荐
#Network Embedding
本文是斯坦福大学发表于 KDD18 的工作,论文提出了一种通过利用热小波扩散模式通过低维嵌入来表示每个节点的网络邻域的方法——GraphWave。 GraphWave 不是在手工选择的特征上进行训练,而是以无人监督的方式学习这些嵌入。文章在数学上证明具有相似网络邻域的节点将具有类似的 GraphWave 嵌入,即使这些节点可能驻留在网络的非常不同的部分中。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2204
源码链接
https://github.com/snap-stanford/graphwave
Adversarial Network Embedding
@xuzhou 推荐
#Network Embedding
ANE 是发表在 AAAI 2018 上的用对抗生成网络学习网络表示的文章。现有的网络表示方法 Deep Walk、LINE、node2vec 等保留了网络的一阶、二阶或者更高阶的相似性,但这些方法都缺少增加 embedding 鲁棒性的限制。本文通过对抗训练的规则来正则化表示学习过程。
ANE 包含两个部分:结构保留、对抗学习。在结构保留部分,本文实验中分别使用了 Inductive DeepWalk 和 Denoising Auto encoder 两种模型;对抗学习部分主要是学习稳定、鲁棒的网络表示,使结构保留部分生成的网络表示服从先验(prior)分布。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2164
Deep Spatial Feature Reconstruction for Partial Person Re-identification: Alignment-Free Approach
@Molly 推荐
#Person Re-identification
本文是中国科学院大学发表于 CVPR 2018 的工作,论文介绍了一种行人遮挡情况下的重识别方法。在实际应用中,行人互相遮挡或者被画面中其他物体遮挡,往往会导致模型表现下降。这篇文章提出的方法在消耗较少计算资源的情况下,可以得到更好的结果。
文章提出了一种框架,先使用 FCN 提取特征,再使用 Deep Spatial Feature Reconstruction 方法计算特征的相似度。即使用完整行人的特征的线性组合来表示部分行人的线性特征,如果误差很小,则认为是同一个人。否则不是同一个人。
▲ 论文模型:点击查看大图
论文链接
https://www.paperweekly.site/papers/2183
#推 荐 有 礼#
本期所有入选论文的推荐人
均将获得PaperWeekly纪念周边一份
▲ 深度学习主题行李牌/卡套 + 防水贴纸
礼物领取方式
推荐人请根据论文详情页底部留言
添加小助手领取礼物
想要赢取以上周边好礼?
点击阅读原文即刻推荐论文吧!
点击以下标题查看往期推荐:
暑假没人带怎么办?还有我们为你推荐论文
本周份AI论文推荐新鲜出炉!真的很skr了~
叮!请查收本周份「知识图谱」专题论文解读
还在熬夜憋思路?这12篇最新论文打包送给你
本顶会论文轮番炸场,本周哪些论文最值得读?
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
▽ 点击 |阅读原文 | 加入社区刷论文
本周最热 AI 论文大集合,还不快一键收藏?相关推荐
- 近20年3867篇AI论文大调研:有缺陷的指标被滥用,好的指标被忽视
来源:AI科技评论 本文约5400字,建议阅读6分钟. 论文调查告诉你评估机器学习模型中的不足. "用于评估AI和机器学习模型的常用指标不足以反映这些模型的真实性能",来自维也纳医 ...
- 纯干货-5Deep Reinforcement Learning深度强化学习_论文大集合
本文罗列了最近放出来的关于深度强化学习(Deep Reinforcement Learning,DRL)的一些论文.文章采用人工定义的方式来进行组织,按照时间的先后进行排序,越新的论文,排在越前面.希 ...
- 3万字总结!华三H3CNE知识点大集合,网络工程师收藏
大家好,我是瑞哥,昨天微信上有个朋友让我出一期H3CNE知识点的介绍. H3CNE我是太熟悉了,大学时候考H3CTE证书,H3CNE属于基础部分,那本<构建中小型企业网络>书籍不知道被我翻 ...
- 本周值得读的15篇AI论文,还有源码搭配服用
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- Github热榜:2021年33篇最酷AI论文综述!多位华人作者入选
新智元报道 编辑:小咸鱼 [新智元导读]GitHub上,有一位小哥放出了「2021年充满惊喜的人工智能论文综述」这个项目.目前,里面总结了33篇今年必看论文,堪称「良心宝藏」.这个项目仍在更新 ...
- 大神建议我们经常阅读AI论文,你却不知道去哪找?最全论文给到你!
搞AI,在不断精进自己代码的同时,更应该提升自己的阅读能力.需要不断地阅读大量的最新.最前沿的论文,也要深扎经典论文根基.因为阅读论文可以帮助你深入原理,理解AI更前沿的发展状态,掌握更前沿的技术热点 ...
- 本周有哪些值得读的 AI 论文?我们替你挑选了 18 篇
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 本周有哪些值得读的 AI 论文?进来告诉你答案
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 本周 AI 论文良心推荐,你想 pick 谁?
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
最新文章
- DBA_Oracle基本体系内存和进程结构(概念)
- 如何使用Jackson来反序列化对象数组
- Centos 安装Mongo DB
- GlassFish新纪元
- [shell问答录]:命令、进程、子shell...
- 谈谈我对Promise的理解
- Eclipse如何连接SQL Server 2005数据库
- Matploblib work5
- Quartz CronTrigger最完整配置说明
- matlab griddata外插,matlab griddata方法使用介绍
- 企业级多用户发卡平台源码PHP
- 脑电时频分析I:谱分析
- java毕业设计户籍管理系统(附源码、数据库)
- lbj学习日记 04 循环和选择结构的刷题心得
- 怎样调整计算机开机调用程序,开机自动运行程序如何设置
- 线下交易如何避免微信和支付宝交易风控
- 【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇二:基于OneNote难点突破和批量识别...
- java微信小程序支付-回调(Jsapi-APIv3)
- [PATCH] ARM: add dtbImage.dt and dtbuImage.dt rules
- KafKa - 分区副本ISR选举机制