每周论文清单:对话系统综述,全新中文分词框架,视频生成,文字识别
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。
在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。
点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。
[ 自然语言处理 ]
@jueliangguke 推荐
#Convolutional Neural Network
本文提出了一个全新的中文分词框架,使用深度卷积网络在多个数据集上达到了 state-of-the-art。
论文链接
https://www.paperweekly.site/papers/1473
@paperweekly 推荐
#Dialog Systems
本文来自京东数据科学团队,这是一篇非常全面的对话系统综述,引用了 100+ 篇相关论文,并对论文进行了分类。
论文链接
https://www.paperweekly.site/papers/1446
How to Make Context More Useful?
@zhangjianhai 推荐
#ContextQA
在自然语言对话领域,论文首先对比了目前几种流行的 Context-aware 模型,包括 Non-hierarchical 模型(将 context 与 query 作为一个序列建模)以及 Hierarchical 模型(将 context 与 query 分别建模生成向量表示,在此基础上采用不同的方式进行整合,包括 sum,concat,sequential integration 等)。
最后,论文提出了一种 Weighted Sequential Integration 的上下文整合方式,对不同的上下文赋予不同的权重。对 ContextQA 相关工作具有一定借鉴意义。
论文链接
https://www.paperweekly.site/papers/1476
@cfjmonkey 推荐
#Text Style Transfer
该文实现了基于给定属性的文本风格的转换。属性包括标题、作者和类别。不同类别的文章用词分布不同,同一作者的写作风格是一致的,标题个人理解可以看做关键词定基调,相比关键词语料更丰富。
实验在新闻、影评和歌词三大类文本中进行。 该工作作者来自今日头条,eBay 和清华。
论文链接
https://www.paperweekly.site/papers/1461
@zhangjun 推荐
#Question Answering
来自百度的 QA 系统,本文已被 EMNLP 2017 接收。
论文链接
https://www.paperweekly.site/papers/1463
[ 计算机视觉 ]
@YiqiYan 推荐
#Semantic Segmentation
本文提出了一种新的概念 — Panoptic Segmentation,它是对 instance sengmentation 和 semantic segmentation 的统一。
例如一副街景:instance sengmentation 只分割出一些实例,但是要区分同一类别的个体(分割出车 a,车 b,车 c);semantic segmentation 是把每一个像素分入一个类别,但是不区分个体;Panoptic Segmentation 既要完成 semantic segmentation 的任务,又要区分同一个类别的不同个体。
论文链接
https://www.paperweekly.site/papers/1479
@Synced 推荐
#Adversarial Training
该论文提出了一种在现实世界中创建通用、鲁棒、针对性的对抗图像 patch 的方法。该 patch 是通用的,因为它们可用于攻击任何场景;是鲁棒的,因为它们在多种图像变换中都是有效的;是有针对性的,因为它们可以令分类器输出任意目标类。
这些对抗样本可以被打印出来,添加到任意的场景、照片,并展示给图像分类器;即使 patch 很小,也能导致分类器忽略场景中的其它物体,输出选定的目标类。
论文链接
https://www.paperweekly.site/papers/1475
@Aidon 推荐
#Video Captioning
文章指出现有的 captioning 模型都是用交叉熵损失(XE: cross-entropy loss)训练的,而实际评估的时候用的是其他指标比如 BLEU,METEOR 等。
这里对应的是第一个问题:objective mismatch,很自然地会想到可以直接对评价指标进行优化。第二个问题是 exposure bias,即训练集和测试集上 captions 的分布很有可能是不一样的。虽然强化学习有被用于解决第一个问题,但它的计算开销大,并且在每一步都有指定 baseline reward 才能保证模型的收敛。
针对以上问题,文章提出基于一致性的序列训练来做 video captioning。首先从理论上解释了 XE training 和 RL training 之间的联系,即后者是前者的一个加权形式;然后引入一个简单的 WXE pre-training 来近似 RL training,这样就解决了前面提到的第一个问题。
更进一步地,文章提出用 full REINFORCE 来进行 fine-tune,利用 gt captions 的 consensus score 作为 baseline reward,这样就可以避免 XE training 带来的第二个问题。
论文链接
https://www.paperweekly.site/papers/1450
@zhangjun 推荐
#Video Generation
本文是 MILA 最近的一篇工作,实现了一个根据 text 合成唇同步视频的架构,并以奥巴马做了一个 demo,命名为 ObamaNet。
Demo 地址:http://ritheshkumar.com/obamanet/
论文链接
https://www.paperweekly.site/papers/1505
@chenhong 推荐
#Text Detection
论文中 2D 图像的任意方向的字符编码为 4 个方向的 4 个特征序列表示:左→右,右→左,上→下,下→上(每个方向的特征序列长度相同)。
论文提出一个鲁棒性算法,基于 AON 识别规则和不规则自然场景字符。基于 top-down,无需检测字符,直接预测原始图像整个字符,end-to-end 实现。
论文链接
https://www.paperweekly.site/papers/1488
本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!
我是彩蛋
解锁新功能:热门职位推荐!
PaperWeekly小程序升级啦
今日arXiv√猜你喜欢√热门职位√
找全职找实习都不是问题
解锁方式
1. 识别下方二维码打开小程序
2. 用PaperWeekly社区账号进行登陆
3. 登陆后即可解锁所有功能
职位发布
请添加小助手微信(pwbot01)进行咨询
长按识别二维码,使用小程序
*点击阅读原文即可注册
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
每周论文清单:对话系统综述,全新中文分词框架,视频生成,文字识别相关推荐
- 人工智能Java SDK:词法分析模型能整体性地完成中文分词、词性标注、专名识别任务
文本 - 词法分析SDK [中文] 词法分析模型能整体性地完成中文分词.词性标注.专名识别任务. 词性标注: n 普通名词 f 方位名词 s 处所名词 t 时间 nr 人名 ns 地名 nt 机构名 ...
- 超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M
整理 | AI科技大本营 光学字符识别(OCR)技术已经得到了广泛应用.比如发票上用来识别关键字样,搜题App用来识别书本上的试题. 近期,这个叫做chineseocr_lite的OCR项目开源了,这 ...
- Github标星3K+,超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 光学字符识别(OCR)技术已经得到了广泛应用.比如发票上用来识别关键字样,搜题Ap ...
- 「知识表示学习」专题论文推荐 | 每周论文清单
本期论文清单来自清华大学博士生韩旭和北师大本科生曹书林,涵盖了近年知识表示学习方向的重要论文. [ 综述类 ] ■ 论文 | Representation Learning: A Review and ...
- 论文笔记-对话系统综述
原文出自彼得攀的小站 本文是对论文"A Survey on Dialogue Systems: Recent Advances and New Frontiers"的阅读笔记,该文 ...
- 「推荐系统」领域近期有哪些值得读的论文?| 每周论文清单
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 每周论文清单:高质量文本生成,多模态情感分析,还有一大波GAN | PaperDaily #26
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- 每周论文清单:知识图谱,文本匹配,图像翻译,视频对象分割
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
- OCR论文综述(含文字识别、文本检测、端到端和数据集合)
OCR综述概览 主要分为四个部分 文字识别.文本检测.端到端文字识别和数据集的介绍 1. 文字识别 指标为f1-score Conf. Net Title SVT IIIT5K ICDAR13 TPA ...
最新文章
- JavaScript(六)函数
- 流程图的制作技巧分享,手把手教你如何画流程图?
- redis 永不过期 java_死磕 Java
- Apache与Tomcat使用
- 生成最简单的验证码图片的Java代码
- 知识图谱应用实战案例100篇(一)-阿里巴巴超大规模知识图谱预训练实践:商品分类
- Nginx设置TCP上游服务器的SSL配置
- MySQL String Functions and Operators(字符串处理)
- 如何利用Printconfig dll:从 iPhone 到 NT AUTHORITY\SYSTEM 的真实案例
- 使用Redis+java(模仿数据库)实现对象存取和读取
- html初识教学反思,五年级长方体的认识教学反思
- c#【 网络日志解析工具】开发篇-【媒体预览功能】--base64,webp响应解码为图片-》可做复制base64进行图片查看
- 小米洗手机拆解自动关机
- 如何玩转腾讯云学生服务器(新手指南)
- Logstash:从grok到5.X版本的dissect
- android7.x Launcher3源码解析(2)---框架结构
- Python爬虫实战(1):抓取毒舌电影最新推送
- Spring Security 配置白名单访问后,仍然报错403
- 动规 - 最大子矩阵问题
- javascript es6常用语法
热门文章
- 第四周课程总结试验报告(二)
- 第四篇 群聚类非线性表的编程实验 第11章 应用图的遍历算法编程
- Python基础--1.2 变量循环基础介绍
- Python老男孩 day16 函数(六) 匿名函数
- 使用 Azure PowerShell 管理 Azure 虚拟网络和 Windows 虚拟机
- [SDOI2011]染色
- uva111346Probability
- Android——数据存储(课堂代码整理:SharedPreferences存储和手机内部文件存储)...
- 自定义UITableViewCell需注意的问题
- get_attribute中的value是什么类型的?_建设工程项目中都有什么类型的监理?