最新!NLG顶会INLG2021最佳长论文出炉!一作华人学生代表出席今晚INLG
作者 | 吴彤
编辑 | 青暮
周杰伦三词作曲,曹植七步成诗。近年来,约束文本生成任务(在特定前提条件下生成自然语言输出)引起越来越多人的兴趣。
最新消息,华人学者 Steven Y. Feng 与四位学者Jessica Huynh、Chaitanya Narisetty、Eduard Hovy与Varun Gangal 共同发表的题为“SAPPHIIRE: Approaches for Enhanced Concept-to-Text Generation”的研究论文获得了2021年 INLG 的最佳长论文奖!
今晚,论文作者 Steven Y. Feng 将作为代表出席第14届INLG会议,线上分享自然语言生成的团队研究。
INLG(International Conference on Natural Language Generation )始于1980年代,旨在讨论和传播自然语言生成领域的突破性成果。今年,会议于9月20日至24日在苏格兰阿伯丁举行,与会者会通过虚拟会议介绍他们的研究。
除了世界级的研究报告外,今年的会议还包括研讨会、学习教程、受邀专家的讲座和一个讨论小组(讨论题目为“用户希望从NLG的现实应用中获得什么”)。小组讨论由目前在计算机学习、NLG 和认知 AI 辅助行业任职的权威学者领导。
虽然自然语言生成(NLG)的研究已经持续了70多年,但旨在将NLG落地的基础技术却是在近些年才出现。最近,越来越多学术界与产业界的资深人员也已认识到 NLG 是一种核心能力。INLG也称,会议现已从小众的专业学术组织发展成了一个产学研相结合的国际性学术交流平台。
1
获奖学者介绍
Steven Y. Feng,现为卡耐基梅隆大学(CMU)研究生,对NLP、机器学习、深度学习和人工智能研究有着丰富的经验和极高的研究热情。
个人主页:https://mobile.twitter.com/stevenyfeng
2
获奖论文
论文地址:tinyurl.com/sapphirelNLG
人类能够从常识推理,甚至反演,这种能力可以定义为从一组概念生成逻辑句子来描述日常场景。在这种情况下,这些概念是必须以某种形式在输出文本中表示的单个单词。
因此,论文作者提出了一套简单而有效的概念到文本生成改进方案,称为“SAPPHIRE”。具体来说,SAPPHIRE由两种主要方法组成:
1)增加输入概念集
2)将从baseline中提取的短语重组成更流畅、更有逻辑的文本。这些主要是与模型无关的(model-agnostic)改进,分别依赖于数据本身和模型自己的初始代。
通过使用BART和T5模型的实验,他们证明了这两种模型在CommonGen任务上的有效性。通过广泛的自动和人工评估,SAPPHIRE能显著提高模型的性能。深入的定性分析表明,SAPPHIRE有效地解决了基线模型生成的许多问题,包括缺乏常识、不够具体和流利性差等问题。
3
研究内容
6种语言生成模型的对比
以上几种NLG模型对比揭示了baseline的几个问题:
1)概念覆盖率与概念集大小密切相关,概念集越大,概念的覆盖率越低,即遗漏概念的概率越高
2)许多短语不完整
3)反应迟钝
Baseline和人工的对比
如何解决BL模型的固有问题?近年来,随着模型改进的研究取得了重大进展,许多文本生成任务的性能也得到了显著改善。
在获奖团队中,他们设计了两步走战略:通过提取关键字和注意矩阵,在训练期间从参考文献中扩充概念。对于短语重组直觉,他们提出了基于新训练阶段和掩蔽填充的两个方法。最后,通过综合评估,他们展示了SAPPHIRE是如何通过各种指标提高模型性能,以及解决baseline在常识、特异性和流畅性方面的问题。
他们的第一个方法:Kw-aug和Att-aug,分别在训练现成的关键字提取模型注意值时,从参考文献中提取关键字,使用它们在训练时扩展输入概念集。(通过动作联想场景,通过名词联想动作,也就是由名词扩增动词,由动词扩增状语等)
概念扩增
概念扩增的方法激发了Steven Y. Feng五人的想象力:是否有简单有效的方法可以从数据本身来提高这些自然语言生成的性能? 此外,是否有可能利用这些模型本身的输出来进一步提高它们的任务表现——某种"自我反省"?
在第二种方法中,他们从模型输出中提取非重叠的关键短语,然后构建一个新的概念集,其中包含这些关键短语和原始概念集中的其他非重叠概念。
也就是说,从原有的低端模型中输出“不那么流畅的句子”,然后提取新句子中的关键词,再根据新的关键词“扩增概念”。多次迭代,就能从相似逼近到精确。
如此,机器完成一轮“自我启发”,虽然并不算是自然语言范畴的“艺术创作”,却在实验中贯穿了形象思维与抽象思维经过复杂的辩证关系构成的思维方式。想象与联想,灵感与直觉,理智与情感,意识与无意识,它们在未来能否卡定在不同的向量图中,建模、量化,或许一问出口,便已有知。
参考资料:
https://twitter.com/stevenyfeng/status/1440330270058500102
最新!NLG顶会INLG2021最佳长论文出炉!一作华人学生代表出席今晚INLG相关推荐
- NeurIPS 2019 获奖论文出炉,微软华人学者Lin Xiao 获经典论文奖
导语:历史之最,参会1.3万人~ 作为最久负盛名的机器学习顶会之一,今年 NeurIPS 2019 在召开之前就消息不断:在今年论文审稿期间,NeurIPS 2019 程序委员会主席专门发布声明称,1 ...
- BERT拿下最佳长论文奖!NAACL 2019最佳论文奖公布
点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑ 作者 | 刘静 编辑 | 李尔客 本文经授权转自公众号图灵Topia(ID:turingtopia) 今 ...
- 不止最佳长论文,腾讯AI在ACL上还有这些NLP成果
编辑 | Jane出品 | AI科技大本营(ID:rgznai100) [导语]7 月 31 日晚,自然语言处理领域最大顶会 ACL 2019 公布了今年的八个论文奖项,其中最佳长论文的获奖者被来自中 ...
- 不止最佳长论文,腾讯AI在ACL上还有这些NLP成果(附论文链接)
来源:授权自AI科技大本营(ID:rgznai100) 本文约4600字,建议阅读10分钟. 本文带你了解腾讯在今年的 ACL 会议上还有哪些研究论文被录取. [ 导读 ] 7 月 31 日晚,自然语 ...
- 推荐系统遇上深度学习(九十二)-[腾讯]RecSys2020最佳长论文-多任务学习模型PLE
今天介绍的是腾讯提出的一种新的多任务学习个性化推荐模型,该论文荣获了RecSys2020最佳长论文奖,一起来学习下! 1.背景 多任务学习通过在一个模型中同时学习多个不同的目标,如CTR和CVR,最近 ...
- ACL 2017 最佳长论文,带你创造一门优雅的新语言
雷锋网 AI科技评论按:在昨天结束的ACL 2017大会的正会上,分别公布了今年的终身成就奖和五篇最佳论文奖.本篇文章雷锋网将带你一块儿来解读其中的最佳长论文<Probabilistic Typ ...
- ACL 2019最佳论文出炉:华人团队包揽最佳长短论文一作,中科院、华为等榜上有名...
郭一璞 安妮 边策 发自 凹非寺 量子位 出品 | 公众号 QbitAI ACL 2019最佳论文新鲜出炉了. 刚刚,自然语言处理领域的顶会ACL 2019公布最佳论文,本次共颁布了4个奖项,共有8个 ...
- 云栖科技评论第26期:人工智能界年度顶级会议AAAI 2017最佳论文出炉
1.人工智能界年度顶级会议AAAI 2017最佳论文出炉 人工智能界年度顶级会议AAAI 2017最佳论文出炉 [新闻摘要]人工智能界年度顶级会议AAAI2017于2月4日在美国旧金山举行,会议围绕人 ...
- 程序员为教师妻子开发专属应用;2020 最佳开源项目出炉;中国构建全星地量子通信网|开发者周刊
CSDN开发者周刊:只为传递"有趣/有用"的开发者内容! 本周热门项目 0.程序员为教师妻子开发应用:将 iPhone 变成文档摄像头 https://9to5mac.com/20 ...
最新文章
- 汇编语言中的乘除法用到的寄存器问题(较详细解析)(用到AX和DX,乘数和除数用其他寄存器和存储器)
- 蓝桥杯单片机练习_第九届彩灯控制器
- HtmlAgilityPack中SelectSingleNode的XPath和CSS选择器
- redis sorted_set数据类型常用命令及跳表skip_list原理
- python算法与数据结构-二叉树的遍历
- 项目管理其实可以简单一点——任务分工
- JAVA获取系统相关的信息
- Java如何将指定字符串转化为指定日期格式
- java报错空指针异常_分析使用Spring Boot进行单元测试时,报出空指针异常
- C#网络编程之面向连接的套接字
- 【机器学习】BP算法推导
- 描述性统计分析 | 直方图
- 微信小程序分析送积分功能如何实现_微信小程序积分商城解决方案(一)
- 线性规划单纯形法python实现与代码详细解读
- 用格式工厂旋转手机视频
- 【牛顿迭代逼近】求根号2的快速方法
- android 麻将布局,android麻将小项目1:第一天的一些收获
- PHPMyWind编辑器支持Word导入
- [蓝桥杯python] 无聊的逗:逗志芃在干了很多事情后终于闲下来了,然后就陷入了深深的无聊中。不过他想到了一个游戏来使他更无聊。他拿出n个木棍,然后选出其中一些粘成一根长的,然后再选一些粘成另一个长
- 一种激光透窗摄像机,可透过玻璃抓拍人脸