近日,国际AI顶尖学术会议ACL 2021(Annual Meeting of the Associationfor Computational Linguistics)公布了论文录用结果。网易伏羲共有三项研究被本届ACL收录,内容包括自然语言生成、无监督文本表示学习等方向,相关技术已应用于游戏、文创及智慧文旅等行业。

ACL由国际计算语学协会主办,是自然语言处理(NLP)与计算语言学领域最高级别的学术会议,被中国计算机学会(CCF)列为A类国际学术会议,涵盖语言分析、信息抽取、机器翻译与自动问答等各个领域。本届ACL共收到3350篇论文投稿,其中主会论文录用率为21.3%。

除三篇收录论文外,网易伏羲提交的一篇演示论文(Demo Paper)也引发了评审高度关注。该论文主要探讨手游《遇见逆水寒》中所采用的“大宋傀儡戏”玩法。

傀儡戏起源于汉代,又名木偶戏。游戏中,AI就像傀儡,而玩家则是提线操控的“傀儡师”。根据玩家输入的语句,AI能自动编写故事,与玩家共创剧本。

据了解,“大宋傀儡戏”玩法是中文领域首个采用大规模预训练语言模型的开放域文字游戏,融入了网易伏羲的多项算法创新。一方面,网易伏羲通过设置剧情目标、任务奖励等玩法创新方式,规避了游戏中滥用AI编剧的情况发生;另一方面,通过在模型压缩、推理加速等多个环节进行创新,线上服务的成本也得以有效降低。目前,网易伏羲正在利用更大规模的预训练语言模型,持续优化该玩法,为玩家带去更好的体验。

紫色对话框为网易伏羲AI自动撰写

以下为ACL2021网易伏羲录用文章介绍:

《OpenMEVA:一个评估开放式故事生成指标的基准数据集》

在自然语言生成(NLG)领域,如何尽量客观、准确地评价AI自动生成的文本质量,是一大行业难题。

目前,主要有两种评估NLG系统的方法:人工评估和自动评估指标。相较之下,人工评估在准确性和有效性上更胜一筹,自动评估指标则在成本和效率上更具优势。随着NLG的快速发展,现有的评估方式越来越难以满足行业痛点,一系列评估NLG系统质量的新方法也应运而生。

由于缺乏标准化的基准数据集,无论是全面衡量指标的能力,还是比较不同指标的性能,都极为困难。为此,网易伏羲与清华大学的黄民烈老师团队合作提出了一个针对自动评估指标的基准数据集“OpenMEVA”。借助“OpenMEVA”,可以全面评估针对开放式故事的自动评估指标性能:包括自动生成指标与人工评估的相关性,对不同模型输出和数据集的泛化能力,故事语篇连贯性能力,以及对扰动的稳健性等。

《人工位置信息残留会通过MLM预训练模型动态词向量传播》

文本表示学习,是指将文本字符串表示转化成计算机能处理的分布式表示的过程。文本表示学习是基于深度学习的自然语言处理的基础,良好的文本表示可以大幅提升算法效果。

本研究中,网易伏羲基于掩码语言模型(Masked LanguageModel),从预训练语言模型中抽取了各层文本分布式表示,并从中发现了一个共同但并不理想的特征:在BERT和RoBERTa的隐状态向量中,持续存在有离群神经元的情况。

在SST-2和QQP数据集上的Bert-base各层平均向量

为研究该问题的根源,网易伏羲引入了一种神经元级别的分析方法。该方法显示,异常值与位置嵌入(Position Embedding)所捕获的信息密切相关,而这些异常值是造成编码器原始向量空间各向异性的主要原因。

通过剪除这些异常值,可以提高各向量的相似度。剪切后的向量可以更准确地区分词义;同时,使用均值池化(Mean Pooling)后,可以得到更好的句子嵌入。

《通过对句子层面和语篇层面的一致性进行建模来生成长文本》

预训练任务示意图

AI自动生成连贯的长文本,本身就是一项极具挑战的任务。而故事生成这类开放式的文本生成任务则更为困难。

尽管在句内连贯性上,现有的大规模语言模型表现不俗,但要保持整体生成文本的连贯性,依旧非常困难。这是因为在上下文中,很难捕捉到超越token级别共现的高级语义和语篇结构。

本研究中,网易伏羲和清华大学黄民烈老师团队合作提出了一个长文本生成模型,可以在解码过程中,在句子层面和语篇层面上表示上下文。借助两个预训练任务,模型通过预测句子间的语义相似性、区分正常和打乱的句子顺序来学习表征。实验表明,在生成文本的连贯性上,该模型优于现有最先进的基线模型。

更多精彩推荐  王炸不断,半导体巨头们到底在打什么牌?
Python 爬影评,《悬崖之上》好看在哪里?热文 | 卷积神经网络入门案例,轻松实现花朵分类点分享点收藏点点赞点在看

厉害了,网易伏羲三篇论文上榜 AI 顶会 ACL相关推荐

  1. 人工智能顶会AAAI 2023放榜!网易伏羲7篇论文入选

    近日,第37届国际顶级人工智能学术会议 AAAI Conference on Artificial Intelligence(简称AAAI)揭晓了论文接收结果,网易伏羲实验室共有7篇论文入选.作为人工 ...

  2. 网易伏羲三项研究入选CVPR:AI感知表情能力将达到人类水平

    2021-03-05 17:52:16 2月28日,人工智能顶级会议CVPR 2021(国际计算机视觉与模式识别会议,Conference on Computer Vision and Pattern ...

  3. 三篇论文入选国际顶会SIGMOD,厉害了腾讯云数据库

    好消息!6月13日,腾讯云数据库三篇论文再次入选数据库行业顶会SIGMOD,被SIGMOD 2022 Research Full Paper(研究类长文)收录. 本次被收录的研究成果中,新型数据结构设 ...

  4. 2020年11月总结(自动驾驶测试三篇论文介绍)

    "你觉得,在未来的多久之内,我们的生活可以看到有明显的改变呢?"在地铁上,F.W.H问他的一位同学. "你是指说我们在事业和家庭上有一定成就?" "我 ...

  5. 小米和西工大联手,三篇论文被Interspeech接收

    翻译 | 林椿眄 编辑 | 阿司匹林 出品 | 人工智能头条(公众号ID:AI_Thinker) 小米和西北工业大学的"交情"不浅. 去年 7 月,小米和西工大计算机学院的谢磊教授 ...

  6. GPT-3等三篇论文获NeurIPS2020最佳论文奖 | AI日报

    为 AI 内行人定制资讯, 帮你一篇尽览 AI 行业要闻. GPT-3等三篇论文获NeurIPS2020最佳论文奖 今日NeurIPS 2020 公布了最佳论文奖和时间检验奖.OpenAI 等提出的语 ...

  7. NLP能否像人脑一样工作?CMU、MIT三篇论文详解机器和大脑范畴下NLP的关系

    本文转载自公众号机器之心 作为计算机科学领域与人工智能领域的重要研究课题,自然语言处理已经在各领域展开了广泛的研究与探讨.随着研究的深入,一些学者开始探讨机器中的自然语言处理和大脑中的自然语言处理是否 ...

  8. GPT-3等三篇论文获NeurIPS 2020 最佳论文奖!华人一作获时间检验奖

    作者 | AI科技评论 刚刚,NeurIPS 2020在官网公布了2020年度最佳论文奖和时间检验奖两项大奖! 今年一共有三篇论文共同获得最佳论文奖,其中第二篇获奖论文就是来自OpenAI团队打造的今 ...

  9. 看google三篇论文的感触

    刚开始看老师推荐的三篇Google的技术论文(分别是GFS,Mapreduce,Bigtable)时,基本上是云里雾里,摸不着头尾.于是我结合网上查询的资料,对于这些论文讲述的一些知识有了一定的了解. ...

最新文章

  1. 10.Stream流
  2. 斐波那契数列的前n项值
  3. wait 和 sleep 的区别
  4. 基于matlab/simulink的双电机速度跟踪伺服系统仿真,基于MatlabSimulink的伺服系统仿真pdf.doc...
  5. python学习笔记(15)循环设计
  6. 基于PCA的人脸特征抽取
  7. 用html语言制作古诗网页,唐诗宋词网页设计.docx
  8. linux服务之samba
  9. PowerShell 转码函数 Default-UTF8
  10. 脱库和删库的实践及解决方案
  11. lenovo微型计算机如何拆t410,拆解 ThinkPad T410
  12. 流行的移动端UI框架
  13. 性能优化:空间换时间
  14. 有人还原出了历史上的皇帝,朱元璋居然还挺帅?
  15. Jenkins企业应用进阶详解
  16. 学习突围5 - 关于计划
  17. nacos注册中心死活发现不了服务问题
  18. picpick尺子像素大小精度不够准确_如何使用像素标尺在PicPick
  19. 远程计算机一键休眠,nuc8i5远程登录-windows10频繁自动休眠解决方案
  20. 人工智能机器人是什么编程

热门文章

  1. Java Web学习总结(17)——JSP属性范围
  2. EOS与以太坊有哪些区别? 1
  3. 高可用集群之分布式文件系统
  4. Python加密—RSA加密
  5. jquery对所有input type=text的控件赋值
  6. js中 字符串与Unicode 字符值序列的相互转换
  7. 在WinXP上通过Virtual PC安装WinCE
  8. 用 GDI 操作 EMF 文件[2]: PlayEnhMetaFile、DeleteEnhMetaFile
  9. java地图上标记_绘制点标记-在地图上绘制-开发指南-Android 地图SDK | 高德地图API...
  10. Java工具类-转换字符编码