来源:AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2019-8-14

引言

    两篇文章与大家分享,第一篇作者对通用文本匹配模型进行探索,研究了构建一个快速优良的文本匹配模型所需条件,在此条件下,其模型性能与最先进的模型相当,且参数少速度快(6倍);第二篇主要研究了集成语言输入特征对神经网络模型产生的影响,并且发现输入特性对性能的影响比我们研究的任何体系结构参数都要大。

First Blood

TILE: Simple and Effective Text Matching with Richer Alignment Features.

Contributor : 南京大学&&阿里AI团队

Paper: https://www.aclweb.org/anthology/P19-1465

Code: https://github.com/hitvoice/RE2

文章摘要

    文中提出了一种快速、强悍神经网络方法来用于通用文本的匹配。我们研究了构建一个快速且性能良好的文本匹配模型的足够条件,并建议保持三个用于序列间对齐的关键特性:原始点对齐特性、先前对齐特性和上下文特性,同时简化所有剩余组件。我们在自然语言推理、意图识别和答案选择等任务中,对4个研究良好的基准数据集进行了实验。我们的模型性能与最先进的模型相当,并且使用的参数更少,除此之外,在推理速度方面与类似模型的相比,至少要快6倍。

本文模型算法RE2

    下图给出了总体架构的说明,两个文本序列在预测层前对称处理,除预测层中参数外的所有参数在两个序列之间共享。

    其中,对齐融合层的输入分为三个部分:原始点态特征(嵌入向量,用空白矩形表示)、先前对齐特征(剩余向量,用对角线矩形表示)和上下文特征(编码向量,用实矩形表示)。右边的架构与左边的架构相同,所以为了简洁起见省略了它。

Augmented Residual Connections(增强剩余链接)

    为了给对齐过程提供更丰富的特性,RE2采用了增强版的剩余连接来连接连续块。在增强剩余连接的情况下,对齐和融合层的输入分为三个部分,即原始的点方向特征(嵌入向量)、先前对齐特征(残差向量)和后编码层上下文特征(编码向量)。这三个部分在文本匹配过程中都起到了互补的作用。

AlignmentLayer(对齐层)

    对齐层(如上面架构图所示)将来自两个序列的特性作为输入,并计算对齐后的表示形式作为输出。

Fusion Layer(融合层)

    融合层比较三个透视图中的局部表示和对齐表示,然后将它们融合在一起。

Prediction Layer(预测层)

    预测层以池层中v1和v2两个序列的向量表示作为输入,预测最终目标。

实验结果

主要用到的测试集

SNLI是一个用于自然语言推理的基准数据集。

Scietail是一个由科学问答构成的分类数据集。

Quora Question Pairs2 是一个用于意图识别的数据集,有两个类指示一个问题是否是另一个问题的意图。WikiQA是基于维基百科的基于检索的问答数据集。

自然语言推理上结果

意图识别结果

答案选择结果

Double Kill

TILE: Extending Neural Question Answering with Linguistic Input Features

Contributor : 比勒费尔德大学(德国)

Paper: https://www.aclweb.org/anthology/W19-5806

Code: None

文章摘要

    在一般领域数据集中,基于神经网络的问答已经取得了相当大的进展。为了探索有助于问答模型推广潜力的方法,我们重新实现了最先进的体系结构,在开放域数据集上执行参数搜索,并评估了集成语言输入特征(如部分语音标记、句法依赖关系和语义角色)的第一种方法。 实验结果表明,添加这些输入特性对性能的影响比我们研究的任何体系结构参数都要大。这些语言知识层有可能显著提高神经网络QA模型的泛化能力,从而促进跨域模型转移和领域无关的QA模型的开发。

利用语言输入特性扩展QANet

    为了评估神经网络QA模型中语言输入特性对齐产生的影响,我们利用QANet(作者重新实现)作为测试平台。当尝试将模型调整到其他领域时,这可能会发生意想不到的结果:虽然获取额外的训练数据代价比较大,但是这些语言输入特性可以通过提供尺度变换、领域无关的信息源来提高性能。我们使用三种不同的语言特性来扩展每个单词的输入:词性标注、依赖关系标记和语义角色。

PoSTags(词性标注),我们假设输入标记的语音部分信息将有助于神经网络通过减少特定问题的答案候选数量,为了提取所有上下文与问题的PoStag,我们使用spaCy library数据集中的粗略PoStag。

Dependency Relation Labels(依赖关系),我们使用spaCy提取问题和上下文的依赖信息。

Semantic Roles(语义角色),语义角色标记(SRL)通过识别事件(谓词)及其参与者(语义角色)来发现句子中浅层的语义结构。 我们对Bert模型做了进一步的修改,其中主要修改的如下:

QANet语言特征的整合,在标准的QANet体系结构中,单词和对应的字符被单独嵌入,然后连接起来,以获得每个输入单词的一个表示向量。在Sennrich和Haddow(2016)之后,我们通过将上面描述的每个语言输入特征映射到它自己的嵌入空间,然后将它们包含到连接中,从而丰富了这个过程。下图显示了QANet的输入嵌入层的更新版本,其中包括语言输入特性。

实验结果

训练参数对实验结果的影响

改变每种类型的输入特征及其组合的嵌入维数的结果

三种语言输入特征相结合的结果

ACED

Attention

更多自然语言处理相关知识,还请关注AINLPer公众号,极品干货即刻送达。

antd 文本域超长问题_「自然语言处理(NLP)」阿里团队--文本匹配模型(含源码)...相关推荐

  1. nmt模型源文本词项序列_「自然语言处理(NLP)」阿里团队--文本匹配模型(含源码)...

    来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2019-8-14 引言 两篇文章与大家分享,第一篇作者对通用文本匹配模型进行探索,研究了构建一个快速优良的文本 ...

  2. antd 文本域超长问题_一款能快速批量处理SQL文本的软件:NimbleText

    前言 做为一个后台程序员,在日常工作中,经常会遇到领导扔给一个Excel,让把 Excel 的数据导入数据库的情况. 如果只是少量数据,几条甚至说几十条,还可以勉强地组织一下 insert 插入语句: ...

  3. (含源码)「自然语言处理(NLP)」社区问答评估Bert模型优化

    来源: AINLPer 微信公众号(每日更新-) 编辑: ShuYini 校稿: ShuYini 时间: 2020-03-21 引言: 本文分享的内容主要包括社区问答质量评估(基于Bert模型微调). ...

  4. 图片管理系统源码_「程序员分享」基于SpringBoot开发的天猫商城源码

    前言 大家好,我是程序员it分享师,应粉丝的要求,今天给大家带来一个基于Springboot开发的天猫商城的源码! 使用技术 天猫商城系统使用的是Spring,SpringMvc,SpringBoot ...

  5. 「自然语言处理(NLP)」神经机器翻译(NMT)论文整理(一)

    来源: AINLPer 微信公众号(每日更新-) 编辑: ShuYini 校稿: ShuYini 时间: 2020-02-27 引言: 下面是作者整理的关于神经机器翻译(NMT)相关的论文文章,下面这 ...

  6. 「自然语言处理NLP」的“高光时刻” --- 28篇标志性论文

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 自然语言处理专家elvis在medium博客上发表了关于NLP在2019年的亮点总 ...

  7. 2019年「自然语言处理NLP」的“高光时刻” --- 28篇标志性论文

    点击上方"深度学习技术前沿",选择"星标"公众号 资源干货,第一时间送达 自然语言处理专家elvis在medium博客上发表了关于NLP在2019年的亮点总结. ...

  8. 28篇标志性论文见证「自然语言处理NLP」2019-2020年度亮点进展

    来源:专知 [导读]自然语言处理专家elvis在medium博客上发表了关于NLP在2019年的亮点总结.对于自然语言处理(NLP)领域而言,2019年是令人印象深刻的一年.在这篇博客文章中,我想重点 ...

  9. 「自然语言处理(NLP)」中文自然语言处理可能用到的数据集

    来源: AINLPer 微信公众号(每日更新-) 编辑: ShuYini 校稿: ShuYini 时间: 2020-08-08 引言: 给大家分享一下中文自然语言处理可能用到的数据集,感兴趣的小伙伴可 ...

最新文章

  1. SpringBoot 整合 Shiro 实现动态权限加载更新+ Session 共享 + 单点登录
  2. UVA11584 划分成回文串 Partitioning by Palindromes(线性DP划分+DP判断回文串)
  3. Angular基础(五) 内建指令和表单
  4. java凌晨12点_java - JAVA如果我在每天中午12点之后安排我的时间表,会发生什么? - SO中文参考 - www.soinside.com...
  5. chrome设置微信ua_新支付宝json_ua分析
  6. mysql 5.7.18 winx64安装配置方法
  7. .aspx页面 引用命名空间 (Import 指令,web.config)
  8. 【李宏毅2020 ML/DL】P118 RL - Model-based, Meta, Multi-agent, Alpha
  9. 线上环境websocket连接地址_WebSocket:沙盒里的TCP
  10. 在 NXP iMX8 上进行 4K 视频播放测试
  11. 18位身份证标准及验证
  12. 巴塞尔iii_巴塞尔协议——银行风控实施的超级系统工程 之二
  13. HTTP response codes
  14. 刘强东带到石头村什么宝贝?飞翔鸽、“村长刘”品牌、歌唱家!
  15. 赛尔号桌面版_赛尔号电脑版下载 赛尔号电脑版下载
  16. 让ChatGPT来制作Excel表格,ChatGPT实现文本和表格的相互转换
  17. 软件测试之冒烟测试中易犯的三个误区--新梦想软件测试
  18. 欧拉筛法(线性筛)的学习理解
  19. 新型冠状病毒之物资的分配
  20. 大佬们的“受锤”往事

热门文章

  1. Spring @Autowired 注入为 null
  2. bzoj2067: [Poi2004]SZN
  3. Flink-on-yarn
  4. 阿里云oss数据迁移到腾讯云cos 方法二(强烈推荐)
  5. 利用SQL模糊匹配来验证字段是否是日期格式
  6. canvas剪辑区域
  7. js全局变量和局部变量
  8. 随机分配座位,共50个学生,使学号相邻的同学座位不能相邻
  9. Oracle单实例下oracle数据库从文件系统迁移到ASM上
  10. Oracle笔记 八、PL/SQL跳转/判断/循环语句块