作者:谢彬彬

单位:厦门大学

语义解析(semantic parsing)是指输入一段自然语言语句产生一段机器可以执行的表示如SQL语句等。它是自然语言处理的一个基础性问题,其研究促进了自然语言可解释性研究的巨大发展. 随着深度神经网络的广泛应用,现有模型多是基于深度学习的神经网络语义解析器,其方式已经不再强烈依赖于手工设计的语法,词典等信息,但仍然面临通用性差,不能较好处理复杂的组合逻辑,长距离依赖等问题。此外,为了满足实际应用场景的需要,多轮的语义解析任务,大规模预训练模型的使用,zero-shot问题等也得到了研究者们广泛的关注。

AAAI 2021会议主要包含以下6篇与语义解析任务相关的文章:

[1] Iterative Utterance Segmentation for Neural Semantic Parsing.

[2] Improving Tree-Structured Decoder Training for Code Generation via Mutual Learning.

[3] Learning Contextual Representations for Semantic Parsing with Generation Augmented Pre-Training.

[4] Leveraging Table Content for Zero-Shot Text-to-SQL with Meta-Learning

[5] Dynamic Hybrid Relation Exploration Network for Cross-Domain Context-Dependent Semantic Parsing.

[6] Tracking interaction States for Multi-Turn Text-to-SQL Semantic Parsing

这6篇文章按应用场景来分,主要分为以下三大类:

1)输入一段自然语言,输出一段机器可执行表示。该任务主要包含[1][2]两篇文章。

其中[1]关注于输入自然语句中的组合结构,其将未知的语义组合拆分为多个已知的结构,从而增强了模型的通用性。其工作在原有语义解析框架的基础上,提出了一个新型的利用组合原则的框架。该框架迭代式的将原始自然语句进行划分,同时将其解析为部分可执行的意义表示。通过不断迭代,利用先前已产生的部分表示,生成最终的结果。

而[2]一文则是关注于解码器端是树形结构的模型,其仅使用单一方向信息从而无法有效建模的问题。该文章探究了基于不同遍历顺序(深度先序遍历与广度优先遍历)的神经网络目标端生成方式,从上下文建模和生成数据的错误分析等角度,考虑不同遍历方式之间的差异。为了综合不同生成方式的优点,本文引入互学习框架来联合训练该模型。此方法具有很好的通用性,适用于文本生成任务的所有树形解码器训练。

2)输入一段自然语言,模式(由表组成)和表的列名,输出一段可执行意义表示。该任务主要包含[3][4]两篇文章。

论文[3]通过对生成的目标sql语句的错误进行分析,观察到现阶段预训练模型中存在的问题有:1.不能有效的匹配和删除列名 2. 不能从表中单元格的值隐式推断出列名 3. 模型较难处理复杂的组合查询问题。论文提出了一个GAP(Generation Augmented Pre-training)模型,其通过生成式模型产生高质量的预训练数据,并且针对上述三大问题设计特定的子任务,从而更好的表示自然语句和表结构。

[4]一文则是关注于单个表结构中存的zero-shot问题,其论文主要基于1.表中单元格的值含有丰富的信息能够预测表的列名 2.同时meta-learning的方式能够使得模型在不同表结构数据训练中更具通用性,从而缓解zero-shot问题。基于上述两大出发点,[4]提出了基于表格内容增强的模型,同时去编码输入的自然语句,表的各列名,单元格值,同时利用zero-shot meta-learning算法使得增强的模型更具有通用性和竞争力。

3)多轮的语义解析任务, [5][6]两篇文章均关注于在多轮解析过程中信息交互(状态/图)更新变化问题。

[5]提出一个动态图结构,能够有效的建模上下文输如自然语句(词级别和句子级别),表结构等以及其交互的动态变化过程。同时该框架利用了memory衰减机制,利用归纳偏置,丰富上下文关系表示,并且利用动态memory机制的特征加强了解码时的重排序模型。

而[6]则考虑历史产生的sql语句,当前自然语句内容以及表结构的交互过程。文章为表结构和sql关键字定义了两种交互状态,分别用图网络和非线性层来更新这两种状态。利用这种动态更新的表结构状态表示和sql状态表示来生成目标端的SQL查询语句。

总的来说,在语义解析这个任务中,图结构依然是研究者关注的主要数据形式之一,同时预训练,蒸馏学习,meta-learning等技术更是处理问题的主要手段。研究者们从对数据错误分析处理的多种不同角度出发,设计出更具有可解释性,更满足真实应用场景,动态有效的处理方案。

推荐阅读:

AAAI 2021 | 图神经网络 · 最新进展解读

AAAI 2021 | 机器翻译 · 最新进展解读

AAAI 2021 | 情感分析 · 最新进展解读

AAAI 2021 | Transformer · 最新进展解读

AAAI 2021 | 多模态 · 最新进展解读

【关于智源社区】

智源社区隶属于北京智源人工智能研究院,我们致力于创建一个AI领域内行人的交流平台。

在这里你有机会参与全年线上线下百场专题论坛,与顶尖学者零距离接触;也可以与同行探讨领域前沿,碰撞思想火花。如果你更想进入微信群与更多同行人发起实时讨论,或者加入「青源会」结识更多研究伙伴,或者成为智源社区编辑参与更多文字工作,欢迎填写以下表单(扫描二维码)进行申请。

AAAI 2021 | 语义解析最新进展解读相关推荐

  1. AAAI 2021 | 情感分析最新进展解读

    图片来源:网络 作者:陆鑫,赵妍妍,秦兵 单位:哈尔滨工业大学 情感分析是自然语言处理中的一个重要研究领域,其相关应用在各种真实场景中发挥着重要作用. 近年来,基于深度学习的方法逐渐成为情感分析的主流 ...

  2. AAAI2021 | 图神经网络最新进展解读

    作者:纪厚业,北京邮电大学,智源 AAAI预讲会讲者 近年来,图神经网络(GNN,Graph Neural Network)逐渐成为人工智能领域的一大热门领域.GNN的一大优势是能够使各个领域(不仅仅 ...

  3. CVPR 2021 双目图像压缩最新进展

    CVPR 2021 图像压缩最新进展 有预训练: 首先分享的主题为:图像处理 (实际内容为图像压缩) 两位讲者分别是来自北航的邓欣和鹏城实验室的柏园超. 论文一 论文名称:Deep Homograph ...

  4. 【更新发布】官方研发团队:TensorFlow 2 最新进展解读

    TensorFlow 开源生态系统是什么?有哪些最新进展?别急,我们为你整理了TensorFlow 中国研发团队负责人李双峰在CSDN 主办的第三届 AI 开发者大会 7 月 3 日的主论坛上进行&l ...

  5. CVPR 2021 底层视觉最新进展分享

    微软亚洲研究院 2021 CVPR 论文分享会已完美结束.今日起,CV君将根据不同类别的分享主题进行逐一分享,欢迎查收! 今日分享的主题为:底层视觉 论文一 论文名称:Neighbor2Neighbo ...

  6. CVPR 2021 图像生成最新进展,论文分享会回放

    微软亚洲研究院 2021 CVPR 论文分享会已完美结束.今日起,CV君将根据不同类别的分享主题进行逐一分享,欢迎查收! 首先分享的主题为:图像生成 论文名称 论文一:Information Bott ...

  7. AAAI 2021最佳论文《Informer》作者:Transformer 最新进展

    作者:周号益,彭杰奇 单位:北京航空航天大学 自2017年,Ashish Vaswani等人在<Attention Is All You Need>这篇文章种提出了Transformer模 ...

  8. 从ICCV 2021看夜间场景自监督深度估计最新进展

    ©作者 | 青青韶华 单位 | 中科院自动化所博士生 研究方向 | 计算机视觉 单目深度估计虽然在数学和几何上是一个不适定问题(ill-posed),但是随着卷积神经网络的发展,依靠数据驱动的单目深度 ...

  9. AAAI 2021 | 基于动态混合关系网络的对话式语义解析方法

    作者|惠彬原,耿瑞莹,黎槟华,李永彬,孙健 单位|阿里巴巴达摩院Conversational AI团队 引言 机器可以自己写 SQL 语句吗?当然可以~只需要用自然语言描述你的想法即可,甚至还能进行多 ...

最新文章

  1. Running Spark on YARN
  2. Linux time ls命令:用户态内核态分别占用多长时间
  3. vue-cli 相同页面的跳转,但路由参数不同的情况下 组件状态没有更新的问题是为什么 如何解决
  4. f5 会话保持 负载均衡_F5负载均衡配置-运维管理
  5. smp架构与numa架构_NUMA架构和Java
  6. codeforces 133A-C语言解题报告
  7. Django中使用ajax技术概述
  8. JS---Math.Random()*10--[0,10)随机变颜色
  9. 视频时序与BT1120的关系 FPGA实现BT.1120编码
  10. Python 中还藏着这些稀奇古怪的东西...
  11. Python根据已知Y值求斜率和截距
  12. python(输入)正常返回否则出错重新
  13. 初识Calcite——使用实例
  14. 丁总路由器设置以及401联网
  15. 最重要Python面试题,逻辑题,Python与数学之美
  16. 使用Qpaint在图片上写文字
  17. cmd操作MySQL 多表查询(日记 day 4)
  18. 【Bug解决】Could not find resource com/kuang/mapper/Mapper.xml
  19. 创建一个包含1-10的立方的列表
  20. Python基础,类的继承,类的多态继承等

热门文章

  1. jmeter mysql plugin_jmeter连接mysql遇到的问题
  2. electron 托盘图标闪烁_从零到一,用 Electron 开发桌面效率工具
  3. ie浏览器修复工具_电脑故障修复不求人!50个小工具可帮你一键修复
  4. php stortime,文件存储 - Laravel 5.8 中文文档手册 - php中文网手册
  5. python 今日头条 微头条_头条号运营技巧:如何玩转微头条?
  6. nacos 怎么配置 里的配置ip_Nacos部署--配置中心
  7. 鸿蒙os系统的iphonexr,iPhoneXS/XR终极防水测试:iPhoneXR不幸阵亡
  8. matlab传递闭包动态聚类图,用SPSS制作3D散点图全方位动态展示K均值聚类效果
  9. cpu满了卡住 linux_Linux系统中CPU占用率较高问题排查思路与解决方法
  10. excel 按数据拆分 xlam_利用EXCEL提升效率之五分钟缩短至五秒批量合并EXCEL批量转换PDF批量上传报关单随附单据___EXCELVBA...