前言:SParC是一个基于 Spider 数据集扩展的有上下文依赖的对话是 Text-to-SQL 数据集。不同于 Spider 一句话 对应一个最终 SQL,SParC 通常需要通过多轮对话来实现用户的查询意图,并且在交互过程中,用户会省略很多之前提到的信息,或者新增、修改之前提到过一些内容,使得该任务更具挑战性。

基本信息

  • 标题:SParC: Cross-Domain Semantic Parsing in Context

  • 作者:Tao Yu等

  • 单位:耶鲁大学,Salesforce公司

  • 会议:ACL 2019

  • 论文链接: https://arxiv.org/pdf/1906.02285.pdf

  • Github榜单:https://yale-lily.github.io/sparc

  • 数据集下载:google drive、百度云盘 提取码 rdwg

榜单概览

截至 2021年5月22日,该数据集的榜单最高准确率(Accuracy)才 Question Match 62.4%,Interaction Match 38.1%,而且第一名还是数据集作者本人 余涛。Spider、SParC、CoSQL数据集都是他们组发布的,相应的也刷了很多会议论文,很是羡慕了,自己做数据集,提出模型,发表论文,不断迭代。

数据集简介

首先,文中举了两个 SParC 的数据样例,来直观感受一下这种对话式的,且问句(Question)有上下文依赖的 Text-to-SQL数据集样例。这类数据集最早的是 ATIS 数据集(发表于 1990 和 1994 的两篇论文中),是关于航班预订的单领域多论文对话 Text-to-SQL 数据集。本文提出的 SParC 数据集相对于 ATIS 有如下三大优势:

  • 1、问句有更复杂的上下文依赖关系;

  • 2、语义上有丰富的多样性;

  • 3、天然需要更强的泛化能力,因为涉及跨领域,且训练/验证/测试的数据库完全各自独立,互不交叉。

下表为 SParC 与当前已有的 Text-to-SQL 数据集的对比,主要是看和 ATIS 的对比:

之前提到 SParC 上下文有更复杂的依赖关系,主要是以下四种情况:

从上表可以看出,每种情况都有对应的解释和一个例子,及在整个数据集中所占比例,介绍如下:

  • 1、Refinement,即当前问题和上一个问题问的还是同一个实体,但约束条件不一样了

    • 前一个问题是:哪个专业的学生最少?

    • 后一个问题是:哪个专业最受欢迎?(即哪个专业学生最多?)。

    • 问的都是【专业】这个实体,只是约束条件变化了。

  • 2、Theme-entity,即当前问题问的是上一个问题中提到实体的其他属性

    • 前一个问题是:Anonymous Donor Hall 这个大厅的容量是多少?

    • 后一个问题是:列出它的所有便利设施。(即 Anonymous Donor Hall 大厅的所有便利设施有哪些?)。

    • 问的都是关于【Anonymous Donor Hall】这个实体,只是两个问题所问的实体属性不同。

  • 3、Theme-property,即当前问题问的是另外一个实体的同一个属性

    • 前一个问题是:告诉我 Double Down 这集的【排名】是多少。

    • 后一个问题是:那么 Keepers 这集呢?(即 Keepers 这集的【排名】是多少?)。

    • 问的都是【排名】这个属性,只是对应的实体不一样。

  • 4、Answer refinement,即当前问题问的是上一个问题的子集

    • 前一个问题是:请列出【所有系】的名字?

    • 后一个问题:【统计系】所有老师的平均薪资是多少?

    • 很显然,【所有系】→ 【统计系】

数据集的统计分析数据上和 ATIS 的对比如下:

不同轮数之间的 SQL token 的重叠比例,以此来看出每句之间的重叠程度,从下图可以看出,相邻的两轮之间重叠程度更多。

实验

作者主要对比了两个 baseline 模型,CD-Seq2Seq 和 SyntaxSQL-con。主实验结果如下:

这是个很有意思的结果,在 Question Match 这个指标上,SyntaxSQL-con 更胜一筹,而在 Interaction Match 指标上 CD-Seq2Seq 更高一些。文中也分析了原因,即 SyntaxSQL-con 在第一轮对话时表现出更高于 CD-Seq2Seq 的准确率,故拉升了在 Question Match 这个指标的分数,而随着对话轮数的增多,效果明显不如 CD-Seq2Seq,这是因为 CD-Seq2Seq 在建模历史对话内容的能力上更强一些,更能有效利用历史信息,所以在 Interaction Match 指标上效果更好。

下面是对话轮数和分数的表格:

更多有用的干货,欢迎关注我的 Gong众号:【AI分享者】,不定期更新实用工具、科研干货、竞赛刷题心得等。

SParC: Cross-Domain Semantic Parsing in Context 论文解读相关推荐

  1. [Scene Graph] Neural Motifs: Scene Graph Parsing with Global Context 论文解读

    [Scene Graph] Neural Motifs: Scene Graph Parsing with Global Context (CVPR 2018) 论文解读 简介 这篇文章工作的创新之处 ...

  2. Domain Adaptation via Prompt Learning论文解读

    摘要部分 无监督域自适应(UDA)旨在将从注释良好的源域学习到的模型自适应到只给出未标记样本的目标域.当前的UDA方法通过对齐源和目标特征空间来学习域不变特征.这种对齐是由统计差异最小化或对抗性训练等 ...

  3. 论文笔记:HIE-SQL:History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing

    论文笔记:HIE-SQL: History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsin ...

  4. 转发:【论文精读】Human Semantic Parsing for Person Re-identification

    Introduction 目前大部分的Person ReID方法都开始集中于提取更加具有表征能力的局部特征辅助全局特征用于行人检索.这篇文章是CVPR2018中关于Person ReID的一篇,文章的 ...

  5. 论文导读|《Exploiting Rich Syntactic Information for Semantic Parsing with Graph-to-Sequence Model》

    北京大学 张欣博 原文<Exploiting Rich Syntactic Information for Semantic Parsing with Graph-to-Sequence Mod ...

  6. 论文解读《Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision》

    论文解读<带有交叉伪监督的半监督式语义分割法> 论文出处:CVPR2021 论文地址:论文地址 代码地址:代码地址 一 摘要: (1) 本文通过研究有标签数据和无标签数据,研究了半监督语义 ...

  7. 语义分析(Semantic Parsing)调研

    semantic parsing 调研综述 任务说明 semantic parsing,语义解析,从名称上来说,是一种相对于语法分析级别上更为高层的分析.具体来说,通常指的是将自然语言转换成为机器可以 ...

  8. Cross Domain Knowledge Transfer for Person Re-identification笔记

    Cross Domain Knowledge Transfer for Person Re-identification笔记 1 介绍 2 相关工作 3 方法 3.1 特征提取的ResNet 3.2 特 ...

  9. Deep Mask Memory Network with Semantic Dependency and Context Moment for Aspect Level Sentiment Clas

    这篇博文是Deep Memory Network在Aspect Based Sentiment方向上的应用的一部分,如果你已经熟知深度记忆网络并且看过其在ABSA的应用,只想看这篇论文,可以跳过直接阅 ...

最新文章

  1. 怎么样才能快速的把淘宝店铺推广出去
  2. 【青少年编程】【一级】森林的一天
  3. 270个开源项目,总计24w星,帮你快速找代码
  4. 【转】 LINUX中IPTABLES和TC对端口的带宽限制 端口限速
  5. Android 项目,没有可运行的Module项
  6. c#中 uint_C#中的uint关键字
  7. Redis面试常问3 如何实现分布式锁 记住Redis的原子性
  8. 计算机网络(七)——无线局域网
  9. 三星Galaxy Fold全球翻车后 推迟发售时间进一步改进
  10. SpringBoot 整合 MyCat 实现读写分离
  11. 挑战Textarea——把textarea中的HTML写入数据库
  12. 5G 是时候商用了?| 程序员硬核评测
  13. 微软:四种方法暂时屏蔽IE最新漏洞
  14. 【CCCC】L3-023 计算图 (30分),dfs搜索+偏导数计算
  15. 计算机开机无讯号,【图片】电脑突然开机没反应,显示器没信号!~【显卡吧】_百度贴吧...
  16. sizeof和strlen的简单使用方法和区别
  17. 随机森林模型及案例(Python)
  18. Maven的setting配置详解
  19. 哈尔·埃尔罗德《早起的奇迹》读书笔记
  20. 计算机网络三层交换机配置,综述三层交换机配置实例 附详细命令解释

热门文章

  1. (LaTex)CTex的初次使用心得及入门教程
  2. oracle水仙花,希腊神话中的水仙花和回声
  3. 今日运势:“恶莫大于纵己之欲,祸莫大于言人之非“
  4. matlab测量直流母线上的电压,直流母线
  5. android launcher启动过程,Android应用启动过程-Launcher源码浅析
  6. Word、PPT、PDF 文件怎么批量插入首页、扉页、尾页?怎么在指定位置插入页?
  7. 微生物群落结构差异分析
  8. 【传感器大赏】酒精传感器
  9. SCSI——小型计算机系统接口
  10. 软件开发行业,年轻与大龄程序员的生存现状究竟如何?