LGESQL: Line Graph Enhanced Text-to-SQL Model with Mixed Local and Non-Local Relations

笔记整理:郭心南

来源:ACL2021

链接:https://arxiv.org/abs/2106.01093

Github地址:https://github.com/rhythmcao/text2sql-lgesql

概述

本文主要关注多表关联下的自然语言转换SQL语句(Text-to-SQL)的工作,在已有的数据库中,根据描述查询内容的自然语言问句来生成相应的SQL语句用于检索,其中表与表之间存在外键的关联。

为了更好建模问题与数据库schema之间,以及schema内部 的关系,本文提出了一种结合线性有向图以及普通有向图的Text-to-SQL模型(Line Graph Enhanced Text-to-SQL Model),通过引入线性有向图,在简化图的同时突出边信息。同时本文还设计了图修剪的辅助任务,并且对局部图特征和非局部图特征进行表示上的区分。

动机

目前已经有多个工作提出用有向图的方法来构建问题与数据库schema内部之间的关系,并用图神经网络(GNN)来进行编码。然而这些方法普遍存在两个问题:

1)无法很好的找出整个查询所涉及的路径;

2)针对图中每个节点,没有对局部邻居以及非局部邻居进行区分。并且这些方法在图表征上比较注重节点的表示,而忽略了边中大量存在的语义信息。

方法

•线性有向图的构建

线性有向图中的节点和边分别是普通有向图中的边和节点,对普通有向图中顺序连接的边,在线性有向图中用有向边连接,而对于没有连接关系的边,则在线性有向图中不添加边。这种构图方法一方面增强了普通有向图中边的信息的使用,另一方面线型图能很好的找到查询所相关的主路径。

•模型

在模型方面,本文使用了两个关系图注意力神经网络(Duel Relation Graph Attention Network,简称Duel RGAT),这两个RGAT分别对普通有向图和线性有向图进行编码。

其中RGAT^n和RGAT^e分别用于普通有向图和线性有向图,X^l和Z^l分别表示第层RGAT中普通有向图和线性有向图的矩阵表示;Z_{nlc}表示线性有向图中非局部邻居部分的图;G表示RGAT的层。

RGAT的前向传播过程如下:

其中W是参数矩阵,H表示列的个数,FFN表示前向传播网络,N_i^n表示对节点v_i^n相应的表示,n表示table的序号,i表示列的序号,\phi表示对关系获取相应的向量表示。

在RGAT^n前向传播时,会使用RGAT^e中的表示,在这个过程中,本文采用了动态与静态相结合的方式。即对于RGAT^n中的某一节点来说,它会使用RGAT^e中局部邻居节点实时更新的向量表示,即动态;同时对于非局部邻居节点,它会使用预训练模型或者GloVe中的Embedding向量,即静态。

•图修剪

在主要的SQL生成任务的同时,本文还提出了图修剪的辅助任务,用于提升模型对自然语言问题相关联的schema部分的识别能力。这里采用的是分类,即对候选schema中的所有节点采用二分类的方式来判断当前节点是剪裁还是保留。

实验

本文的实验主要在Spider数据集上进行验证,并根据不使用预训练模型,实用泛用性预训练模型,和实用text-to-SQL领域特定的预训练模型来与已有办法进行对比。该方法目前结合ELECTRA结合能达到Spider的SOTA。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 | LGESQL: 结合线性有向图以及普通有向图的自然语言转换SQL语句模型...相关推荐

  1. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  2. 论文浅尝 | 图神经网络综述:方法及应用

    论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...

  3. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  4. 论文浅尝 | 近期论文精选

    本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...

  5. 论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码

    本文内容源自往期「论文浅尝」,由 PaperWeekly 精选并重新排版整理,感谢 PaperWeekly. ISWC 2018 ■ 链接 | http://www.paperweekly.site/ ...

  6. ###好好好#######论文浅尝 | 基于图注意力的常识对话生成

    论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...

  7. 论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解...

    论文作者:吴林娟,天津大学,研究方向为自然语言理解 论文链接:http://arxiv.org/abs/2204.00996 代码地址:https://github.com/wulinjuan/SSD ...

  8. 论文浅尝 - CIKM2021 | DT-GCN: 一种双曲空间中的数据类型感知的知识图谱表示学习模型...

    论文作者:申雨鑫,天津大学硕士 发表会议:CIKM 2021 链接:https://dl.acm.org/doi/pdf/10.1145/3459637.3482421 动机 知识图谱表示学习旨在将实 ...

  9. 论文浅尝 | 知识库问答中关系检测的学习表示映射

    论文笔记整理:吴涵,天津大学硕士,研究方向:自然语言处理. 链接: Paper: https://arxiv.org/pdf/1907.07328v1.pdf Code: https://github ...

最新文章

  1. 数据分析显示,疫情下数据科学家的薪水几乎未受影响
  2. Excel制作考勤管理
  3. python面向对象基础
  4. System Center 2012与vCenter Operations 产品功能对比
  5. netflix_学习Netflix管理员–第1部分
  6. 闹猴网页特效集软件 v1.0.5.21
  7. mysql 切割字符串的妙用
  8. python日志_python 日志模块
  9. JavaScript中的小陷阱(不定期更新。。)
  10. MapXtreme2004 连接oracle spatial的问题
  11. SQL Server Update:使用 TOP 限制更新的数据
  12. 黄光裕出来后,首先会做这三件事(转)
  13. C# 控制台如何播放音频文件
  14. Windows更新错误
  15. Allatori:代码混淆器的使用
  16. 解决谷歌浏览器chrome的CPU占用率过高的问题
  17. 聚焦热门框架、前端架构、工程化……,SDCC 2016前端开发专题讲师、议题大揭底...
  18. 李晨光:向着兴趣一路前行
  19. js两数相乘出现多小数
  20. 维科精密IPO过会:年营收6.8亿 实控人陈燕来父女为外籍

热门文章

  1. android 音频加载hal so调试
  2. java loadlibrary_java – System.loadLibrary不起作用.链中的第二个lib的UnsatisfiedLinkError...
  3. java实现itchat_GitHub - Xiazki/itchat4j: wechatbot 的java实现,简单搭建了基本框架和实现了扫码登陆,具体网页微信api请参考...
  4. php循环读取mysql_PHP无限循环获取MySQL数据
  5. 每日一题(49)—— 有符号数与无符号数
  6. Linux静态库和动态库的设计
  7. Java类的继承关键字_Java的第八天(类的继承、super关键字的使用、方法的重写)...
  8. mysql jdbc驱动_JDBC认识与实践
  9. 清华大学计算机学院主页,计算机图形学基础课程主页 | 清华大学计算机系
  10. 插入模板_WordPress在文章列表和内容页插入广告