论文浅尝 | LGESQL: 结合线性有向图以及普通有向图的自然语言转换SQL语句模型...
LGESQL: Line Graph Enhanced Text-to-SQL Model with Mixed Local and Non-Local Relations
笔记整理:郭心南
来源:ACL2021
链接:https://arxiv.org/abs/2106.01093
Github地址:https://github.com/rhythmcao/text2sql-lgesql
概述
本文主要关注多表关联下的自然语言转换SQL语句(Text-to-SQL)的工作,在已有的数据库中,根据描述查询内容的自然语言问句来生成相应的SQL语句用于检索,其中表与表之间存在外键的关联。
为了更好建模问题与数据库schema之间,以及schema内部 的关系,本文提出了一种结合线性有向图以及普通有向图的Text-to-SQL模型(Line Graph Enhanced Text-to-SQL Model),通过引入线性有向图,在简化图的同时突出边信息。同时本文还设计了图修剪的辅助任务,并且对局部图特征和非局部图特征进行表示上的区分。
动机
目前已经有多个工作提出用有向图的方法来构建问题与数据库schema内部之间的关系,并用图神经网络(GNN)来进行编码。然而这些方法普遍存在两个问题:
1)无法很好的找出整个查询所涉及的路径;
2)针对图中每个节点,没有对局部邻居以及非局部邻居进行区分。并且这些方法在图表征上比较注重节点的表示,而忽略了边中大量存在的语义信息。
方法
•线性有向图的构建
线性有向图中的节点和边分别是普通有向图中的边和节点,对普通有向图中顺序连接的边,在线性有向图中用有向边连接,而对于没有连接关系的边,则在线性有向图中不添加边。这种构图方法一方面增强了普通有向图中边的信息的使用,另一方面线型图能很好的找到查询所相关的主路径。
•模型
在模型方面,本文使用了两个关系图注意力神经网络(Duel Relation Graph Attention Network,简称Duel RGAT),这两个RGAT分别对普通有向图和线性有向图进行编码。
其中RGAT^n和RGAT^e分别用于普通有向图和线性有向图,X^l和Z^l分别表示第层RGAT中普通有向图和线性有向图的矩阵表示;Z_{nlc}表示线性有向图中非局部邻居部分的图;G表示RGAT的层。
RGAT的前向传播过程如下:
其中W是参数矩阵,H表示列的个数,FFN表示前向传播网络,N_i^n表示对节点v_i^n相应的表示,n表示table的序号,i表示列的序号,\phi表示对关系获取相应的向量表示。
在RGAT^n前向传播时,会使用RGAT^e中的表示,在这个过程中,本文采用了动态与静态相结合的方式。即对于RGAT^n中的某一节点来说,它会使用RGAT^e中局部邻居节点实时更新的向量表示,即动态;同时对于非局部邻居节点,它会使用预训练模型或者GloVe中的Embedding向量,即静态。
•图修剪
在主要的SQL生成任务的同时,本文还提出了图修剪的辅助任务,用于提升模型对自然语言问题相关联的schema部分的识别能力。这里采用的是分类,即对候选schema中的所有节点采用二分类的方式来判断当前节点是剪裁还是保留。
实验
本文的实验主要在Spider数据集上进行验证,并根据不使用预训练模型,实用泛用性预训练模型,和实用text-to-SQL领域特定的预训练模型来与已有办法进行对比。该方法目前结合ELECTRA结合能达到Spider的SOTA。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。
论文浅尝 | LGESQL: 结合线性有向图以及普通有向图的自然语言转换SQL语句模型...相关推荐
- 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...
- 论文浅尝 | 图神经网络综述:方法及应用
论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...
- 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述
随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...
- 论文浅尝 | 近期论文精选
本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...
- 论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码
本文内容源自往期「论文浅尝」,由 PaperWeekly 精选并重新排版整理,感谢 PaperWeekly. ISWC 2018 ■ 链接 | http://www.paperweekly.site/ ...
- ###好好好#######论文浅尝 | 基于图注意力的常识对话生成
论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...
- 论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解...
论文作者:吴林娟,天津大学,研究方向为自然语言理解 论文链接:http://arxiv.org/abs/2204.00996 代码地址:https://github.com/wulinjuan/SSD ...
- 论文浅尝 - CIKM2021 | DT-GCN: 一种双曲空间中的数据类型感知的知识图谱表示学习模型...
论文作者:申雨鑫,天津大学硕士 发表会议:CIKM 2021 链接:https://dl.acm.org/doi/pdf/10.1145/3459637.3482421 动机 知识图谱表示学习旨在将实 ...
- 论文浅尝 | 知识库问答中关系检测的学习表示映射
论文笔记整理:吴涵,天津大学硕士,研究方向:自然语言处理. 链接: Paper: https://arxiv.org/pdf/1907.07328v1.pdf Code: https://github ...
最新文章
- 数据分析显示,疫情下数据科学家的薪水几乎未受影响
- Excel制作考勤管理
- python面向对象基础
- System Center 2012与vCenter Operations 产品功能对比
- netflix_学习Netflix管理员–第1部分
- 闹猴网页特效集软件 v1.0.5.21
- mysql 切割字符串的妙用
- python日志_python 日志模块
- JavaScript中的小陷阱(不定期更新。。)
- MapXtreme2004 连接oracle spatial的问题
- SQL Server Update:使用 TOP 限制更新的数据
- 黄光裕出来后,首先会做这三件事(转)
- C# 控制台如何播放音频文件
- Windows更新错误
- Allatori:代码混淆器的使用
- 解决谷歌浏览器chrome的CPU占用率过高的问题
- 聚焦热门框架、前端架构、工程化……,SDCC 2016前端开发专题讲师、议题大揭底...
- 李晨光:向着兴趣一路前行
- js两数相乘出现多小数
- 维科精密IPO过会:年营收6.8亿 实控人陈燕来父女为外籍
热门文章
- android 音频加载hal so调试
- java loadlibrary_java – System.loadLibrary不起作用.链中的第二个lib的UnsatisfiedLinkError...
- java实现itchat_GitHub - Xiazki/itchat4j: wechatbot 的java实现,简单搭建了基本框架和实现了扫码登陆,具体网页微信api请参考...
- php循环读取mysql_PHP无限循环获取MySQL数据
- 每日一题(49)—— 有符号数与无符号数
- Linux静态库和动态库的设计
- Java类的继承关键字_Java的第八天(类的继承、super关键字的使用、方法的重写)...
- mysql jdbc驱动_JDBC认识与实践
- 清华大学计算机学院主页,计算机图形学基础课程主页 | 清华大学计算机系
- 插入模板_WordPress在文章列表和内容页插入广告