来源:ISWC 2017

链接:https://link.springer.com/content/pdf/10.1007%2F978-3-319-68288-4.pdf

本文主要关注基于RDF数据的多语言问答任务中,对不同语言问句的语义分析工作。作者提出一种基于DUDES(Dependency-based Underspecified Discourse Representation Structures)的因子图推理方法,对多语言问句中的词进行角色定义和识别,并根据获取到的语义解析结果,规则生成问题的SPARQL。文中表示,使用因子图进行推理对语言类型的敏感程度较低,是一种有效的多语言语义解析方法。模型的性能评测基于QALD-6发布的英语,德语以及西班牙语数据。

动机

多语言问答是 QALD 提出的一个问答子任务,目标是将给定的多语言问题映射到知识库中或是得到对应的SPARQL

例如:问句“Who createdWikipedia?” 目标生成的SPARQL

SELECT DISTINCT ?uri WHERE { dbr:Wikipedia dbo:author ?uri .}

多语言问答的一个主要难点在于语义鸿沟,当问题语言与知识库语言不相同的时候,就无法直接生成有效的映射。虽然机器翻译模型可以实现语言之间的转换,但是存在两个明显局限:其一,现有的双语或者多语言平行问答语料数量不足以训练出高质量的机器翻译模型;其二,基于QALD定义的跨语言问答任务,语言的转换完全取决于对问题句子的转换,然而问句中可能包含部分噪声信息,影响翻译的效果。

为了解决语义鸿沟,作者提出了AMUSE——一个基于因子图推理的跨语言解析模型。

方法

AMUSE的方法主要由两步推理构成:

1.L2KB

这一步以实体链接为目标,将问题中的局部与知识库相关联

2.QC

利用 L2KB 的链接结果,以及问题中的主要关键词的词类/词性等因素,构建问句的逻辑表达形式(SPARQL

关键技术:DUDESDependency-based Underspecified Discourse Representation Structures),一种用于指定意义表示及构成的结构化方式。

模型流程如图 2 所示,这里为了方便读者阅读,作者以英语问题为例子来表现推理过程,使用其他语言的过程也是一样。

描述如下:

1.输入问句为“Who created Wikipedia”,首先得到对应的依存解析树

2. 对问句中的词进行 L2KB 推理过程,找到 Wikipedia 链接到的知识库中实体:Wikipedia,以及 created 链接到知识库中的属性:author,细节如图3,此时的结果构成的部分SPARQL成分为:

3. 进入 QC 推理过程,根据问句中各词的词性,及依存关系,给出问句中疑问词的推理标签,此时完成 SPARQL 构成如:

SELECT DISTINCT ?y WHERE { dbr:Wikipedia dbo:author ?y .}

对于问题语言与知识库不相同的案例,作者提出的处理方式是利用多语言词典 Dict.cc 的词级别翻译配合 word embedding 检索找到知识库中可能的目标实体。

实验

文章表示,由于本工作是首个多语言语义解析器,为了测试模型性能,作者构建了多种词典+word embedding 的组合,分别在英,德,西班牙语上进行 Linking QA 的两组实验,评价指标为 F1 值,结果如表 1

总结

文章的主要贡献在于提出了一个具备语言通用性的语义解析方法,并且在QALD的定义下,提出了一种词典+embedding相似性检索的方式应对语义鸿沟(用于应对没有平行语料训练翻译模型的情况)

论文笔记整理:谭亦鸣,东南大学博士生,研究兴趣:知识问答,自然语言处理,机器翻译


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法相关推荐

  1. 论文浅尝 - ACL2022 | 基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解...

    论文作者:吴林娟,天津大学,研究方向为自然语言理解 论文链接:http://arxiv.org/abs/2204.00996 代码地址:https://github.com/wulinjuan/SSD ...

  2. 论文浅尝 - ICML2020 | 基于子图推理的归纳式关系预测

    论文笔记整理:陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习. 论文来源:ICML 2020 Introduction 当前在知识图谱上(KnowledgeGraph,KG)进行关系预测的 ...

  3. 论文浅尝 - WSDM20 | 基于弱监督及逐步推理的多关系知识图谱问答

    论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. 来源:WSDM '20 链接:https://dl.acm.org/doi/abs/10.1145/3336191.3371812 动机 知 ...

  4. 论文浅尝-综述 | 基于强化学习的知识图谱综述

    转载公众号 | 人工智能前沿讲习 论文来源:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264 摘要:知识图谱是一种用图结构建模事物及事物 ...

  5. 论文浅尝 - EMNLP2020 | 通过词重排序跨语言解析

    笔记整理 | 吴林娟,天津大学硕士 来源:EMNLP2020 链接:https://www.aclweb.org/anthology/2020.findings-emnlp.265.pdf 动机 依赖 ...

  6. 论文浅尝 - AAAI2021 | 基于对比学习的三元组生成式抽取方法

    作者 | 叶宏彬,浙江大学博士研究生,研究方向:知识图谱.自然语言处理 接收会议 | AAAI2021 论文链接 | https://arxiv.org/pdf/2009.06207.pdf 摘要 在 ...

  7. 论文浅尝 - CVPR2020 | 基于网格特征的可视问答系统

    论文笔记整理:李爽,天津大学. 链接:https://arxiv.org/pdf/2001.03615v1.pdf 动机 随着"自下而上"注意力的普及,基于边界框(或区域)的视觉特 ...

  8. 论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

    论文笔记整理:耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习等. 来源:AAAI2020 论文链接:https://arxiv.org/pdf/2001.02332.pdf 本文是发表在AAA ...

  9. 论文浅尝 | GraphSAINT—基于图采样的归纳学习方法

    论文笔记整理:杨海宏,浙江大学博士生,研究方向为开放世界下的多语言知识问答. 1. 简介 受显存的因素限制,应用图神经网络于大规模图学习任务上面临"邻居爆炸(Neighbor Explosi ...

最新文章

  1. 创建和存储 cookie
  2. maven添加oracle jdbc依赖
  3. java数据库视频教程下载,【No147】最新oracle11g DBA 开发和应用数据库视频教程下载...
  4. 金属的特性只是一种状态
  5. oracle用户登录报错,oracle用户登录报错-bash: ulimit: open files: cannot modify limit: Operation not permitted...
  6. Excel 批量处理行高(图文教程) - Excel篇
  7. webstack响应式网站导航html源码kyuan 本地静态化版
  8. 编写.gitignore文件
  9. JDK源码(21)-Unsafe
  10. python——迭代器itertools.cycle
  11. ssm 退出登录 java_Spring+SpringMVC+Mybatis实现简单的用户的登录和退出
  12. smartadmin_smartadmin官网_smartadmin下载 bootstrap 后台模板 下载-很不错的后台模板
  13. 【工具篇】Unity使用Spine2D动画,代码控制
  14. excel数据透视表_无痛的方式隐藏Excel数据透视表项
  15. 最低2000多,中国房价最低的30城,你会选择吗?
  16. 基于java基于javaweb的管理系统设计与实现怎样选题思路分享
  17. 进军IT与安全行业:推荐学习路线图
  18. pe下bootice修复Linux引导,pe下修复引导不成功?这种方法才是最有效的解决方法...
  19. 2022秋季C语言专题实验07
  20. 中国目前还未掌握的核心技术有哪些?(无图)

热门文章

  1. c#让电脑锁定、注销、关机
  2. 给不起钱的大公司,算不上大公司
  3. Qt 开源作品 | 小伙子,给你的 Linux 系统写个 Launcher 吧
  4. 工作4年工资8K,还有什么理由不努力?
  5. 很多人都不清楚HEX文件格式
  6. 你知道用git打补丁吗?
  7. 案例 github_2019年12月Github上最热门的Java开源项目,速来围观!
  8. 每日一题(28)—— 引用与指针的区别
  9. l4 l7 代理_什么是四层(L4 proxy)和七层负载均衡(L7 proxy)?区别是什么? 翻译自Nginx官网...
  10. nvidia的jetson系列的方案_NVIDIA Jetson Xavier NX开发者套件主要应用于自主机器边缘计算产品系列...