论文笔记整理:谭亦鸣,东南大学博士。


来源:WSDM 2020

链接:https://link.springer.com/chapter/10.1007/978-3-030-49461-2_25

1.介绍

知识图谱问答(KGQA)系统的目标是:基于自然语言问题,从RDF数据集中抽取对应答案。近年来许多KGQA方法被提出,取得了较好的效果,但是为一个全新的RDF数据集(KG)构建对应的QA系统依然是困难且麻烦的。其中的主要挑战在于可移植性:即是否可能将一个QA算法轻松地用于新的/之前未测试过的数据上。

KGQA 可移植方面的两个主要挑战是:

a. 构建新训练数据的高额成本

b. 现有QA模型依赖于KG-specific工具(例如实体链接)

在这篇工作中,作者提出了一个可移植QA系统,QAnswer KG,该方法可以在新数据集上实现QA系统的按需构建,且在领域问答方面不需用户具备专家知识。在三个不同数据集上的实验证明,QAnswer KG能够在微量训练数据的条件下,实现基于任何RDF数据集上的QA系统。

2.模型/方法

QAnswer主要包含四个步骤:

a. Query Expansion: 对自然语言问题中所有可能的n-gram(从1元文法到长度等于句长的n元文法)做KG资源映射

b. Query Construction: 利用映射得到的KG资源合成所有可能的SPARQL query,作者通过资源在图谱中的距离抽取三元组pattern,每一个query通过将包含相同元素的pattern组合得到,下图列列举了一些利用该方法生成的SPARQL query.

c. Query Ranking: 利用1) 对应KG资源的字符串(来自自然语言问题)长度;2) 资源标签与对应n-gram的相似性。等两个特征,作者构建了一个query排序方法,用于筛选步骤b中的生成得到的query。

d. Answer Decision: 最终,对于排序得到的query,评估其答案是否与问题目标(用户意图)一致。例如,如果给出的query是图2中的4,可以看到。该查询所得的答案是关于 “solarsystem?”,与原始问题“What planets belongs to the solar system”相比,其置信将会很低,并且没有给出有效答案。而query 1则应该具备更高的置信。

本工作与作者的前一工作相关性非常高,感兴趣的同学建议同步阅读:

https://hal.archives-ouvertes.fr/hal-02121400/file/QAnswer__A_prototype_for_a_Question_Answering_System_over_the_Semantic_Web-6.pdf

接着作者介绍了如何使用QAnswer KG对一个RDF数据集构建QA system,图4给出了一个整体的过程示意。

初始化:系统为新QA system预留了空间,并且创建了目录用以加载新数据。

索引:在数据加载后,它将被解析和索引,尤其是query扩展索引以及query构建索引。Query ranking及answer decision部分通过机器学习模型建模。

查询(Query):通过初始化提供的默认算法,QAnswer KG可以回答用户基于当前数据集所提出的问题。

3.实验

数据集:Cocktail:the dataset used as a running example in the previous ps, i.e.,

a dataset containing cocktails with their ingredients and preparation

HR:the dataset contains information about employees of a company. The information includes their skills, the spoken languages, the languages they can program and their images.

EU:dataset containing information on the European Union about their member states, their capitals and ministries

数据集的统计信息以及实验结果如图10所示,

作者提供了该方法的tutorial:https://qanswer.univ-stetienne.fr/docs/doc0.

以及demo:https://www.qanswer.eu/qa


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 - WSDM2020 | QAnswer KG: 基于RDF数据设计一个可移植问答系统相关推荐

  1. 论文浅尝 - SIAM ICDM 2020 | 基于图时空网络的知识引导的诊断预测

    论文笔记整理:吴锐,东南大学硕士. 来源:SIAM ICDM 2020 论文下载地址: https://epubs.siam.org/doi/abs/10.1137/1.9781611976236.3 ...

  2. 论文浅尝 - IJCAI2020 | Mucko:基于事实的多层跨模态知识推理视觉问答

    论文笔记整理:陈卓,浙江大学计算机科学与技术系,博士研究生. 论文链接:https://arxiv.org/pdf/2006.09073 代码:https://github.com/astro-zih ...

  3. 论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

    来源:ISWC 2017 链接:https://link.springer.com/content/pdf/10.1007%2F978-3-319-68288-4.pdf 本文主要关注基于RDF数据的 ...

  4. ###好好好#######论文浅尝 | 基于图注意力的常识对话生成

    论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...

  5. 论文浅尝 - IJCAI2022 | 基于自适应虚词增强的小样本逆关系分类

    论文作者:窦春柳,天津大学,研究方向:知识图谱 论文链接:http://arxiv.org/abs/2204.12111 代码地址:https://github.com/DOU123321/FAEA- ...

  6. 论文浅尝 | 图神经网络综述:方法及应用

    论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...

  7. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  8. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  9. 论文浅尝 | 近期论文精选

    本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...

最新文章

  1. java s字符_java 字符集s
  2. 第013课_代码重定位
  3. python读取xls文件详解_python3解析excel文件
  4. web站点性能测试经验点滴
  5. AndroidLinker与SO加壳技术之下篇 1
  6. java链表对象_用Java实现链表结构对象:单向无环链表
  7. printf格式控制符的完整格式(转载)
  8. 将bean转换成键值列表
  9. requests 超时关闭_requests获取响应时间(elapsed)与超时(timeout)
  10. OAuth2 oauth_client_details表字段的详细说明
  11. windows用Redis Desktop Manager无法通过6379端口连接ubuntu redis问题
  12. 字符数据在内存中的存储形式及其使用方法
  13. 聊聊信任:衣服掉地上会脏的
  14. go 服务接入短信验证码功能(对接阿里云平台)
  15. LDPC译码器的FPGA实现
  16. git如何修改其不区分文件大小写(默认忽略大小写)的设置
  17. 为什么某些网页打不开而别人却能打开?
  18. 同事又在代码里“下毒”,血压拉满...
  19. 楚汉传奇 页游 一键端 单机自玩
  20. 1200 -- 无聊又简单的游戏

热门文章

  1. opencv学习笔记[9]:Opencv的基本数据类型和矩阵结构
  2. ASP VBScript 函数速查表
  3. 4岁小女孩给Linux内核贡献提交
  4. python游戏开发工程师_Python开发工程师-入门与实战视频课程
  5. django ModuleNotFoundError: No module named 'tinymce***'
  6. mysql全套基础知识_Mysql基础知识整理
  7. pip install 时报错 ERROR: Could not install packages due to an EnvironmentError: [WinError 5] 拒绝访问(已解决)
  8. LeetCode 348. 判定井字棋胜负(计数)
  9. 程序员面试金典 - 面试题 16.07. 最大数值(位运算求max)
  10. LeetCode 341. 扁平化嵌套列表迭代器(双栈)