论文浅尝 - WSDM2020 | QAnswer KG: 基于RDF数据设计一个可移植问答系统
论文笔记整理:谭亦鸣,东南大学博士。
来源:WSDM 2020
链接:https://link.springer.com/chapter/10.1007/978-3-030-49461-2_25
1.介绍
知识图谱问答(KGQA)系统的目标是:基于自然语言问题,从RDF数据集中抽取对应答案。近年来许多KGQA方法被提出,取得了较好的效果,但是为一个全新的RDF数据集(KG)构建对应的QA系统依然是困难且麻烦的。其中的主要挑战在于可移植性:即是否可能将一个QA算法轻松地用于新的/之前未测试过的数据上。
KGQA 可移植方面的两个主要挑战是:
a. 构建新训练数据的高额成本
b. 现有QA模型依赖于KG-specific工具(例如实体链接)
在这篇工作中,作者提出了一个可移植QA系统,QAnswer KG,该方法可以在新数据集上实现QA系统的按需构建,且在领域问答方面不需用户具备专家知识。在三个不同数据集上的实验证明,QAnswer KG能够在微量训练数据的条件下,实现基于任何RDF数据集上的QA系统。
2.模型/方法
QAnswer主要包含四个步骤:
a. Query Expansion: 对自然语言问题中所有可能的n-gram(从1元文法到长度等于句长的n元文法)做KG资源映射
b. Query Construction: 利用映射得到的KG资源合成所有可能的SPARQL query,作者通过资源在图谱中的距离抽取三元组pattern,每一个query通过将包含相同元素的pattern组合得到,下图列列举了一些利用该方法生成的SPARQL query.
c. Query Ranking: 利用1) 对应KG资源的字符串(来自自然语言问题)长度;2) 资源标签与对应n-gram的相似性。等两个特征,作者构建了一个query排序方法,用于筛选步骤b中的生成得到的query。
d. Answer Decision: 最终,对于排序得到的query,评估其答案是否与问题目标(用户意图)一致。例如,如果给出的query是图2中的4,可以看到。该查询所得的答案是关于 “solarsystem?”,与原始问题“What planets belongs to the solar system”相比,其置信将会很低,并且没有给出有效答案。而query 1则应该具备更高的置信。
本工作与作者的前一工作相关性非常高,感兴趣的同学建议同步阅读:
https://hal.archives-ouvertes.fr/hal-02121400/file/QAnswer__A_prototype_for_a_Question_Answering_System_over_the_Semantic_Web-6.pdf
接着作者介绍了如何使用QAnswer KG对一个RDF数据集构建QA system,图4给出了一个整体的过程示意。
初始化:系统为新QA system预留了空间,并且创建了目录用以加载新数据。
索引:在数据加载后,它将被解析和索引,尤其是query扩展索引以及query构建索引。Query ranking及answer decision部分通过机器学习模型建模。
查询(Query):通过初始化提供的默认算法,QAnswer KG可以回答用户基于当前数据集所提出的问题。
3.实验
数据集:Cocktail:the dataset used as a running example in the previous ps, i.e.,
a dataset containing cocktails with their ingredients and preparation
HR:the dataset contains information about employees of a company. The information includes their skills, the spoken languages, the languages they can program and their images.
EU:dataset containing information on the European Union about their member states, their capitals and ministries
数据集的统计信息以及实验结果如图10所示,
作者提供了该方法的tutorial:https://qanswer.univ-stetienne.fr/docs/doc0.
以及demo:https://www.qanswer.eu/qa
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。
论文浅尝 - WSDM2020 | QAnswer KG: 基于RDF数据设计一个可移植问答系统相关推荐
- 论文浅尝 - SIAM ICDM 2020 | 基于图时空网络的知识引导的诊断预测
论文笔记整理:吴锐,东南大学硕士. 来源:SIAM ICDM 2020 论文下载地址: https://epubs.siam.org/doi/abs/10.1137/1.9781611976236.3 ...
- 论文浅尝 - IJCAI2020 | Mucko:基于事实的多层跨模态知识推理视觉问答
论文笔记整理:陈卓,浙江大学计算机科学与技术系,博士研究生. 论文链接:https://arxiv.org/pdf/2006.09073 代码:https://github.com/astro-zih ...
- 论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法
来源:ISWC 2017 链接:https://link.springer.com/content/pdf/10.1007%2F978-3-319-68288-4.pdf 本文主要关注基于RDF数据的 ...
- ###好好好#######论文浅尝 | 基于图注意力的常识对话生成
论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...
- 论文浅尝 - IJCAI2022 | 基于自适应虚词增强的小样本逆关系分类
论文作者:窦春柳,天津大学,研究方向:知识图谱 论文链接:http://arxiv.org/abs/2204.12111 代码地址:https://github.com/DOU123321/FAEA- ...
- 论文浅尝 | 图神经网络综述:方法及应用
论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...
- 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述
随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...
- 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...
- 论文浅尝 | 近期论文精选
本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...
最新文章
- java s字符_java 字符集s
- 第013课_代码重定位
- python读取xls文件详解_python3解析excel文件
- web站点性能测试经验点滴
- AndroidLinker与SO加壳技术之下篇 1
- java链表对象_用Java实现链表结构对象:单向无环链表
- printf格式控制符的完整格式(转载)
- 将bean转换成键值列表
- requests 超时关闭_requests获取响应时间(elapsed)与超时(timeout)
- OAuth2 oauth_client_details表字段的详细说明
- windows用Redis Desktop Manager无法通过6379端口连接ubuntu redis问题
- 字符数据在内存中的存储形式及其使用方法
- 聊聊信任:衣服掉地上会脏的
- go 服务接入短信验证码功能(对接阿里云平台)
- LDPC译码器的FPGA实现
- git如何修改其不区分文件大小写(默认忽略大小写)的设置
- 为什么某些网页打不开而别人却能打开?
- 同事又在代码里“下毒”,血压拉满...
- 楚汉传奇 页游 一键端 单机自玩
- 1200 -- 无聊又简单的游戏
热门文章
- opencv学习笔记[9]:Opencv的基本数据类型和矩阵结构
- ASP VBScript 函数速查表
- 4岁小女孩给Linux内核贡献提交
- python游戏开发工程师_Python开发工程师-入门与实战视频课程
- django ModuleNotFoundError: No module named 'tinymce***'
- mysql全套基础知识_Mysql基础知识整理
- pip install 时报错 ERROR: Could not install packages due to an EnvironmentError: [WinError 5] 拒绝访问(已解决)
- LeetCode 348. 判定井字棋胜负(计数)
- 程序员面试金典 - 面试题 16.07. 最大数值(位运算求max)
- LeetCode 341. 扁平化嵌套列表迭代器(双栈)