论文浅尝 | 面向简单知识库问答的模式修正强化策略
链接:http://aclweb.org/anthology/C18-1277
知识库问答研究旨在利用结构化事实回答自然语言问题,在网络中,简单问题占据了相当大的比例。本文提出在完成模式抽取和实体链接后,构建一个模式修正机制,从而缓解错误积累问题。为了学习对“subject-predicate”(问题的实体-谓词)候选集的排序,本文提出将关系检测机制用于强化联合事实选择。多级别编码和多维信息将被用于强化整个模型过程。实验结果表明,本方法展现出非常强大的性能。
Background
简单知识库问答,指的是问答中仅需用到知识库中的一个事实即可给出答案的过程。
其流程和可以描述为:从自然语言问句中识别实体,谓词,并与知识库中的内容构成完整三元组的过程。
简单知识库问答目前存在的主要挑战包括:
1.同一单词(词语)在不同句子中的意义不同
2.不同的自然语言表达方式具有相同的含义
3.如何利用大规模知识库中的大量事实信息
Model
在简单问答中,首先要做的是实体链接,常规的实体链接方法包括n-gram匹配,序列标注等等,但是这两个方法都有可能导致错误积累,从而无法找到准确的“实体-谓词”对。
考虑到这些问题,本文首先使用模式抽取和实体链接,将可能的实体描述和问题模式提取出来,而后减少知识库中的候选实体数量。
在模式抽取过程中,作者发现由于模型性能问题,抽取结果中存在一定比例的较差模式。为了应对这个情况,文章提出添加模式修正机制以提升模式抽取的质量。
下一步工作就是找出最可能生成问题答案的“实体-谓词”对,对于这个问题,前人的工作中主要考虑使用问题模式与候选实体信息来选择合适的谓词。本文则引入了关系检测机制进行改进,其效果体现在限定了知识库中问题表达对应的谓词,从而引导候选实体的重排序。
当问题所问实体在知识库中存在大量不同类型的重名实体时,先做关系推理或者实体链接都有可能引发无召回问题。对此,本文的策略是采用联合事实筛选,通过利用实体的名称信息和类别信息从不同角度描述实体。
在确定谓词方面,作者采用唯一关系名与分散词信息作为限定条件
本文问答模型的示意图
同时为了准确保留原始问句的内容,本文将字符级别与词级别的编码结果进行合并,用于表达原始问句
本文编码策略的示意图
Experiment
本文实验使用的数据集为SimpleQuestions benchmark提供的问答数据集,其中的每个问题都可以由freebase中的一个三元组回答。
数据集分为三个部分:训练集规模为75910,验证集为10845,测试集为21687
知识库则是从freebase中抽取的子集FB2M(2,150,604entities, 6,701 predicates, 14,180,937 atomic fact triples,FB5M(4,904,397entities, 7,523 predicates, 22,441,880 atomic fact triples)
实验评价指标为准确率,仅当问题对应的事实与模型得到的实体和谓词两者都匹配时,才算准确匹配。
从实验结果上看,本文方法相对过去的工作,取得了非常明显的提升。
论文笔记整理:谭亦鸣,东南大学博士,研究方向为知识图谱问答,自然语言处理。
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。
点击阅读原文,进入 OpenKG 博客。
论文浅尝 | 面向简单知识库问答的模式修正强化策略相关推荐
- 论文浅尝 - AAAI2020 | 通过知识库问答改善知识感知对话生成
论文笔记整理:胡楠,东南大学博士. 来源:AAAI 2020 动机 现在的将外部知识整合到对话系统中的研究仍然存在一定缺陷.首先,先前的方法难以处理某些语句的主语和关系,比如当语句中的相关实体彼此相距 ...
- 论文浅尝 | 面向自动分类归纳的端到端强化学习
动机 术语层次在许多自然语言处理任务中扮演着重要角色.然而,大部分现有的术语层次是人工构建的,其覆盖范围有限,或者某些领域上不可用.因此,最近的工作集中在自动化的术语层次归纳(automatictax ...
- 论文浅尝 | 面向 cQA 的跨语言问题检索方法
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:WWW2019 链接:https://dl.acm.org/citation.cfm?doid=3308558.3313502 本文 ...
- 论文浅尝 | 面向时序知识图谱推理的循环事件网络
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:arXiv (short version accepted at ICLR 2019Workshop on Representati ...
- 论文浅尝 | 基于知识图的问答变分推理
Zhang Y, Dai H, Kozareva Z, et al. Variational Reasoning for Question Answering with Knowledge Graph ...
- 论文浅尝 | 面向单关系事实问题的中文问答模型
来源:NLPCC 2017 论文下载地址:http://tcci.ccf.org.cn/conference/2017/papers/2003.pdf 动机 开放领域的QA问题是一个被广泛研究的问题, ...
- 论文浅尝 | 为基于知识库的问答构建形式查询生成
论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生. Citation: H.Zafar, G. Napolitano, and J. Lehmann. Formal query generat ...
- 论文浅尝 - ACL2020 | 利用知识库嵌入改进多跳 KGQA
论文笔记整理:吴畏,东南大学硕士研究生. 来源: ACL 2020 论文地址: https://www.aclweb.org/anthology/2020.acl-main.412.pdf 开源代码: ...
- 论文浅尝 | Tree-to-sequence 学习知识问答
论文笔记整理:谭亦鸣,东南大学博士生,研究兴趣:知识图谱问答. 来源:Neurocomputing 372: 64-72 (2020) 链接:https://sciencedirect.xilesou ...
最新文章
- Java虚拟机 —— 垃圾回收机制
- Linux系统root密码重置教程
- PyTorch基础-Adam优化器使用-06
- 基于Docker布署伪分布式hadoop环境(一)
- jQuery10个重要问题梳理
- 浏览器静态资源的缓存机制(http强缓存 协商缓存)
- 基于HT for Web的3D树的实现
- ftfind 桌面搜索引擎的设计文档 (2)
- Java开发 | 数据结构和算法之——递归算法
- Kindle Paperwhite2(第6代)5.7.2.1固件升级教程
- 反编译工具apktool
- ASML EUV 光源的极限工程
- VirtualBox Guest Additions installation
- 辟谣!微信支付宝收款码将不能用于经营性收款?
- 【架构师必知必会】常见的NoSQL数据库种类以及使用场景
- 安卓美化——添加下拉菜单图片或下拉菜单透明
- 南京计算机软考考点,南京市区计算机软考哪个好
- 给ALV字段添加搜索帮助
- ICN数据包格式封装
- 如何用甘特图管理自己的项目计划
热门文章
- SQL2000数据库中删除“坏表”的方法
- 怎么用VC编程实现把用户名,密码提交到网页上并且实现登录?
- 多态情况下,怎么用基类指针去访问基类的虚函数?
- 拆解前苏联产荧光数码管计算器,内部电路结构彪悍!
- 工程师实战:单片机裸机程序框架是怎样炼成的?
- python 查询sqlserver 视图_SQL Server查看视图定义总结
- 二、MyBatis常用对象分析 封装工具类
- 四、Web服务器——Session Cookie JSP入门 学习笔记
- conda安装pytorch1.10.1+paddlepaddle-gpu2.2.1+cuda10.2+cudnn7.6.5
- LeetCode 1024. 视频拼接(动态规划/贪心)