论文浅尝 | 一种用于多关系问答的可解释推理网络
论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。
来源:COLING 2018
链接:https://www.aclweb.org/anthology/C18-1171
问题背景与动机
多关系问答(multi-relationquestion answering)是知识问答的一个重要任务,“多关系”指的是问题中包含多个关系和实体信息,为了回答这类问题,需要对知识库中多个事实三元组进行分析和推理。
现有的方法主要可以分为两类:基于语义分析;基于embedding;
基于语义分析的方法主要依赖于人工特征与标注,但是泛化能力较弱。
基于embedding的方法一般利用弱监督机制训练得到end-to-end问答模型,但是现有的方法主要依赖于相似度计算而在推理方面有所欠缺。
在这篇文章中,作者提出‘可解释推理网络(Interpretable Reason Network,IRN)模型’用于解决多关系问答。通过多跳推理的形式完成多关系问题的问答过程。
贡献
1.提出面向多关系问答的IRN模型,并在性能上取得了state-of-art
2. 相对于现有推理网络,这篇文章提出的方法更具可解释性,多跳推理的过程可以清晰的反映答案生成的过程
模型
IRN的整体框架如图所示,其中包含三个子模型:Input Module; ReasoningModule; Answer Module,分别用于问句的embedding,三元组推理以及答案的生成。
以问题‘Howold is Obama’s daughter?’ 为例,问题的解析、推理和回答过程包含三跳(3 hops),每个hop包含的过程相同,描述如下:
1.Input Module:输入问题(仅初始),得到问题的embedding形式q
2.Reasoning Module:输入q,以及对问题NER得到的实体信息e1,找到对应的关系r1
3.Input Module:将已识别关系信息r1从q中去除,得到更新的q’,用于下一步推理
4.Answer Module:根据已得到的e1和r1从知识库中找到对应的答案信息
5.Reasoning Module:将已分析实体信息e1与关系信息r1融合,并用于下一步推理
其中,获取关系r的计算过程如以下公式所示:
实验
实验数据
本文实验所使用的数据基于WorldCup2014,数据集的统计信息由表1所示。
实验结果
对比模型说明:
1.Embed (Bordes et al., 2014b):利用embedding空间将问题和答案进行匹配的方法
2.Subgraph (Bordes et al., 2014a):在Embed基础上利用实体子图加强答案实体的表达
3. Seq2Seq (Sutskever et al., 2014):使用基于LSTM的encoder-decoder实现的语义解析模型
4. MemN2N (Sukhbaatar et al., 2015):使用记忆网络构建的end2end模型,其中记忆单元包含了相关的三元组信息
5. KVMemN2N (Miller et al., 2016):在MemN2N的基础上,将记忆单元划分为键-值两个部分,键为头实体及关系,值为尾实体
6.IRN-weak (This paper)
可解释性分析
表3反映了IRN在多跳过程中识别关系和实体的精准度,r1/e1 -> rn/en -> a
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。
论文浅尝 | 一种用于多关系问答的可解释推理网络相关推荐
- 论文浅尝 | 一种用于新闻推荐的深度知识感知网络
Citation: Wang H, Zhang F, Xie X, et al. DKN: Deep Knowledge-Aware Networkfor News Recommendation[J] ...
- 论文浅尝 | 将文本建模为关系图,用于联合实体和关系提取
论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱.自然语言处理. 链接:https://www.aclweb.org/anthology/P19-1136 动机 本文提出了一种利用图卷积网络(G ...
- 论文浅尝 | 用异源监督进行关系抽取:一种表示学习方法
Citation: Liu, L., Ren, X., Zhu, Q., Zhi, S., Gui, H., Ji, H., & Han, J.(2017). Heterogeneous Su ...
- 论文浅尝 | 多内容实体和关系联合抽取的对抗训练
链接:https://arxiv.org/pdf/1808.06876.pdf 动机 Szegedy 在 14 年发现,对于图像分类问题的神经网络,若是在输入中人为的添加很小尺度的扰动,会让已经训练好 ...
- 论文浅尝 - ICLR 2020 | 用于文本推理的神经模块网络
论文笔记整理:邓淑敏,浙江大学在读博士,研究方向为低资源条件下知识图谱自动化构建关键技术研究. 论文链接:https://openreview.net/pdf?id=SygWvAVFPr Demo链接 ...
- 论文浅尝 | 一种嵌入效率极高的 node embedding 方式
论文笔记整理:叶群,浙江大学计算机学院,知识图谱.NLP方向. 会议:WSDM 2019 链接:https://dl.acm.org/citation.cfm?id=3290961 Motivatio ...
- 论文浅尝 | 一种基于递归超图的知识图谱问答方法
笔记整理 | 谭亦鸣,东南大学博士生 来源:EACL'21 链接:https://www.aclweb.org/anthology/2021.eacl-main.35.pdf 概述与动机 本文提出了一 ...
- 论文浅尝 | 一种可解释的语义匹配复值网络
笔记整理:耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习,自然语言处理等. 论文链接:https://arxiv.org/pdf/1904.05298.pdf 本文是发表在 NAACL 201 ...
- 论文浅尝 | 知识图谱的单样本关系学习
链接:http://cn.arxiv.org/pdf/1808.09040 动机 如今的知识图谱规模很大但是完成度不高,long-tail关系在知识图谱中很常见,之前致力于完善知识图谱的方法对每个关系 ...
最新文章
- Linux环境编译安装Mysql以及补装innodb引擎方法
- Spring Cloud Contract 契约测试实践
- hibernate的一种报错
- beyond compare类似软件_Mac软件推荐 | 第 20 期
- ASP.NET【4】--ASHX
- oracle数据库IMP-00010错误解决
- 为什么男性比女性死得更早,心疼一秒钟!
- poj 2528 线段树离散化+染色
- k8s源码分析 pdf_rook源码分析之一:rook架构解析
- 【最短路径Floyd算法详解推导过程】看完这篇,你还能不懂Floyd算法?还不会?...
- 厉害了,我的清华大学,各系横幅让网友看花眼,尤其是第3条
- mysql u0019_mysql服务无法启动
- 若依前端table中如何显示图片?
- 【BZOJ】3963: [WF2011]MachineWorks
- 飞机器减震器的matlab建模和仿真模拟
- 《App 后台开发运维和架构实践》完整目录
- c++ Beep函数的雪之梦
- 超详细的Mysql安装教程
- 高数:第四章(同济大学第七版)
- 小米集团2023校招芯片设计笔试
热门文章
- strcpy()函数一个简单那程序来了解一下它。。
- SQL Server中的数据类型详解
- Visual Studio 2008 Shell(翻译)
- HTTP与HTTPS的安全性讨论
- Python之OS模块进程管理介绍--os.fork()
- 工厂好的html页面,jquery中被誉为工厂函数的是什么?
- 计算机语言恢复,win10系统找回消失不见语言栏的恢复方法
- python网络爬虫系列(五)——数据提取 jsonpath模块
- 一、人工智能数学基础——线性代数
- LeetCode MySQL 1193. 每月交易 I(date_format)