论文浅尝 | 基于表示学习的大规模知识库规则挖掘
链接:www.ict.griffith.edu.au/zhe/pub/OmranWW18.pdf
动机
传统的规则挖掘算法因计算量过大等原因无法应用在大规模KG上。为了解决这个问题,本文提出了一种新的规则挖掘模型RLvLR(Rule Learning via LearningRepresentation),通过利用表示学习的embedding和一种新的子图采样方法来解决之前工作不能在大规模KG上scalable的问题。
亮点
文章的亮点主要包括:
(1)采样只与对应规则相关的子图,在保存了必要信息的前提下极大减少了算法的搜索空间和计算量;
(2)提出了argument embedding,将规则表示为predicate sequence;
概念
1. closed-pathrule,LHS记为body(r),RHS记为head(r)
2. supportdegree of r,满足 r 的实体对个数
3. standard confidence 和 head coverage
方法
⒈ Sampling Method
以head predicate Pt为输入,把KG看成无向图,选择到Pt的头尾实体路径长不超过len-1的实体和关系组成子图K’=(E’,F’),后面所有的计算都基于这个子图。
⒉ argument embedding
对于谓词P,它的subject argument定义为所有出现在subject上实体的embedding的加权平均,object argument则为尾实体上实体的embedding的加权平均,这个主要用在后面的score function上,即本文引入了共现的信息,对于路径(P1,P2)来说,P1的object argument与P2的subject argument应该很相似,这里就应用到了下面说的基于argument embedding的score function。
⒊ co-occurrence score function
这个 score function 就是基于上面的 argument embedding,以上图这个长为 3 的 rule 为例,path p=P1,P2的embedding是P1*P2,之前通用的synonymy scoring function就是让 p 和 Pt 的 embedding 相似,再与这个本文提出的co-occurrence scorefunction,结合起来就是最后的score function,下图左边的就是利用了路径的同义信息,即 body(r) 的 predicate embedding path 的乘积应当与 head 的 predicate embedding 相似。
⒋ Rule Evaluation
根据 score function 抽出来的 rule 还要进过筛选,具体做法是先排除掉 support degree 小于 1 的 rule,再过滤掉 standard confidence<minSC 和 head coverage<minHC 的 rule。
实验
⑴. 数据集
本文的关注点是 scalable,所以选取做比较的数据集都是大规模知识库
⑵. 实验结果
作者与 AMIE+ 在三个规模较大的知识库上进行了比较,具体做法是随机选取 20 个 target predicate 进行挖掘,其中 R 是 SC>0.1&HC>0.01 的规则,QC 是 SC>0.7 的规则,结果显示了 RLvLR 在大规模 KG 上的效率和挖掘规则的能力。
总结
本文提出了一种可以在大规模 KG 上可以以较小计算量进行规则挖掘的模型,减少计算量的方式包括子图采样,argument embedding 和 co-occurrence score function。
论文笔记整理:汪寒,浙江大学硕士,研究方向为知识图谱、自然语言处理。
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。
论文浅尝 | 基于表示学习的大规模知识库规则挖掘相关推荐
- 论文浅尝 | 基于对抗学习的弱监督知识图谱对齐
论文笔记整理:郭凌冰,浙江大学研究助理,研究方向为知识图谱的表示学习. 绝大部分现有的知识图谱对齐方法都要求足够的已对齐三元组作为监督数据,但在现实世界中,获取大量的对齐三元组的代价十分高昂.本文提出 ...
- ###好好好#######论文浅尝 | 基于图注意力的常识对话生成
论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...
- 论文浅尝 | 基于神经网络的知识推理
本文转载自公众号:PaperWeekly. 论文笔记来自 PaperWeekly 社区用户 @britin.本文对基于 RNN 的从大规模知识库中进行推理进行了精度和可操作性的改善,提出的模型使用单个 ...
- 论文浅尝 | 基于知识库的自然语言理解 01#
本文转载自公众号:知识工场. 罗康琦,上海交通大学计算机系2019届博士,研究方向为自然语义理解和知识图谱.2012年获得华中科技大学软件工程学士学位,现就职于京东数据科学实验室(Data Scien ...
- 论文浅尝 | 基于知识库的自然语言理解 03#
本文转载自公众号: 知识工场. 罗康琦,上海交通大学计算机系2019届博士,研究方向为自然语义理解和知识图谱.2012年获得华中科技大学软件工程学士学位,现就职于京东数据科学实验室(Data Scie ...
- 论文浅尝 | 基于文本关联的知识图谱的无监督嵌入增强
来源:IJCAI2019 论文链接: https://www.ijcai.org/proceedings/2019/0725.pdf 概述 知识图谱嵌入是从多关系数据中提取数据的工具,最近的嵌入模型对 ...
- 论文浅尝 | 基于知识库的自然语言理解 04#
本文转载自公众号:知识工场. 罗康琦,上海交通大学计算机系2019届博士,研究方向为自然语义理解和知识图谱.2012年获得华中科技大学软件工程学士学位,现就职于京东数据科学实验室(Data Scien ...
- 论文浅尝 | 基于知识库的自然语言理解 02#
本文转载自公众号:知识工场. 罗康琦,上海交通大学计算机系2019届博士,研究方向为自然语义理解和知识图谱.2012年获得华中科技大学软件工程学士学位,现就职于京东数据科学实验室(Data Scien ...
- 论文浅尝 | 用增强学习进行推理:问答与知识库完善(KBC)
本文转载自公众号:程序媛的日常. 利用知识库.知识图谱来完善问答系统,有非常广阔的实际应用场景.当用户提出一个问题时,有时候仅用知识库中的某一个三元组事实(fact triple)即可回答.但当问题比 ...
最新文章
- R语言ggplot2可视化:在选定数据点周围添加三角形(Add Triangles Around Select Data Points)
- 华为与思科VRRP协议
- Kotlin的解析(下)
- SAP PP生产订单相关信息的获取
- 北大igem生物计算机,正在报名 | 2019国际基因工程机器大赛(iGEM)
- Oracle Discover产品简介
- Mysql笔记——DML
- 巨杉内核笔记(一)| SequoiaDB 会话(session)简介
- 华为鸿蒙会议安排,2020华为HDC日程确定,鸿蒙、HMS以及EMUI 11成最关注点
- 原生js循环展示dom_为什么说JS的DOM操作很耗性能
- Vue+elementUI下拉框自定义颜色选择器
- 超声波传感器测距原理
- iptables中snat、dnat、masquerade
- JavaWeb综合案例——商品后台管理系统
- 一张纸的厚度为0.08mm,对折多少次能达到或超过珠穆朗玛峰的高度(8848.13米)
- 新建vue-cli项目body与页面边框存在间隙
- docker 的安装以及简单centos镜像制作、启动
- 论文导读:Deep Attentive Learning for Stock Movement Prediction From Social Media Text and Company Correl
- 计算机毕业设计Java企业员工考勤系统的设计与实现(源码+系统+mysql数据库+lw文档)
- 2021年甘肃省安全员B证考试报名及甘肃省安全员B证新版试题