CyGNet论文阅读笔记
- 论文标题:Learning from History: Modeling Temporal Knowledge Graphs with Sequential Copy-Generation Networks
- 论文来源:AAAI 2021
文章目录
- 1. 开篇
- 2. 模型
- 2.1. 整体结构
- 2.2. Copy Mode
- 2.3. Generation Mode
- 2.4. Inference and Learning Objective
- 3. 实验结果
- 4. 作者的展望
- 5. 个人想法
1. 开篇
- 文章提出了一种新的时序知识图谱表示学习模型CyGNet,不仅能够利用全局图谱结构去预测三元组(Generation Mode),而且能够利用过去重复发生的事实(facts)去预测未来(Copy Mode)。
2. 模型
2.1. 整体结构
2.2. Copy Mode
Copy Mode使用过去重复发生的facts对未来的facts进行预测。
- 对于一个待预测的query ( s , p , ? , t k ) (s,p,?,t_k) (s,p,?,tk),首先构建一个historical vocabulary(如图2所示意):
{ h t 1 ( s , p ) , h t 2 ( s , p ) , h t 3 ( s , p ) , . . . . . . , h t k − 1 ( s , p ) } \{h^{(s,p)}_{t_1},h^{(s,p)}_{t_2},h^{(s,p)}_{t_3},......,h^{(s,p)}_{t_{k-1}}\} {ht1(s,p),ht2(s,p),ht3(s,p),......,htk−1(s,p)}其中 h t i ( s , p ) h^{(s,p)}_{t_i} hti(s,p)是一个N维向量(N是实体总数),向量中为1的元素表示训练集中存在以对应实体为objective(客体、宾语)的fact(且时间为 t i {t_i} ti),反之则为0。(注意:对每个query只会用到在其之前的历史信息)
图2. historical vocabulary构建示意图 - 然后将这些历史信息汇总:
H t k ( s , p ) = h t 1 ( s , p ) + h t 2 ( s , p ) + h t 3 ( s , p ) + . . . . . . + h t k − 1 ( s , p ) H^{(s,p)}_{t_k} = h^{(s,p)}_{t_1}+h^{(s,p)}_{t_2}+h^{(s,p)}_{t_3}+......+h^{(s,p)}_{t_{k-1}} Htk(s,p)=ht1(s,p)+ht2(s,p)+ht3(s,p)+......+htk−1(s,p) - 随后用一个MLP接入query信息:
v q = t a n h ( W c [ s , p , t k ] + b c ) v_q=tanh(W_c[s,p,t_k]+b_c) vq=tanh(Wc[s,p,tk]+bc)其中 W c W_c Wc是模型参数; s , p , t k s,p,t_k s,p,tk都是embedding向量,值得注意的是 t k t_k tk的embedding方式(之后再补充)。 - 最后将query信息与history信息融合
p c = s o f t m a x ( v q + H t k ( s , p ) ) p_c=softmax(v_q+H_{t_k}^{(s,p)}) pc=softmax(vq+Htk(s,p))其中 p c p_c pc是一个长度为N的向量,每个元素代表预测客体为对应(索引编号)实体的概率。
2.3. Generation Mode
- Generation Mode利用全局的结构信息进行预测。
g q = t a n h ( W g [ s , p , t k ] + b g ) g_q=tanh(W_g[s,p,t_k]+b_g) gq=tanh(Wg[s,p,tk]+bg) p g = s o f t m a x ( g q ) p_g=softmax(g_q) pg=softmax(gq)
2.4. Inference and Learning Objective
- 作者将query ( s , p , ? , t k ) (s,p,?,t_k) (s,p,?,tk)的预测问题看作一个N分类问题,Copy Mode和Generation Mode会产生两个概率分布向量 p c p_c pc和 p g p_g pg,将两者加权求和得到最终的概率分布: p = α ∗ p c + ( 1 − α ) ∗ p g p=\alpha*p_c+(1-\alpha)*p_g p=α∗pc+(1−α)∗pg其中 α ∈ [ 0 , 1 ] \alpha\in[0,1] α∈[0,1]是超参数;而最终的预测客体编号为 a r g m a x ( p ) argmax(p) argmax(p)。
模型的前向推断过程如图3所示:
图3. 模型的前向推断过程 - 损失函数为概率分布向量的交叉熵(原文中的loss有些看不懂,这个是从源码中看出来的,就是多分类问题的交叉熵损失) l o s s = C r o s s E n t r o p y ( p , t r u e t h l a b e l s ) + r e g u l a r i z a t i o n _ l o s s loss=Cross Entropy(p,truethlabels)+regularization\_loss loss=CrossEntropy(p,truethlabels)+regularization_loss
3. 实验结果
- 作者在5个时序知识图谱数据集(ICEWS18,ICEWS14, GDELT, WIKI and YAGO)上进行实验。
- 数据集规模
- 与baseline的对比实验。CyGNet在ICEWS18,ICEWS14,GDELT这三个数据集上都达到了最好的性能;在WIKI数据集上性能比RE-NET模型要差;在YAGO数据集上与RE-NET难分高下。
作者还分析了CyGNet模型在WIKI数据集上性能较差的原因,因为WIKI数据集上subjects和objects在历史中重复的比例不平衡。作者为此提出了一个改进方向:how to tackle this shortcoming of CyGNet with a more robust meta-learning framework is a meaningful direction for further studies.
- 消融实验
4. 作者的展望
- For future work,we plan to improve the sequential copy mechanism by identifying globally salient entities and events.
5. 个人想法
- 融入历史信息的方式可以改进
CyGNet论文阅读笔记相关推荐
- 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation
论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...
- DnCNN论文阅读笔记【MATLAB】
DnCNN论文阅读笔记 论文信息: 论文代码:https://github.com/cszn/DnCNN Abstract 提出网络:DnCNNs 关键技术: Residual learning an ...
- Learning Multiview 3D point Cloud Registration论文阅读笔记
Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...
- FCGF论文阅读笔记
FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...
- PointConv论文阅读笔记
PointConv论文阅读笔记 Abstract 本文发表于CVPR. 其主要内容正如标题,是提出了一个对点云进行卷积的Module,称为PointConv.由于点云的无序性和不规则性,因此应用卷积比 ...
- DCP(Deep Closest Point)论文阅读笔记以及详析
DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...
- 2019 sample-free(样本不平衡)目标检测论文阅读笔记
点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自知乎,已获作者同意转载,请勿二次转载 (原文地址:https://zhuanlan.zhihu.com/p/100052168) 背景 < ...
- keras cnn注意力机制_2019 SSA-CNN(自注意力机制)目标检测算法论文阅读笔记
背景 <SSA-CNN Semantic Self-Attention CNN for Pedestrian Detection>是2019 的工作,其作者来自于南洋理工.这篇文章主要是做 ...
- ResNet 论文阅读笔记
ResNet 论文阅读笔记 #机器学习/深度学习 文章介绍 论文地址:https://arxiv.org/pdf/1512.03385.pdf 原文题目:Deep Residual Learning ...
最新文章
- [蓝桥杯][2018年第九届真题]调手表(BFS)
- SVN 出错信息汇总/错误信息一览表
- delphi下实现ribbon界面的方法(一)
- springdata学习笔记-01-helloworld-(暂时不全223)
- BizTalk 开发系列(四十) BizTalk WCF-SQL Adapter读取SQL Service Broker消息
- 微信 账户升级服务器地址,微信支付商户平台账户升级后有哪些新功能呢?
- xposed hook java_[原创]Android Hook 系列教程(一) Xposed Hook 原理分析
- 中国制造特斯拉亮相 中文车尾标亮了!网友:好抠吗?
- Spring AOP注解
- rsync与inotify集成实现数据实时同步更新
- mysql性能优化方案总结
- 指标公式c语言源码下载,通达信99.75%成功率指标公式 源码
- GB28181协议——对接摄像机
- svn server服务器搭建
- 单总线结构CPU数据通路
- echarts拓扑图
- dellnas存储服务器型号,Dell Storage NX系列NAS存储
- JMeter测试多用户登录
- 菜鸟学习SpringBoot——(一)构建一个简单的单体Springboot项目
- 练习之彩票四 计算中奖数(结尾)