• 论文标题:Learning from History: Modeling Temporal Knowledge Graphs with Sequential Copy-Generation Networks
  • 论文来源:AAAI 2021

文章目录

  • 1. 开篇
  • 2. 模型
    • 2.1. 整体结构
    • 2.2. Copy Mode
    • 2.3. Generation Mode
    • 2.4. Inference and Learning Objective
  • 3. 实验结果
  • 4. 作者的展望
  • 5. 个人想法

1. 开篇

  • 文章提出了一种新的时序知识图谱表示学习模型CyGNet,不仅能够利用全局图谱结构去预测三元组(Generation Mode),而且能够利用过去重复发生的事实(facts)去预测未来(Copy Mode)。

2. 模型

2.1. 整体结构

图1. CyGNet整体结构图

2.2. Copy Mode

Copy Mode使用过去重复发生的facts对未来的facts进行预测。

  • 对于一个待预测的query ( s , p , ? , t k ) (s,p,?,t_k) (s,p,?,tk),首先构建一个historical vocabulary(如图2所示意):
    { h t 1 ( s , p ) , h t 2 ( s , p ) , h t 3 ( s , p ) , . . . . . . , h t k − 1 ( s , p ) } \{h^{(s,p)}_{t_1},h^{(s,p)}_{t_2},h^{(s,p)}_{t_3},......,h^{(s,p)}_{t_{k-1}}\} {ht1(s,p),ht2(s,p),ht3(s,p),......,htk1(s,p)}其中 h t i ( s , p ) h^{(s,p)}_{t_i} hti(s,p)是一个N维向量(N是实体总数),向量中为1的元素表示训练集中存在以对应实体为objective(客体、宾语)的fact(且时间为 t i {t_i} ti),反之则为0。(注意:对每个query只会用到在其之前的历史信息)

    图2. historical vocabulary构建示意图
  • 然后将这些历史信息汇总:
    H t k ( s , p ) = h t 1 ( s , p ) + h t 2 ( s , p ) + h t 3 ( s , p ) + . . . . . . + h t k − 1 ( s , p ) H^{(s,p)}_{t_k} = h^{(s,p)}_{t_1}+h^{(s,p)}_{t_2}+h^{(s,p)}_{t_3}+......+h^{(s,p)}_{t_{k-1}} Htk(s,p)=ht1(s,p)+ht2(s,p)+ht3(s,p)+......+htk1(s,p)
  • 随后用一个MLP接入query信息:
    v q = t a n h ( W c [ s , p , t k ] + b c ) v_q=tanh(W_c[s,p,t_k]+b_c) vq=tanh(Wc[s,p,tk]+bc)其中 W c W_c Wc是模型参数; s , p , t k s,p,t_k s,p,tk都是embedding向量,值得注意的是 t k t_k tk的embedding方式(之后再补充)。
  • 最后将query信息与history信息融合
    p c = s o f t m a x ( v q + H t k ( s , p ) ) p_c=softmax(v_q+H_{t_k}^{(s,p)}) pc=softmax(vq+Htk(s,p))其中 p c p_c pc是一个长度为N的向量,每个元素代表预测客体为对应(索引编号)实体的概率。

2.3. Generation Mode

  • Generation Mode利用全局的结构信息进行预测。
    g q = t a n h ( W g [ s , p , t k ] + b g ) g_q=tanh(W_g[s,p,t_k]+b_g) gq=tanh(Wg[s,p,tk]+bg) p g = s o f t m a x ( g q ) p_g=softmax(g_q) pg=softmax(gq)

2.4. Inference and Learning Objective

  • 作者将query ( s , p , ? , t k ) (s,p,?,t_k) (s,p,?,tk)的预测问题看作一个N分类问题,Copy Mode和Generation Mode会产生两个概率分布向量 p c p_c pcp g p_g pg,将两者加权求和得到最终的概率分布: p = α ∗ p c + ( 1 − α ) ∗ p g p=\alpha*p_c+(1-\alpha)*p_g p=αpc+(1α)pg其中 α ∈ [ 0 , 1 ] \alpha\in[0,1] α[0,1]是超参数;而最终的预测客体编号为 a r g m a x ( p ) argmax(p) argmax(p)
    模型的前向推断过程如图3所示:

    图3. 模型的前向推断过程
  • 损失函数为概率分布向量的交叉熵(原文中的loss有些看不懂,这个是从源码中看出来的,就是多分类问题的交叉熵损失) l o s s = C r o s s E n t r o p y ( p , t r u e t h l a b e l s ) + r e g u l a r i z a t i o n _ l o s s loss=Cross Entropy(p,truethlabels)+regularization\_loss loss=CrossEntropy(p,truethlabels)+regularization_loss

3. 实验结果

  • 作者在5个时序知识图谱数据集(ICEWS18,ICEWS14, GDELT, WIKI and YAGO)上进行实验。
  • 数据集规模
  • 与baseline的对比实验。CyGNet在ICEWS18,ICEWS14,GDELT这三个数据集上都达到了最好的性能;在WIKI数据集上性能比RE-NET模型要差;在YAGO数据集上与RE-NET难分高下。
    作者还分析了CyGNet模型在WIKI数据集上性能较差的原因,因为WIKI数据集上subjects和objects在历史中重复的比例不平衡。作者为此提出了一个改进方向:how to tackle this shortcoming of CyGNet with a more robust meta-learning framework is a meaningful direction for further studies.
  • 消融实验

4. 作者的展望

  • For future work,we plan to improve the sequential copy mechanism by identifying globally salient entities and events.

5. 个人想法

  • 融入历史信息的方式可以改进

CyGNet论文阅读笔记相关推荐

  1. 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation

    论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...

  2. DnCNN论文阅读笔记【MATLAB】

    DnCNN论文阅读笔记 论文信息: 论文代码:https://github.com/cszn/DnCNN Abstract 提出网络:DnCNNs 关键技术: Residual learning an ...

  3. Learning Multiview 3D point Cloud Registration论文阅读笔记

    Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...

  4. FCGF论文阅读笔记

    FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...

  5. PointConv论文阅读笔记

    PointConv论文阅读笔记 Abstract 本文发表于CVPR. 其主要内容正如标题,是提出了一个对点云进行卷积的Module,称为PointConv.由于点云的无序性和不规则性,因此应用卷积比 ...

  6. DCP(Deep Closest Point)论文阅读笔记以及详析

    DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...

  7. 2019 sample-free(样本不平衡)目标检测论文阅读笔记

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自知乎,已获作者同意转载,请勿二次转载 (原文地址:https://zhuanlan.zhihu.com/p/100052168) 背景 < ...

  8. keras cnn注意力机制_2019 SSA-CNN(自注意力机制)目标检测算法论文阅读笔记

    背景 <SSA-CNN Semantic Self-Attention CNN for Pedestrian Detection>是2019 的工作,其作者来自于南洋理工.这篇文章主要是做 ...

  9. ResNet 论文阅读笔记

    ResNet 论文阅读笔记 #机器学习/深度学习 文章介绍 论文地址:https://arxiv.org/pdf/1512.03385.pdf 原文题目:Deep Residual Learning ...

最新文章

  1. [蓝桥杯][2018年第九届真题]调手表(BFS)
  2. SVN 出错信息汇总/错误信息一览表
  3. delphi下实现ribbon界面的方法(一)
  4. springdata学习笔记-01-helloworld-(暂时不全223)
  5. BizTalk 开发系列(四十) BizTalk WCF-SQL Adapter读取SQL Service Broker消息
  6. 微信 账户升级服务器地址,微信支付商户平台账户升级后有哪些新功能呢?
  7. xposed hook java_[原创]Android Hook 系列教程(一) Xposed Hook 原理分析
  8. 中国制造特斯拉亮相 中文车尾标亮了!网友:好抠吗?
  9. Spring AOP注解
  10. rsync与inotify集成实现数据实时同步更新
  11. mysql性能优化方案总结
  12. 指标公式c语言源码下载,通达信99.75%成功率指标公式 源码
  13. GB28181协议——对接摄像机
  14. svn server服务器搭建
  15. 单总线结构CPU数据通路
  16. echarts拓扑图
  17. dellnas存储服务器型号,Dell Storage NX系列NAS存储
  18. JMeter测试多用户登录
  19. 菜鸟学习SpringBoot——(一)构建一个简单的单体Springboot项目
  20. 练习之彩票四 计算中奖数(结尾)

热门文章

  1. 基于python的Nginx日志管理分析系统
  2. SPA项目开发之动态树+数据表格+分页
  3. 利用FDTD软件仿真拓扑光子(一)-前言
  4. InDesign 教程:如何转换图形和框架?
  5. IOS逆向--iOSOpenDev进行开发tweak
  6. c#html表格样式大全,如何在C#中以漂亮的表格格式表示数据?
  7. 大连理工大学操作系统上机实验二
  8. 数据可视化(ECharts)
  9. 计算机财务管理教学视频教学,财务管理专业计算机公共课教学方法的探讨
  10. html在线音频播放器实训总结,HTML5 播放器心得与小结