题目:OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs

介绍

这是一篇ACL-2019的paper,论文提出了一种模型,把对话中涉及到的实体等相关信息转换成在知识图谱中通过路径寻找的问题,同时还提供了一个标注好的对话和知识图谱相对应的数据集。

why

开放式对话系统要生成好的对话回复需要两个步骤:对话推理和对话生成。

  • 对话推理可以理解成找到与该轮对话相关的实体和属性,使用这些实体和属性去构造出回复的主体。
  • 对话生成是利用这些实体和属性去完成整个回复内容的生成。

本文的关注点主要是在对话推理方面,作者主要的出发点:

  • 大规模的知识图谱中包含了丰富的知识,以及实体之间的关系,所以可以利用上知识图谱的信息,把对话推理转换为知识推理
  • 完全将对话建立在大规模的KG中,因为知识图谱中的实体与实体之间是通过一定关系连接起来的,而对话推理的目标是找到与该轮对话相关的一些实体,所以我们可以把它们联系到一起,即把对话推理这个任务转换成在知识图谱中的行走问题,进行可解释性探索。

what

  • 1.作者收集了一个人-人多轮对话数据集,这个数据集是第一个对话和知识图谱相对应的平行数据集,其中每个KG实体及其在开放式对话中的事实联系都有完整的注释。
  • 2.提出了一种新的图形解码器,它关注可行的KG路径,通过将这些路径与给定的输入上下文(对话、句子和上一轮中提到的一组起始KG实体)相关联来预测KG中最相关的实体。
  • 3.然后,构建了一个Zeroshot Learning model,该模型预测KG嵌入空间中的实体,并基于解码的图路径输出对候选实体进行排名。

how

DialKG Walker的整个模型架构,整个模型可以看做是一个encoder-decoder架构。

首先,给定对话历史信息,当前对话信息和起始节点集合,通过Input Encoder生成整个context

然后,graph decoder利用context信息和节点信息去生成walk path

最后,使用zero-shot KG embeddings对候选实体进行排序

  • Input Encoder
    (1)实体表示:编码当前轮对话涉及到的实体,通过KG Embedding(TransE)编码为实体向量作为输入,KG Embedding模型可表示为:

    即最大似然学习法: 使得有效三元组的概率最大。
    (2) 句子表示:编码当前轮的对话,采用attention-based Bi-LSTM进行编码。
    (3) 对话表示:编码以前所有的对话日志,采用hierarchical Bi-LSTM进行编码。
    (4) 融合表示: 最后以上三个表示分别得到一个向量,在这里再使用一个Attention,以得到最终的表示向量x
  • Graph Decoder
    得到上述最终的表示向量之后,作者提出了一个网络结构去预测相关的KG entity,使用以下的目标函数:

    分别是L(f)生成下一轮正确entity的loss,L(walk)选择最佳路径的loss

    • Zeroshot Relevance Score
      对于 L(f),一种实现方式是使用hinge rank loss,可以定义成

      其中函数f代表一个把entity映射到KG embedding space的转换函数,第一个y是负采样的目标实体,第二个y是目标实体

      这个loss代表我们希望预测的embedding与真实实体的embedding的相似度要比与negative label的相似度大。其中,margin设置为ground truth和negative sample的相似度

    • KG Path Walker
      目前生成的KG实体候选集,计算量会特别大。作者定义了一个基于attention的DialKG graph decoder,又增加了一个模块(其本质上是一个使用LSTM生成Path的生成过程),这样就可以对无关的path进行剪枝,极大地减小搜索空间。

      损失函数定义为entity paths的loss+relation paths的loss:


      当模型训练好之后,在decoding step,我们基于zero-shot relevance和attention-based path scores来对潜在的path进行排序:

Result

在In-domain,Cross-domain,Human evaluation这三个方面进行了评估,该文提出的模型都有比较好的结果

Conclusion

把对话过程建模在知识图谱上使其具有可解释性,是个很不错的Idea,但是只介绍了推理方面,而之后如何生成回复没有详细介绍

论文: link

论文-OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Grap相关推荐

  1. 论文:EMNLP2021-End-to-End Entity Resolution and Question Answering Using Differentiable Knowledge Grap

    何为实体解析(entity resolution):entity resolution component identifies entities mentioned in the question, ...

  2. 论文阅读:Semantic Aware Attention Based Deep Object Co-segmentation(ACCV2018)

    协同分割论文:Semantic Aware Attention Based Deep Object Co-segmentation(ACCV2018) 论文原文     code 目录 1.简介 2. ...

  3. 【论文阅读】Attention Based Spatial-Temporal GCN...Traffic Flow Forecasting[基于注意力的时空图卷积网络交通流预测](1)

    [论文阅读]Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting[基于注 ...

  4. attention机制中的注意力图怎么画_注意力机制 | 图卷积多跳注意力机制 | Direct multihop Attention based GNN...

    导读:目前GNNs通过利用self-attention机制已经取得较好的效果.但目前的注意力机制都只是考虑到相连的节点,却不能利用到能提供图结构上下文信息的多跳邻居(multi-hop neighbo ...

  5. ATT-CNN(attention based CNN)

    ATT-CNN文本分类,论文解读(Attention-based Convolutional Neural Networks for Sentence Classification) Attentio ...

  6. Gated Mechanism for Attention Based Multi Modal Sentiment Analysis 阅读笔记

    GATED MECHANISM FOR ATTENTION BASED MULTIMODAL SENTIMENT ANALYSIS 阅读笔记 最近在跟进多模态的情感分析发现多模态榜一又被刷下来了,这篇 ...

  7. 21.Selective Attention Based Graph Convolutional Networks for Aspect-Level Sentiment Classification阅

    21.Selective Attention Based Graph Convolutional Networks for Aspect-Level Sentiment Classification阅 ...

  8. 论文记录:Reasoning with neural tensor networks for Knowledge Base completion

    论文记录:Reasoning with neural tensor networks for Knowledge Base completion Paper points Neural tensor ...

  9. 论文笔记—A Review of Visual-LiDAR Fusion based Simultaneous Localization and Mapping

    论文笔记-A Review of Visual-LiDAR Fusion based Simultaneous Localization and Mapping 论文链接 文章摘要 ~~~~    ~ ...

  10. 【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection --- 虚假新闻检测,多模态

    本博客系本人阅读该论文后根据自己理解所写,非逐句翻译,欲深入了解该论文,请参阅原文. 论文标题:Hierarchical Multi-modal Contextual Attention Networ ...

最新文章

  1. Java基础概念(一)
  2. Deverpress 中国代理商使用 官方地址
  3. numpy pytorch 接口对应_拆书分享篇深度学习框架PyTorch入门与实践
  4. 1.Redis简介与基本命令
  5. 苹果可折叠iPhone有望在2023年推出 支持手写笔
  6. java如何新建一个空的压缩包_如何在Java中创建zip文件
  7. 高通工具QXDM、QCAT和QPST
  8. 阿里云服务器实现内网互通
  9. python——方便数的据存储模式Bunch
  10. 68个经典励志小故事|哲理小故事,让你终身受益(3)
  11. 实验3 交互式SQL语言1
  12. 电脑突然复制粘贴不了
  13. js逆向之有道词js加密解析
  14. Android系统的VTS测试套件介绍
  15. Hadoop题库(选择题、判断题)详细介绍
  16. 操作系统:内存管理(概念)
  17. 网拍短时间内难以跟传统拍卖分庭抗礼 互联网拍卖市场未来将是“兵家必争之地”
  18. Fourth4: NAT VRRP | Cloud computing
  19. 传感器原理及应用期末复习汇总(附某高校期末真题试卷)
  20. android按钮中添加图标,android 控件 带图标的按钮(ImageButton)

热门文章

  1. char,varchar,nchar,nvarchar的区别
  2. 应用树莓派GPIO完成智能红绿灯系统
  3. 致远OA单点登陆到第三方系统(零代码实现)
  4. html 的scor属性,scrollheight属性
  5. 机器学习:self-paced 和 fine-tuning
  6. 数据质量第一步—数据监控
  7. 达梦数据库的服务启动
  8. Windows下主机名和IP映射设置
  9. 统计|方差分析拒绝原假设的LSD一般步骤及实现
  10. elementUI表格合并行数据