Yang, B., Mitchell, T., 2017. Leveraging Knowledge Bases in LSTMs for Improving Machine Reading. Association for Computational Linguistics, pp. 1436–1446.

链接:http://www.aclweb.org/anthology/P/P17/P17-1132.pdf

这篇论文是今年发表在 ACL 的一篇文章,来自 CMU 的工作,提出通过更好地利用外部知识库的方法解决机器阅读问题。由于传统方法中用离散特征表示知识库的知识存在了特征生成效果差而且特征工程偏特定任务的缺点,本文选择用连续向量表示方法来表示知识库。传统神经网络端到端模型使得大部分背景知识被忽略,论文基于 BiLSTM 网络提出扩展网络 KBLSTM,结合 attention 机制在做任务时有效地融合知识库中的知识。

论文以回答要不要加入 background knowledge,以及加入哪一些信息两部分内容为导向,并借助以下两个例子说明两部分内容的重要性。“Maigretleft viewers in tears.”利用背景知识和上下文我们可以知道Maigret指一个电视节目,“Santiago is charged withmurder.”如果过分依赖知识库就会错误地把它看成一个城市,所以根据上下文判断知识库哪些知识是相关的也很重要。

KBLSTM(Knowledge-aware Bidirectional LSTMs)有三个要点:

(1)检索和当前词相关的概念集合V(x_t)

(2)attention 动态建模语义相关性

(3)sentinel vector S_t 决定要不要加入 background knowledge。

主要流程分两条线:

(1)当考虑背景知识的时候就把 knowledge module 考虑进去

(2)如果找不到和当前词相关的概念则设置 m_t 为 0,直接把 LSTM 的 hidden state vector 作为最后的输出。

后者简单直接,这里说明前者的结构。knowledge module 模块把 S_t、h_t、V(x_t) 作为输入,得到每个候选知识库概念相对于 h_t 的权重 α_t,由 S_t 和 h_t 得到 β_t 作为 S_t 的权重,最后加权求和得到 m_t 和 h_t 共同作为输入求最后输出,这里通过找相关概念和相关权重决定加入知识库的哪些知识。

论文用 WordNet 和 NELL 知识库,在 ACE2005 和 OntoNotes 数据集上做了实体抽取和事件抽取任务。两者的效果相对于以前的模型都有提升,且同时使用两个知识库比任选其一的效果要好。

笔记整理: 李娟,浙江大学在读博士,研究方向为知识图谱,常识推理,知识库分布式表示和学习。


OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | Leveraging Knowledge Bases in LSTMs相关推荐

  1. 论文浅尝 - IJCAI | Knowledge is NOT always you need: 外部知识注入预训练模型的利与弊...

    转载公众号 | 浙大KG 论文题目:Drop Redundant, Shrink Irrelevant: Selective Knowledge Injection for Language Mode ...

  2. 论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

    论文笔记整理:吴桐桐,东南大学博士生,研究方向为自然语言处理. 链接:https://www.aclweb.org/anthology/P19-1226/ 近年来,机器阅读理解已经逐渐发展为自然语言理 ...

  3. 论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

    本文转载自公众号:PaperWeekly. CIKM 2017 ■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin La ...

  4. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  5. 论文浅尝 | 图神经网络综述:方法及应用

    论文链接:https://arxiv.org/pdf/1812.08434.pdf GNN相关论文列表链接:https://github.com/thunlp/GNNPapers 近日,清华刘知远老师 ...

  6. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  7. 论文浅尝 | 近期论文精选

    本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...

  8. ###好好好#######论文浅尝 | 基于图注意力的常识对话生成

    论文浅尝 | 基于图注意力的常识对话生成 OpenKG 祝各位读者新春快乐,猪年吉祥! 来源:IJCAI 2018. 论文下载地址:https://www.ijcai.org/proceedings/ ...

  9. 论文浅尝 | 提取计数量词丰富知识库

    OpenKG 祝各位读者新年快乐! 论文标题:Enriching Knowledge Bases with Counting Quantifiers 论文链接:https://link.springe ...

最新文章

  1. android studio 编译报错:download fastutil-7.2.0.jar
  2. 使用 SQL Server 2000 索引视图提高性能1
  3. 144hz minidp转dp_毕亚兹miniDP转HDMI转接器,拓展你的Surface Pro 3上4K大屏
  4. python 使用requests模块进行 视频文件的下载
  5. LeetCode 1263. 推箱子(BFS+DFS / 自定义哈希set)
  6. 致敬各位10年阿里的前端开发
  7. 如何使用Burp Suite代理
  8. PHP基础学习课程强烈推荐
  9. 数据结构上机实践第14周项目3 - 是否二叉排序树
  10. 【解题报告】动态规划进阶题(区间DP、树形DP、状压DP入门)
  11. 20200108每日一句
  12. amoeba mysql_详解如何利用amoeba(变形虫)实现mysql数据库读写分离
  13. GB28181设备端PS流封装和发送
  14. MyEclipse10 激活
  15. 关于windows清理C盘问题
  16. 格式化字符串漏洞及利用_萌新食用
  17. 汽车改装之3G上网车载电脑篇
  18. The Cook and the Chef: Musk’s Secret Sauce
  19. win10+VS2017编译配置boost_1_78_0
  20. ESP8266+OLED屏实现天气预报+温度显示+NTP时间同步5屏带中文显示改进版

热门文章

  1. 在一个list中增加一个节点
  2. 你应该知道Linux内核softirq
  3. 转盘脚本编辑器学习1
  4. Python3之字典生成器结合lambda实现按key/value排序
  5. git gui怎么拉取项目代码_Git可视化极简易教程 — Git GUI使用方法
  6. python基础编码规范_Python语言的基本语法和编码规范.doc
  7. LeetCode 1905. 统计子岛屿(BFS)
  8. Pytorch 神经网络训练过程
  9. LeetCode 468. 验证IP地址
  10. linux远程工具_【linux实操3.1】linux远程连接工具Secure的使用