论文笔记整理:吴涵,天津大学硕士,研究方向:自然语言处理


Paper:https://www.aclweb.org/anthology/P19-1430/

Code:https://github.com/thunlp/Chinese_NRE

引入

中文NER问题在很大程度上取决于分词的效果,所以在中文NER问题中,学者们通常先对文本进行分词然后再预测序列中单词的类别。这样一来会导致一个问题,即在分词中造成的错误会影响到NER的结果。

如果单纯采用字向量的话会导致拆开了很多并不应该拆开的词语,从而丢失了它们本身的内在信息(比如“人生”这个词如果拆成字向量就成了“人”和“生”,这两个字的单独含义明显与它们组合起来的词的含义大相径庭)。为了解决这个问题,该论文使用了一种新型的格子结构(latticestructure),它能够将单词本身的含义加入基于字向量的模型中,并引入义原作为外部知识。

文章摘要

    本文在ACL2018的一篇论文《ChineseNER Using Lattice LSTM》上加以改进,加入了义原作为外部知识,可以更好地理解语义信息。

由于同时考虑了词格作为一个cell,自然网络中路径就变多,所以要对于基本的LSTM网络的计算公式加以修改:

对词格结尾的字符(如图中的“市”)进行计算时,会有一点不同:由于向“市”的cell有两个信息流的输入,故需要再加一个inputgate,两个门同时通过不同的信息流,需要设置权重:

本文模型:引入义原作为外部知识

加入义原后,计算时,在词格cell状态的计算上考虑不同义项带来的影响,并为不同的义项设置不同的权重:

实验结果

通过与基于词粒度和字符粒度模型进行比较,可以得出,加入义原的多粒度模型可以获得更好的效果,同时,词格模型也是性能提升的重要原因。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | 融合多粒度信息和外部语言知识的中文关系抽取相关推荐

  1. 论文浅尝 | 基于图匹配神经网络的跨语言知识图对齐 (ACL 2019)

    本文转载自公众号:PaperWeekly.作者:王文博,哈尔滨工程大学硕士生,研究方向为知识图谱.表示学习. 动机 在本篇文章之前,跨语言知识图谱对齐研究仅依赖于从单语知识图谱结构信息中获得的实体嵌入 ...

  2. 论文浅尝 | 面向自动问题生成的跨语言训练

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答. 来源:ACL 2019 链接:https://128.84.21.199/pdf/1906.02525.pdf 动机 现有问题生成 ...

  3. 论文浅尝 | 基于微量资源的神经网络跨语言命名实体识别

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答. 来源:EMNLP 2018 链接:https://www.aclweb.org/anthology/D18-1034 问题背景与动 ...

  4. 论文浅尝 | 基于Universal Schema与Memory Network的知识+文本问答

    来源:ACL 2017 链接:http://aclweb.org/anthology/P17-2057 本文提出将 Universal schema 用于自然语言问答中,通过引入记忆网络,将知识库与文 ...

  5. 论文浅尝 | 基于图卷积网络的跨语言图谱实体对齐

    论文笔记整理:谭亦鸣,东南大学博士生,研究兴趣:知识图谱问答 本文提出了一种基于图卷积网络的跨语言实体对齐方法,通过设计一种属性 embedding 用于 GCN 的训练,发现GCN能同时学习到特征 ...

  6. 论文浅尝 | 基于正交普鲁克分析的高效知识图嵌入学习

    笔记整理:朱渝珊,浙江大学在读博士,研究方向为快速知识图谱的表示学习,多模态知识图谱. 1.Motivation 知识图谱是许多NLP任务和下游应用的核心,如问答.对话代理.搜索引擎和推荐系统.知识图 ...

  7. 论文浅尝 | 融合多层次领域知识的分子图对比学习

    笔记整理 | 方尹,浙江大学在读博士,研究方向:图表示学习 论文地址:https://arxiv.org/pdf/2106.04509.pdf 动机 目前基于图的对比学习有以下几个问题: 不同领域的图 ...

  8. 论文浅尝 | 基于潜在类别信息的实体链接

    笔记整理 | 黄一凡,东南大学本科生 来源:AAAI2020 链接:https://arxiv.org/pdf/2001.01447v1.pdf 一.简介 作者意识到在利用预训练模型进行实体链接时,往 ...

  9. 论文浅尝 | BoxE:一种基于Box的知识图谱表示学习模型

    笔记整理 | 耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习等. 论文链接:  https://arxiv.org/pdf/2007.06267.pdf 本文是发表在NeurIPS 2020上 ...

最新文章

  1. 2021年大数据ELK(十三):Elasticsearch编程(添加职位数据)
  2. 基于GTID模式MySQL主从复制
  3. 马斯克将Roadster送上太空,“宇宙第一跑车”诞生
  4. 【机器学习】脑机接口利器:错误率仅3%
  5. 不会有1TB?研究机构称iPhone 13最高存储仍为512GB
  6. 频率和概率、平均值和期望值
  7. Android面试算法题之拆分元素
  8. 24小时学通LINUX内核系列
  9. 深度学习进行语音识别的方法 如何建立自己的语音识别系统
  10. 计算机人力资源试题及答案,计算机二级word练习题一题目及答案.
  11. 微软的产品激活中心电话
  12. javascript错误_您可能会犯的javascript错误
  13. 个人银行账户管理程序(C++)
  14. 如何创建维恩图,用这个工具就可以了!
  15. MCE | 靶向 cGAS-STING 通路或可治疗渐冻症
  16. 安卓xml文件中设置动画匀速旋转无效?
  17. python如何取消换行_python怎么取消换行
  18. ARM GICv3 GIC代码分析
  19. matlab 求已知概率密度函数的随机数生成
  20. 权威认证 | 云和恩墨zData Light存储管理软件获H3C兼容认证

热门文章

  1. 《塔木德智慧全书》(之四)
  2. Linux显示中文乱码解决方法
  3. 为什么不能同时用const和static修饰成员函数?
  4. Activity的缓存方法
  5. 极简的 PNG 编码函数 svpng(),用来学习C语言,真的很爽
  6. 自己都不觉得自己值钱,别人怎么觉得你值钱?
  7. 今天我勇敢的点就一个gpio口
  8. mtk pwmlinux timer
  9. 【Pytorch神经网络理论篇】 05 Module类的使用方法+参数Parameters类+定义训练模型的步骤与方法
  10. 数据结构之平衡树:红黑树的介绍与Python代码实现——17