贴一下汇总贴:论文阅读记录

论文链接:《MECT: Multi-Metadata Embedding based Cross-Transformer for Chinese Named Entity Recognition》

一、摘要

最近,词增强在中文命名实体识别(NER)中变得非常流行,减少了分割错误并增加了中文词的语义和边界信息。然而,这些方法在整合词汇信息后往往会忽略汉字结构的信息。汉字自古由象形文字演变而来,其结构往往反映了更多的文字信息。本文提出了一种新的基于多元数据嵌入的交叉变换器(MECT),通过融合汉字的结构信息来提高中文 NER 的性能。具体来说,我们在双流 Transformer 中使用多元数据嵌入将汉字特征与部首级嵌入相结合。借助汉字的结构特征,MECT可以更好地为NER捕捉汉字的语义信息。在几个著名的基准数据集上获得的实验结果证明了所提出的 MECT 方法的优点和优越性。代码:github。

二、结论

本文提出了一种适用于Chinese NER的新型双流网络,即MECT。该方法使用多元数据嵌入,通过交叉变换网络融合部首、字符和单词的信息。此外,随机注意力被用于进一步提高性能。在四个基准上的实验结果表明,汉字部首信息可以有效提高Chinese NER的性能。

所提出的带有基流的MECT方法增加了模型的复杂性。未来,我们将考虑如何在双流或多流网络中以更高效的方式集成汉字的字符、单词和部首信息,以提高Chinese NER的性能,并将其扩展到其他自然语言处理任务中。

三、model

该方法的关键是利用汉字的部首信息来增强中文NER模型。所以我们重点研究了文献中主流的信息增强方法。汉语NER增强方法主要有两种,包括词汇信息融合和字形结构信息融合。

最大似然方法:

用于部首特征提取的CNN:

【论文泛读164】MECT:基于多元数据嵌入的中文命名实体识别交叉变换器相关推荐

  1. 阿里AAAI2018论文解读:轻量网络训练框架、GAN中文命名实体识别、英俄翻译等...

    1. 火箭发射:一种有效的轻量网络训练框架<Rocket Launching: A Universal and Efficient Framework for Training Well-per ...

  2. 基于BERT预训练的中文命名实体识别TensorFlow实现

    BERT-BiLSMT-CRF-NER Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tun ...

  3. BERT-BiLSTM-CRF基于BERT预训练的中文命名实体识别TensorFlow实现

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx Tensorflow solution of NER task Using BiLSTM-CR ...

  4. 【论文笔记】《基于深度学习的中文命名实体识别研究》阅读笔记

    作者及其单位:北京邮电大学,张俊遥,2019年6月,硕士论文 摘要 实验数据:来源于网络公开的新闻文本数据:用随机欠采样和过采样的方法解决分类不均衡问题:使用BIO格式的标签识别5类命名实体,标注11 ...

  5. 【项目调研+论文阅读】基于BERT的中文命名实体识别方法[J] | day6

    <基于BERT的中文命名实体识别方法>王子牛 2019-<计算机科学> 文章目录 一.相关工作 二.具体步骤 1.Bi-LSTM 2.CRF结构 三.相关实验 1.数据集 2. ...

  6. 论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法

    本文转载自公众号:机器之心. 选自arXiv 作者:Yue Zhang.Jie Yang 机器之心编译 参与:路.王淑婷 近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一 ...

  7. 【ACL2021】基于边界检测增强的中文命名实体识别

    点击下面卡片,关注我呀,每天给你送来AI技术干货! 来自:复旦DISC 作者:石霭青 引言 命名实体识别(Named Entity Recognition,NER)是自然语言处理领域的一个基础任务,是 ...

  8. 基于预训练模型的军事领域命名实体识别研究

    摘要 [目的]为了解决开源非结构化军事领域数据的命名实体识别问题.[方法]本文提出基于预训练模型(Bidirectional Encoder Representations from Transfor ...

  9. 中文命名实体识别---基于多特征融合嵌入

    来源: AINLPer 微信公众号(每日更新-) 编辑: ShuYini 校稿: ShuYini 时间: 2021-11-18 昨天给大家分享的是一篇EMNLP2021关于关系提取的文章,文章中将关系 ...

最新文章

  1. 在idea项目中的android包不能识别_项目调试编译和部署运行
  2. Python 基础 函数
  3. Spring Data ElasticSearch删除索引遇到的java.lang.IllegalStateException: Failed to load ApplicationContext异常
  4. java递归api_javaAPI_IO流基础_递归使用
  5. python将json转换为excel_使用python将Excel转换为JSON_python_酷徒编程知识库
  6. awk输出指定行,awk如何取反
  7. 坚果手机产品经理朱海舟:售后服务和系统维护会正常继续
  8. 【操作系统/OS笔记08】进程的定义、组成、PCB、生命周期管理、状态变化模型、挂起模型
  9. 用深度学习进行语音识别为什么还要算mfcc?
  10. 常见的大数据误区有哪些
  11. 中文分词:正向最大匹配与逆向最大匹配
  12. C语言程序设计----C语言基础知识
  13. win7鼠标指针主题包_MouseInc 小巧好用的鼠标手势软件
  14. Java面试宝典2018
  15. 手机modem开发之VoLTE信令
  16. NLP 的巨人肩膀(下):从 CoVe 到 BERT
  17. 你的终极目标是什么?
  18. 一、开水白菜(steamed Chinese cabbage in supreme soup)
  19. git 提交错误:The requested URL returned error: 502
  20. 训练模型时候显存爆炸的一种可能性以及解决办法

热门文章

  1. 基于LRU-K算法设计本地缓存实现流量削峰
  2. 英特尔眼中的三大科技趋势
  3. 第十一届蓝桥杯既约分数 Java
  4. idea里注释日期怎么_IntelliJ IDEA自动注释作者信息和日期时间
  5. seo教程电子书(SEO搜索引擎优化基础教程)
  6. 时代周刊评选的让你拥有健康,快乐的20件事
  7. PTA 直捣黄龙(30分)
  8. 用python pynput 监听键盘输入
  9. flash反编译杂记
  10. 招聘|中国农科院深圳基因组研究所汪鸿儒团队诚聘副研究员、博士后与研究助理...