每天给你送来NLP技术干货!


来自:揣摩研习社

导读 概览

近年来,引入字-词构成的Lattice信息被证明可以有效提升中文实体识别方法的性能。然而,由于Lattice结构的复杂性和动态性,基于Lattice的模型难以充分利用 GRU 的并行计算能力,推理速度较慢。因此,本文提出了一种基于Transformer的词典增强的中文实体识别模型FLAT。首先,FLAT模型将Lattice结构转化为由片段组成的序列结构。每个片段对应于句子中的一个字或潜在的词汇,并保留其在原始Lattice中的头、尾位置信息。然后,FLAT模型计算了片段之间的相对位置信息,并采用基于相对位置的Transformer对Lattice进行编码。得益于Transformer的强大特征抽取能力、高效并行计算能力,以及精心设计的位置编码,FLAT能够充分利用Lattice信息,并具有良好的推理速度。FLAT模型在四个公开的中文实体识别数据集Weibo, Ontonotes, MSRA, Resume上进行了验证。实验表明,FLAT 在性能和效率上均优于其他词典增强的中文实体识别模型。并且和BERT有良好的兼容性,结合BERT后,精度可以进一步提升。

这篇博文只是简单的PPT展示,如果您看了PPT对本篇论文感兴趣,想要更为细节的讲解,请点击下方“阅读原文”。

最近文章

EMNLP 2022 和 COLING 2022,投哪个会议比较好?

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

阿里+北大 | 在梯度上做简单mask竟有如此的神奇效果


下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!  后台回复【五件套】
下载二:南大模式识别PPT  后台回复【南大模式识别】

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

FLAT:又快又好的中文命名实体识别模型相关推荐

  1. 第15课:基于 CRF 的中文命名实体识别模型实现

    命名实体识别在越来越多的场景下被应用,如自动问答.知识图谱等.非结构化的文本内容有很多丰富的信息,但找到相关的知识始终是一个具有挑战性的任务,命名实体识别也不例外. 前面我们用隐马尔可夫模型(HMM) ...

  2. 复旦大学李孝男博士:结合词典的中文命名实体识别

    ⬆⬆⬆ 点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 近年来,将词典信息加入模型被证明对中文命名实体识别任务很有效.但是结合词典的方法通常会使输入变为一个动态的结构,模型需要在运行时 ...

  3. 「自然语言处理(NLP)论文解读」中文命名实体识别(Lattice-LSTM模型优化)

    来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2019-8-27 引言     今天主要和大家分享一篇关于中文命名实体识别的文章,本文分析Lattice-LS ...

  4. 【ACL2021】基于边界检测增强的中文命名实体识别

    点击下面卡片,关注我呀,每天给你送来AI技术干货! 来自:复旦DISC 作者:石霭青 引言 命名实体识别(Named Entity Recognition,NER)是自然语言处理领域的一个基础任务,是 ...

  5. 基于BERT预训练的中文命名实体识别TensorFlow实现

    BERT-BiLSMT-CRF-NER Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tun ...

  6. (转)OpenNLP进行中文命名实体识别(下:载入模型识别实体)

    上一节介绍了使用OpenNLP训练命名实体识别模型的方法,并将模型写到磁盘上形成二进制bin文件,这一节就是将模型从磁盘上载入,然后进行命名实体识别.依然是先上代码: [java] view plai ...

  7. 代码实现中文命名实体识别(包括多种模型:HMM,CRF,BiLSTM,BiLSTM+CRF)

    作者 | 忆臻 地址 | https://zhuanlan.zhihu.com/p/100969186 专栏 | 机器学习算法与自然语言处理 代码实现中文命名实体识别(包括多种模型:HMM,CRF,B ...

  8. nlp 命名实体识别 算法_中文命名实体识别算法 Lattice LSTM

    中文命名实体识别 (NER) 算法按照输入的类型,可以大致分为 Character-based (字符) 和 Word-based (单词) 两种.这两种方法都存在一些缺陷,Character-bas ...

  9. 论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法

    本文转载自公众号:机器之心. 选自arXiv 作者:Yue Zhang.Jie Yang 机器之心编译 参与:路.王淑婷 近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一 ...

  10. NLP实战-中文命名实体识别

    NLP实战-中文命名实体识别:https://zhuanlan.zhihu.com/p/61227299

最新文章

  1. python计算特征的统计值并文本输出
  2. netty冲突 play sbt_netty4 实现一个断点上传大文件功能
  3. .NET 中安全高效跨平台的模板引擎 Fluid 使用文档
  4. Azure DevOps+Docker+Asp.NET Core 实现CI/CD(一 .简介与创建自己的代理池)
  5. 7 个有用的 PyTorch 技巧
  6. Error inflating class xxx.view
  7. C语言编程日志,用C语言打印日志(Log)
  8. 年轻的程序员怎么快速成为架构师?
  9. GMAT英语语法:量词及一些单复数问题详解。附相关错句改正
  10. 各个页面样子的实现与演示
  11. python基于Flask构建Web服务,解决Flask数据请求中的跨域问题
  12. 10、持续集成流水线实践:流水线建设从Jenkins部署开始
  13. 大小写英文字母对应的ASCII值
  14. 内网ip 查 核心交换机 流量_华为交换机做端口流量统计
  15. 弹性ip是可以加入共享带宽?
  16. 计算机病毒的基本知识
  17. 国家文物局:长城修复不能简单按一个统一标准进行
  18. PMP-11.项目管理的五大过程组
  19. 电动汽车 simulink仿真模型,可进行整车动力性仿真测试(最高车速,最大爬坡,加入时间)和NEDC工况能耗测试(电耗)
  20. 中文网站和英文网站在SEO优化中会存在区别吗?

热门文章

  1. ProcExp和TaskMgr的列对比
  2. 导入别的项目到我的eclipse上出现红色感叹号问题
  3. 网页设计之字体和 CSS 调整
  4. 安装MATLAB(已经下载安装包)
  5. 华为Mate8 NFC 时好时坏,怎么解决呢?
  6. (Origin)如何复制文件到另一个项目
  7. OC 类的load方法
  8. 从零开始搭建框架SSM+Redis+Mysql(一)之摘要
  9. UOJ291 BZOJ4785 ZJOI2017树状数组
  10. python——进程、线程、协程