论文地址: https://arxiv.org/pdf/1910.11476.pdf

github:ShannonAI/mrc-for-flat-nested-ner: Code for ACL 2020 paper `A Unified MRC Framework for Named Entity Recognition` (github.com)

总结:将ner任务看成mrc(machine reading comprehension)任务 解决实体嵌套问题

如 北京大学不仅是一个组织 同时北京是一个地点 而看成mrc任务的好处在于引入了query这个先验知识 比如对于LOC类别 我们构造这样的query 找出国家 城市等抽象或具体的地点 模型通过attention机制 对于query中的国家 城市词汇学习到了地点的关注信息然后反馈到passage中的实体信息捕捉中 提取具有不同类别重叠的两个实体需要回答两个独立的问题 和最近打的比赛思路类似 ner和qa有时候就是可以解决同一类型问题的

论文细节写的很详细 大概从三个点来讲的

  1. 构造query ner向qa转化的关键就在这 假设目前我们要预测的实体类别个数为m 则我们需要构造m个不同的query 每个样本相当于扩充了m倍 得到m个新的样本 关于如何构造query 这个就需要人工来设计了 对于通用的location person organization类别 可以使用一些简单的query 就像ORG就可以设计为 找出公司 商业机构 社会组织等组织机构
  2. 构造训练数据 用BERT来做阅读理解任务首先需要构造相应格式的训练数据 目前假设我们对每个原始样本 构造了m个query 接下来就是将每个query和样本passage进行拼接 得到m个不同的bert输入数据 如下所示:

[[cls] 找出某某地点[sep]passage中包含地点的一句话[sep]]

经过构造后的一条数据样本是预测一个类别的实体的位置信息

另外 在构造数据的时候有很多细节需要注意:

序列长度问题 由于bert最长只能接收512长度的序列 因此很多情况下都需要截断

对序列进行mask 由于我们搜索实体的范围仅局限与上下文passage 不包括query 但是bert处理的是query+passage整体序列 在最后计算loss的时候 我们需要将query部分(以及cls,sep、pad等特殊字符)mask掉 使其在计算loss时被忽略

  1. 损失函数

分别预测实体的开始位置、结束位置以及从开始到结束位置是实体的概率 损失函数分为三个部分 L-start L-end L-span

  1. start:每一个token的二分类CE之和(答案开始)

L-end:每一个token的二分类CE之和(答案结束)一样

L-span:答案开始和答案结束组合的二分类CE之和 span loss通过一个二维矩阵来记录真实实体在句子中的(Start,End)位置 比如某个实体在文本中的位置是1~3 那么它在二维矩阵的坐标(1,3)则标注为1 然后分别用三个超参控制三个不同loss的比例

然后解释了如何解决实体嵌套的问题

主要就是构造问题的时候用的annotation guideline notes来作为参考进行构造答案 guideline为tag定义类别可以归纳类别和准确为人类标注提供注释防止歧义 然后又说了一下为什么选guideline当然最后是guideline最好

模型:就是bert作为baseline

A Unified MRC Framework for Named Entity Recognition阅读笔记相关推荐

  1. NER项目--github--A Unified MRC Framework for Named Entity Recognition

    A Unified MRC Framework for Named Entity Recognition项目代码 简述 项目结构 models model_config.py classifier.p ...

  2. MRC Framework for Named Entity Recognition【代码解读】

    一.预备知识 介绍文章 A Unified MRC Framework for Named Entity Recognition[文章学习]:https://blog.csdn.net/qq_1694 ...

  3. A Survey on Deep Learning for Named Entity Recognition论文笔记

    前言:研究课题定为特定领域的命名实体识别,所以先阅读一篇综述,在此简单记录阅读过程. 摘要 在文章中,首先介绍现有的NER资源,包括标记的NER语料库及现成的NER工具,然后对现有的工作进行了分类:输 ...

  4. 【论文笔记-NER综述】A Survey on Deep Learning for Named Entity Recognition

    本笔记理出来综述中的点,并将大体的论文都列出,方便日后调研使用查找,详细可以看论文. 神经网络的解释: The forward pass com- putes a weighted sum of th ...

  5. 论文解读:Example-Based Named Entity Recognition

    论文解读:Example-Based Named Entity Recognition 核心要点: 本篇工作是比较早的给出了如何定义和实现few-shot NER任务,后续诸多论文均引用该工作: 本文 ...

  6. 论文阅读:(2020版)A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法

    A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法 目录 A Survey on Deep Learning f ...

  7. [论文阅读笔记44]Named Entity Recognition without Labelled Data:A Weak Supervision Approach

    一,题目 Named Entity Recognition without Labelled Data:A Weak Supervision Approach 无标记数据的命名实体识别: 一种弱监督方 ...

  8. Named Entity Recognition without Labelled Data:A Weak Supervision Approach论文详读

    Named Entity Recognition without Labelled Data: A Weak Supervision Approach 无标记数据的命名实体识别:一种弱监督方法 创新点 ...

  9. 论文阅读:A Survey on Deep Learning for Named Entity Recognition

    这是一篇2020年发的命名实体识别的综述性论文,从NER的语料库,定义,评估指标,到深度学习中的NER的技术都有涉及到. A Survey on Deep Learning for Named Ent ...

最新文章

  1. Linux--档案/目录 权限及修改
  2. 寒武纪开盘暴涨350%,市值突破1000亿,85后创始人身家超300亿!千亿盛宴背后隐忧不可忽视!...
  3. 怎么解决64位Access与32位不能同时安装的问题
  4. IOS开发笔记之十七——一个关于工程目录读写权限的问题
  5. springboot介绍_Spring Boot 主类及目录结构介绍!
  6. CLR via C# 阅读 笔记
  7. ios开发问题汇总(一)
  8. LeetCode 1186. 删除一次得到子数组最大和(DP)
  9. UCGUI信息处理机制
  10. 炒伦敦金哪个平台正规?2021香港排名前10伦敦金交易平台一览
  11. 20181216——自定义全局指令
  12. 传智播客学习日记Day9
  13. 很全的电脑专业术语中英文对照
  14. ATeam社区(牛客网项目第七章)
  15. “源”来是你-Vol.37 | 知名开源企业StreamNative 招募开源社区运营和开源布道师!...
  16. debian 更换源 使用国内源 配置方法
  17. 修改PyCharm的背景颜色
  18. 用C语言自动将小写字母转换为大写字母
  19. 移植一个抖音贴纸组件到Flutter
  20. 私服服务器原理,传奇私服新手gm如何假设一个属于自己的服务器

热门文章

  1. 【One Day菜鸟到大鸟】MyBatis搭建环境
  2. 新功能:阿里云风险识别 - 用户行为分析上线!...
  3. jax rs mysql_JAX-RS示例(Jersey)
  4. [建站日记]3day 回到命令行界面
  5. 11g sqlplus报错ORA-28002: the password will expire within 3 days 的解决方法
  6. Lesson_7 作业_1 Driver 和 Car
  7. 被裁第26天,已经面了32家公司,基本都是一轮游!29岁一事无成,真该好好反思一下!...
  8. 学习 Redis - 3. 进阶
  9. MP3-TF-16P语音播放模块——C51串口控制程序
  10. TCPView V3.0 绿色汉化版_查看端口和线程