Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data

目录

  • Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data
      • 整体评价
    • 模型结构
      • 在有限的label data上,已有的研究成果
        • 模型方法
      • 实验部分

需要复现

整体评价

模型的工程性较强,面向实际工程中的:标注数据集少,通过弱监督方式得到弱监督数据集的情形。---------have both a small amount of strongly labeled data and a large amount of weakly labeled data

弱标记数据在训练过程中与强标记数据简单结合时,会降低模型性能

模型结构

在有限的label data上,已有的研究成果

在无标注数据集上,重新迭代训练已有的预训练模型,以使得更好的适用于新的domain。

模型方法

**(1)采用PLM在target domain 的数据集上做预训练
(2)使用domain领域的知识库生成弱监督数据集(弱监督有标注数据集),并使用(1)中的模型,在弱监督数据集和labeled data 上继续微调。**这个过程称为noise-aware-weakly supervised learning,包括两个部分: weak label completion procedure and noise-aware loss function.

  • Weak Label Completion
    the encoder θenc is initialized from Stage I and NER CRF head is randomly initialized.
    对于一个给定的弱监督的标注句子,其自身已有的label表示为Yw,利用模型补充的label为Yc,
    **定义的规则是:**当Yw是O时,采用CRF预测的label作为补充的label,其他情况下,采用弱监督的label作为其label。

  • Noise-Aware Loss Function——true label为Y,weak label为Yc
    在weak data上的损失函数计算公式为:

    在weak和labeled data上的,总的损失函数的计算公式是:

(3)将(2)预训练后的model在labeled data 重新微调。

实验部分

  • 参数搜索(grid search)
  • ablaltion study

• WLC: Weak label completion.
• NAL: Noise-aware loss function, i.e., Eq.(4).
Since NAL is built on top of WLC, the two components need to be used together.
• FT: Final fine-tuning on strongly labeled data
(Stage III).

  • 分析部分

    • size of weak data
    • Size of Strongly Labeled Data.
    • Weak Label Errors
      • Label Distribution Mismatch.
      • Entity BIO Sequence Mismatch in Weak Label
        Completion. Another error of the weakly labels is
        the mismatched entity BIO sequence in the weak
        label completion step, e.g., B-productType followed by I-color

论文:Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data相关推荐

  1. ACL21 - Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data

    Jiang H, Zhang D, Cao T, et al. Named Entity Recognition with Small Strongly Labeled and Large Weakl ...

  2. 复现:Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data

    信达雅的原则: 数据->模型->训练. Named Entity Recognition with Small Strongly Labeled and Large Weakly Labe ...

  3. 【论文笔记-NER综述】A Survey on Deep Learning for Named Entity Recognition

    本笔记理出来综述中的点,并将大体的论文都列出,方便日后调研使用查找,详细可以看论文. 神经网络的解释: The forward pass com- putes a weighted sum of th ...

  4. [论文阅读笔记14]Nested named entity recognition revisited

    一, 题目 Nested Named Entity Recognition Revisited 重访问的嵌套命名实体识别 二, 作者 Arzoo Katiyar and Claire Cardie D ...

  5. 论文阅读笔记-FGN: Fusion Glyph Network for Chinese Named Entity Recognition

    论文地址:paper:https://arxiv.org/ftp/arxiv/papers/2001/2001.05272.pdf github地址:github:https://github.com ...

  6. 论文阅读:A Survey on Deep Learning for Named Entity Recognition

    这是一篇2020年发的命名实体识别的综述性论文,从NER的语料库,定义,评估指标,到深度学习中的NER的技术都有涉及到. A Survey on Deep Learning for Named Ent ...

  7. 论文解读:Example-Based Named Entity Recognition

    论文解读:Example-Based Named Entity Recognition 核心要点: 本篇工作是比较早的给出了如何定义和实现few-shot NER任务,后续诸多论文均引用该工作: 本文 ...

  8. 论文笔记:Few-Shot Named Entity Recognition: An Empirical Baseline Study

    Few-Shot Named Entity Recognition: An Empirical Baseline Study 看法 整体感觉,这篇文章是工程实践中可以参考的,大杂烩的感觉,复现一次,应 ...

  9. [论文笔记]AAAI-2021-Continual Learning for Named Entity Recognition

    [论文笔记] 2021-AAAI-Continual Learning for Named Entity Recognition 0 写在前面 什么是持续学习? 我们人类有能够将一个任务的知识用到另一 ...

最新文章

  1. 设计聊天机器人技术栈的终极攻略
  2. JAVA WEB知识总结之一--responserequest
  3. 算法笔记(JavaScript版)——排序
  4. 修改autor后面邮箱_如何修改LOL手游昵称
  5. jpa 事务嵌套事务_JPA 2 | EntityManagers,事务及其周围的一切
  6. bzoj 1057: 棋盘制作(悬线法)
  7. iOS category解析
  8. 通达信版弘历软件指标_弘历趋势王版指标公式详解 通达信趋势弘历
  9. macd的VB计算机程序,大智慧自选股实时同步到通达信VB小软件简单升级
  10. 俞扬 新书_哇,太好了...新书
  11. win7上搭建ftp站点
  12. 长沙市取消职称英语和计算机,哪些城市已取消职称英语考试?
  13. 正确清除 DNS 缓存( 附全平台详细教程 )
  14. 论文阅读: Inertia Tensor Properties in Robot Dynamics Identification: A Linear Matrix Inequality Approac
  15. 微信企业号回调 php,PHP微信企业号回调模式的开启与用法实例分享
  16. 中国汽车市场的“底层”骗局
  17. 运行tensorflow程序,出现ImportError: cannot import name '_validate_lengths'错误的解决办法
  18. Swiperjs插件轮播滑动卡顿优化
  19. MIPS微程序CPU设计
  20. matlab实现数据压缩,【Matlab】Huffman编码如何实现数据压缩

热门文章

  1. 第二章 第二节 使用Python IDLE编写你的第一个UI自动化测试程序
  2. gitkraken7.5.5 krack
  3. 【JavaSE学习笔记】
  4. matlab 生成随机彩色条纹图
  5. 难解的AIoT焦虑,华为是否在准备一剂特效药存在?
  6. Unity 美术字图片 生成 字体Font
  7. handbrake音画同步机制
  8. java调用linux进程,Java——调用Linux和Windows下命令行执行程序
  9. SSH删除profiles保存的信息
  10. 操作系统应该怎么学习?书籍、课程都整理好了