一,题目

Deep Active Learning for Named Entity Recognition【NER任务的深度主动学习】
来源:ICLR 2018
原文:DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION

二,作者

Yanyao Shen,Hyokun Yun,Zachary C. Lipton,Yakov Kronrod,Animashree Anandkumar
University of Texas at Austin[得克萨斯大学奥斯汀分校,世界排名34];amazon web service

三,摘要[一句话]

主要探讨了深度学习与主动学习的NER研究,采用比较少的数据可以达到大量数据的效果。

四,主要贡献[认为最有价值的内容]

实验过程,开始时,所有算法都是从训练的1%原始数据开始,模型的参数为随机初始化;

效果:主动学习只使用24.9%的英文语料与30.1%的中文语料就可以达到了最好深层模型的99%的效果。另外12.0%与16.9%可达到了浅层模型的效果。
注:
MNLP:Maximum Normalized Log-Probability
LC: Least Confifidence
BALD:Bayesian Active Learning by Disagreement
RAND:随机

五,模型

5.1 标注策略

[BOS]:表示句子开始;
[EOS]:表于句子结束;
[PAD]:句子长度;
长度相近的句子batch打包放在一起作为bucket;
对于字符层采用的方式与这个相似。

5.2 Character-Level Encoder

采用两层CNNs框架去抽取字符级特征W_char。层间应用ReLU与dropout

5.3 Word-Level Encoder

其中,词级编码器的输入为字符特征与词嵌套级联起来构建。

输出为隐含层与输入层进行拼接。

Tag Decoder

使用LSTM作为解码器,在第一步,[GO]符号作为y1输入到LSTM中;对于第i步,输入包括三个内容,一个是i-1步的y,一个是第i步的陷含变量,一个是词的学习表达。使用softmax损失函数,对第i个y解码,并作下一步的输入。
六,主动学习策略
主动学习过程包括几轮进行:

  1. 在每轮的开始,主动学习算法选择出一些句子出来,并对这些句子作一预标注与评估;
  2. 我们收到标注之后,通过增大数据集来更新模型参数与处理下轮;
  3. 假设标记和每个句与长度成正比,以及句子中的每个字都需要标记,该算法不能要求人工去部分标注。
    LC: Least Confifidence

LC缺点:选择比较长的句子。
MNLP:Maximum Normalized Log-Probability
对LC的一个改进。

式(2)中包括了所有词的总和。
BALD:Bayesian Active Learning by Disagreement

P是来源后验的采样,然后能过f-i来对采样样本的排序过滤。

七,数据集

数据集名:OntoNotes-5.0 English and Chinese
概况
英文训练样本: 1,088,503 words
中文训练样本: 756,063 words.
全量文本实验结果F1分数
英文:86.86
中文:75.63

八,实验结果

8.1 算法对比
主动学习只使用24.9%的英文语料与30.1%的中文语料就可以达到了最好深层模型的99%的效果。另外12.0%与16.9%可达到了浅层模型的效果。
8.2 主动学习类别选择的探索
目的是想了解主动是怎样去选择样本。
OntoNotes包含6类:broadcast conversation (bc),braod cast news (bn),magazine genre (mz), newswire(nw),telephone conversation (tc), weblogs (wb).
创建三个训练数据集:
half-data:原始训练数据的随机50%;
nw:newswire语料的数据,原数据占51.5%;
no-nw-data:除了newswire之外的数据;

结论:

  1. importance of good genre coverage in training data;
  2. detect underexplored genres;
    整篇写得比较简洁与思路比较清晰的,这个思路很实用,实验思路也比较干脆利落,可惜没找它的相关代码,引用的那篇深度学习文章[Yun.2017]没有找到。

九,参考

【1】DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION,https://www.aclweb.org/anthology/W17-2630.pdf
【2】《DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION》阅读笔记, https://zhuanlan.zhihu.com/p/36534616

happyprince,https://blog.csdn.net/ld326/article/details/111995784

[论文阅读笔记05]Deep Active Learning for Named Entity Recognition相关推荐

  1. 【论文笔记-NER综述】A Survey on Deep Learning for Named Entity Recognition

    本笔记理出来综述中的点,并将大体的论文都列出,方便日后调研使用查找,详细可以看论文. 神经网络的解释: The forward pass com- putes a weighted sum of th ...

  2. 论文阅读:A Survey on Deep Learning for Named Entity Recognition

    这是一篇2020年发的命名实体识别的综述性论文,从NER的语料库,定义,评估指标,到深度学习中的NER的技术都有涉及到. A Survey on Deep Learning for Named Ent ...

  3. 论文阅读笔记——A deep tree-based model for software defect prediction

    本论文相关内容 论文下载地址--Web Of Science 论文中文翻译--A deep tree-based model for software defect prediction 论文阅读笔记 ...

  4. 论文阅读:(2020版)A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法

    A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法 目录 A Survey on Deep Learning f ...

  5. 【论文精读】A Survey on Deep Learning for Named Entity Recognition

    A Survey on Deep Learning for Named Entity Recognition 前言 Abstract 1. INTRODUCTION 2. BACKGROUND 2.1 ...

  6. [论文笔记]AAAI-2021-Continual Learning for Named Entity Recognition

    [论文笔记] 2021-AAAI-Continual Learning for Named Entity Recognition 0 写在前面 什么是持续学习? 我们人类有能够将一个任务的知识用到另一 ...

  7. A Survey on Deep Learning for Named Entity Recognition论文笔记

    前言:研究课题定为特定领域的命名实体识别,所以先阅读一篇综述,在此简单记录阅读过程. 摘要 在文章中,首先介绍现有的NER资源,包括标记的NER语料库及现成的NER工具,然后对现有的工作进行了分类:输 ...

  8. 【论文阅读】Parametrized Deep Q-Networks Learning: RL with Discrete-Continuous Hybrid Action Space

    [论文阅读-深度强化学习打王者荣耀]Parametrized Deep Q-Networks Learning: Reinforcement Learning with Discrete-Contin ...

  9. 论文阅读笔记:Deep Object Co-segmentation via Spatial-Semantic Network Modulation(AAAI2020)

    协同分割论文阅读:Deep Object Co-segmentation via Spatial-Semantic Network Modulation(AAAI2020) 论文原文    代码 提出 ...

最新文章

  1. 美团点评SQL优化工具SQLAdvisor开源
  2. Struts2-从值栈获取list集合数据(三种方式)
  3. C语言【字符串数组交叉输出】
  4. IoC组件Unity再续~根据类型字符串动态生产对象
  5. 语义分割之原图与mask的可视化
  6. 初级 IT 管理者,如何打通任督二脉?
  7. centos6.5安装sublime text 2
  8. 【图像配准】基于matlab GUI互相关图像配准【含Matlab源码 853期】
  9. mysql innodb_large_prefix_那些从MySQL5.6升级到5.7的坑--innodb_large_prefix-阿里云开发者社区...
  10. docker及入门使用(centos7.6)
  11. linux下fish配置终端,如何在Linux中安装、配置和使用Fish Shell?
  12. 最不可思议的职场语录
  13. 基于Qt开发的AES文件加解密工具
  14. 解决windows虚机系统时间与北京时间相差8小时
  15. Android音乐浮窗播放器
  16. 服务中读取当前用户注册表HKEY_CURRENT_USER
  17. Axure如何填充背景图
  18. 【20171103早】GreaseMonkey(油猴)安装
  19. python统计列表中元素个数_python中计算一个列表中连续相同的元素个数方法
  20. rust沙河游戏_逆水寒死不了!网易新年放大招,沙盒生存玩法的网游版rust?

热门文章

  1. 改变不了的历史,冲不破的效应
  2. YQMA.net(你问我答---做最纯的技术问答社区)上线啦!!!
  3. 2021中级维修电工证考试题库2021职业技能鉴定
  4. MYSQL查询今天昨天本周本月等的数据
  5. 进销存设计与分析_销售退货单(6)
  6. nacos启动遇到的错误
  7. java 回头是岸总结入门篇(二)meavn
  8. 结构化方法与面向对象方法
  9. 虚幻引擎图文笔记:项目升级到虚幻5(UE5.0.1)以后出现奇怪阴影问题的解决办法
  10. 解决GitHub网络波动严重