[论文阅读笔记05]Deep Active Learning for Named Entity Recognition
一,题目
Deep Active Learning for Named Entity Recognition【NER任务的深度主动学习】
来源:ICLR 2018
原文:DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION
二,作者
Yanyao Shen,Hyokun Yun,Zachary C. Lipton,Yakov Kronrod,Animashree Anandkumar
University of Texas at Austin[得克萨斯大学奥斯汀分校,世界排名34];amazon web service
三,摘要[一句话]
主要探讨了深度学习与主动学习的NER研究,采用比较少的数据可以达到大量数据的效果。
四,主要贡献[认为最有价值的内容]
实验过程,开始时,所有算法都是从训练的1%原始数据开始,模型的参数为随机初始化;
效果:主动学习只使用24.9%的英文语料与30.1%的中文语料就可以达到了最好深层模型的99%的效果。另外12.0%与16.9%可达到了浅层模型的效果。
注:
MNLP:Maximum Normalized Log-Probability
LC: Least Confifidence
BALD:Bayesian Active Learning by Disagreement
RAND:随机
五,模型
5.1 标注策略
[BOS]:表示句子开始;
[EOS]:表于句子结束;
[PAD]:句子长度;
长度相近的句子batch打包放在一起作为bucket;
对于字符层采用的方式与这个相似。
5.2 Character-Level Encoder
采用两层CNNs框架去抽取字符级特征W_char。层间应用ReLU与dropout
5.3 Word-Level Encoder
其中,词级编码器的输入为字符特征与词嵌套级联起来构建。
输出为隐含层与输入层进行拼接。
Tag Decoder
使用LSTM作为解码器,在第一步,[GO]符号作为y1输入到LSTM中;对于第i步,输入包括三个内容,一个是i-1步的y,一个是第i步的陷含变量,一个是词的学习表达。使用softmax损失函数,对第i个y解码,并作下一步的输入。
六,主动学习策略
主动学习过程包括几轮进行:
- 在每轮的开始,主动学习算法选择出一些句子出来,并对这些句子作一预标注与评估;
- 我们收到标注之后,通过增大数据集来更新模型参数与处理下轮;
- 假设标记和每个句与长度成正比,以及句子中的每个字都需要标记,该算法不能要求人工去部分标注。
LC: Least Confifidence
LC缺点:选择比较长的句子。
MNLP:Maximum Normalized Log-Probability
对LC的一个改进。
式(2)中包括了所有词的总和。
BALD:Bayesian Active Learning by Disagreement
P是来源后验的采样,然后能过f-i来对采样样本的排序过滤。
七,数据集
数据集名:OntoNotes-5.0 English and Chinese
概况
英文训练样本: 1,088,503 words
中文训练样本: 756,063 words.
全量文本实验结果F1分数
英文:86.86
中文:75.63
八,实验结果
8.1 算法对比
主动学习只使用24.9%的英文语料与30.1%的中文语料就可以达到了最好深层模型的99%的效果。另外12.0%与16.9%可达到了浅层模型的效果。
8.2 主动学习类别选择的探索
目的是想了解主动是怎样去选择样本。
OntoNotes包含6类:broadcast conversation (bc),braod cast news (bn),magazine genre (mz), newswire(nw),telephone conversation (tc), weblogs (wb).
创建三个训练数据集:
half-data:原始训练数据的随机50%;
nw:newswire语料的数据,原数据占51.5%;
no-nw-data:除了newswire之外的数据;
结论:
- importance of good genre coverage in training data;
- detect underexplored genres;
整篇写得比较简洁与思路比较清晰的,这个思路很实用,实验思路也比较干脆利落,可惜没找它的相关代码,引用的那篇深度学习文章[Yun.2017]没有找到。
九,参考
【1】DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION,https://www.aclweb.org/anthology/W17-2630.pdf
【2】《DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION》阅读笔记, https://zhuanlan.zhihu.com/p/36534616
happyprince,https://blog.csdn.net/ld326/article/details/111995784
[论文阅读笔记05]Deep Active Learning for Named Entity Recognition相关推荐
- 【论文笔记-NER综述】A Survey on Deep Learning for Named Entity Recognition
本笔记理出来综述中的点,并将大体的论文都列出,方便日后调研使用查找,详细可以看论文. 神经网络的解释: The forward pass com- putes a weighted sum of th ...
- 论文阅读:A Survey on Deep Learning for Named Entity Recognition
这是一篇2020年发的命名实体识别的综述性论文,从NER的语料库,定义,评估指标,到深度学习中的NER的技术都有涉及到. A Survey on Deep Learning for Named Ent ...
- 论文阅读笔记——A deep tree-based model for software defect prediction
本论文相关内容 论文下载地址--Web Of Science 论文中文翻译--A deep tree-based model for software defect prediction 论文阅读笔记 ...
- 论文阅读:(2020版)A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法
A Survey on Deep Learning for Named Entity Recognition 命名实体识别中的深度学习方法 目录 A Survey on Deep Learning f ...
- 【论文精读】A Survey on Deep Learning for Named Entity Recognition
A Survey on Deep Learning for Named Entity Recognition 前言 Abstract 1. INTRODUCTION 2. BACKGROUND 2.1 ...
- [论文笔记]AAAI-2021-Continual Learning for Named Entity Recognition
[论文笔记] 2021-AAAI-Continual Learning for Named Entity Recognition 0 写在前面 什么是持续学习? 我们人类有能够将一个任务的知识用到另一 ...
- A Survey on Deep Learning for Named Entity Recognition论文笔记
前言:研究课题定为特定领域的命名实体识别,所以先阅读一篇综述,在此简单记录阅读过程. 摘要 在文章中,首先介绍现有的NER资源,包括标记的NER语料库及现成的NER工具,然后对现有的工作进行了分类:输 ...
- 【论文阅读】Parametrized Deep Q-Networks Learning: RL with Discrete-Continuous Hybrid Action Space
[论文阅读-深度强化学习打王者荣耀]Parametrized Deep Q-Networks Learning: Reinforcement Learning with Discrete-Contin ...
- 论文阅读笔记:Deep Object Co-segmentation via Spatial-Semantic Network Modulation(AAAI2020)
协同分割论文阅读:Deep Object Co-segmentation via Spatial-Semantic Network Modulation(AAAI2020) 论文原文 代码 提出 ...
最新文章
- 美团点评SQL优化工具SQLAdvisor开源
- Struts2-从值栈获取list集合数据(三种方式)
- C语言【字符串数组交叉输出】
- IoC组件Unity再续~根据类型字符串动态生产对象
- 语义分割之原图与mask的可视化
- 初级 IT 管理者,如何打通任督二脉?
- centos6.5安装sublime text 2
- 【图像配准】基于matlab GUI互相关图像配准【含Matlab源码 853期】
- mysql innodb_large_prefix_那些从MySQL5.6升级到5.7的坑--innodb_large_prefix-阿里云开发者社区...
- docker及入门使用(centos7.6)
- linux下fish配置终端,如何在Linux中安装、配置和使用Fish Shell?
- 最不可思议的职场语录
- 基于Qt开发的AES文件加解密工具
- 解决windows虚机系统时间与北京时间相差8小时
- Android音乐浮窗播放器
- 服务中读取当前用户注册表HKEY_CURRENT_USER
- Axure如何填充背景图
- 【20171103早】GreaseMonkey(油猴)安装
- python统计列表中元素个数_python中计算一个列表中连续相同的元素个数方法
- rust沙河游戏_逆水寒死不了!网易新年放大招,沙盒生存玩法的网游版rust?