本文对Semi-supervised sequence tagging with bidirectional language models一文做一个简短介绍,该文发表在ACL2017.

一、任务介绍

利用语言模型学习得到的RNN表示,来增强有监督的序列标注任务。

往往序列标注的数据集是有限的,在有限的数据下,模型很难学习到一个足够好的embedding来表示单词。

本文通过语言模型可以利用到大量没有标注的数据,来增强单词的语义表示。

二、模型

做法也很简单,

1)第一步用大量的未标注数据进行前向和反向语言模型的训练,预训练好两个RNN网络。

2)对于给定句子中每一个单词,例如“New”,先得到单词的embedding表示,然后经过第一层双向RNN,得到隐层表示。

这个时候该句子经过预训练好的两个RNN网络,得到New的前后RNN输出表示,与之前的网络隐层进行拼接,输入到第二层RNN网络中,进行序列标注。

比起正常的序列标注模型来,多了一个拼接预训练好语言模型的输出表示。这一块多余的东西还不用标注,岂不妙哉。

三、实验

主实验如table1所示,我们可以看出,性能从90.87提高了91.93,增加了一个多点,效果还是挺明显的。

至于语言模型的输出到底加在RNN的哪一层,作者也做了实验:

发现加在第一层RNN的输出的时候结果最好,不要问为什么,问了就是炼丹。

四、贡献

本文没有在基本的序列标注模型再继续搞一些fancy的骚结构,或者其它怼模型的操作,而是采用半监督方法创新的利用大量没有标注的数据来提高性能,很nice。

整篇文章通俗易懂,赏心悦目。

PS:如果觉得本文对你有任何帮助,希望右下角点个【在看】,谢谢。

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)备注:加入本站微信群或者qq群,请回复“加群”获取一折本站知识星球优惠券,请回复“知识星球”

喜欢文章,点个在看

【论文浅析】Semi-supervised sequence tagging with bidirectional lm相关推荐

  1. 【论文分享】End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF

    ACL2016 <通过双向 LSTM-CNNs-CRF 的端到端序列标记> 主要内容: 该文章提出了一种不需要对数据集进行任何特征工程或预处理就可以实现生成序列标记的任务的方法. 流程: ...

  2. BERT(一)--论文翻译:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

    转载请注明出处:https://blog.csdn.net/nocml/article/details/124860490 传送门: BERT(一)–论文翻译:BERT: Pre-training o ...

  3. 《论文阅读》Bidirectional LSTM-CRF Models for Sequence Tagging

    <论文阅读>Bidirectional LSTM-CRF Models for Sequence Tagging Abstract Contributions Models Realizi ...

  4. 论文阅读《Bidirectional LSTM-CRF Models for Sequence Tagging》

    论文地址:<Bidirectional LSTM-CRF Models for Sequence Tagging> 文章目录 论文阅读 研究背景 BI-LSTM-CRF 网络 训练流程 实 ...

  5. [论文笔记]Bidirectional LSTM-CRF Models for Sequence Tagging

    引言 本文是论文Bidirectional LSTM-CRF Models for Sequence Tagging的阅读笔记.这篇论文是15年发表的,比上次介绍的那篇还要早. 首次应用双向LSTM+ ...

  6. 论文学习9-Bidirectional LSTM-CRF Models for Sequence Tagging(LSTM,BILSTM,LSTM-CRF,BILSTM-CRF

    文章目录 1.Introduction 2 model 2.1 LSTM 2.2BI-LSTM BPTT 2.3 CRF 2.4 LSTM-CRF 参考文献 本篇论文介绍了LSTM网络.BI-LSTM ...

  7. Bidirectional LSTM-CRF Models for Sequence Tagging

    Bidirectional LSTM-CRF Models for Sequence Tagging 摘要     在本文中,我们提出了各种基于长短记忆(LSTM)的序列标记模型.这些模型包括LSTM ...

  8. 文献阅读 - Bidirectional LSTM-CRF Models for Sequence Tagging

    Bidirectional LSTM-CRF Models for Sequence Tagging Z. H. Huang, W. Xu, K. Yu, Bidirectional LSTM-CRF ...

  9. 论文学习20-End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF(序列标注,2016ACL

    文章目录 abstract 1.introduction 2.Architecture 2.1 CNN for Character-level Representation 2.2 BiLSTM 2. ...

最新文章

  1. Docker官方Centos镜像下安装Elasticsearch【详细步骤】
  2. 浅析网站SEO优化中导航优化的四大技巧!
  3. linux mysql数据库优化_MySQL_Linux下MySQL数据库性能调优方法,以下的环境具备一定的代表性 - phpStudy...
  4. 【CF】556D A Lot of Games
  5. 安卓勒索软件进一步扩散
  6. 对于c语言int类型和float,以及double类型表示范围的计算
  7. vscode MPE puppeteer导出pdf的数学公式显示问题
  8. linux安装mysql5.7.18_Linux 安装MySQL5.7.18
  9. python编写ftp客户端_用Python写FTP客户端程序
  10. python操作mysql_使用Python操作MySQL的一些基本方法
  11. JAVA:基础递归算法大杂烩
  12. MCU——JLINK接外部电源调试问题
  13. bochs上网镜像怎么上网_bochs win7镜像可上网版
  14. 2022广东省安全员B证第四批(项目负责人)考试题模拟考试题库及答案
  15. 给中国学生的第二封信:从优秀到卓越
  16. 阿里云被攻击封多久?
  17. 【产业互联网周报】华为面向鲲鹏计算产业启动数据基础设施战略;阿里王坚当选中国工程院院士...
  18. 拓扑学与计算机,拓扑学在物理学中的应用,揭示物质状态的最本质特征
  19. java拍照控件焦距问题,干货:监控中如何选择镜头焦距?
  20. 【滤波跟踪】基于随机有限集的多目标跟踪算法附matlab代码

热门文章

  1. 18.Mysql SQL优化
  2. 蒟蒻浅谈树链剖分之一——两个dfs操作
  3. 剖析Hadoop和Spark的Shuffle过程差异(一)
  4. 2017中国大学生程序设计竞赛-哈尔滨站(2/13)
  5. Java文件下载详解
  6. javascript 的默认对象
  7. c语言0x00如何不截断_binary 和 varbinary 用法全解
  8. 第三天学习Java的笔记(自增自减,赋值,比较,逻辑,三元)
  9. Python-OpenCV学习--电脑外接摄像头实时采集FAST角点并显示
  10. Python IDLE 如何清屏