在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 86 篇文章

本期推荐的论文笔记来自 PaperWeekly 社区用户 @handsome这篇论文是 COLING 2018 的 Most reproducible Paper。作者用 PyTorch 实现了一个统一的序列标注框架,重现了 CoNLL 2003 English NER、CoNLL 2000 Chunking 和 PTB POS tagging 这三个数据集上不同模型的的表现。值得一提的是,基于这个统一的框架,作者对一些已有工作的一些不一致的结论进行了反驳,提出了一些新的看法。对于实践者而言,这篇论文还是很有借鉴意义的。

如果你对本文工作感兴趣,点击底部阅读原文即可查看原论文。

关于作者:梁帅龙,新加坡科技设计大学博士生,研究方向为自然语言处理。

■ 论文 | Design Challenges and Misconceptions in Neural Sequence Labeling

■ 链接 | https://www.paperweekly.site/papers/2061

■ 源码 | https://github.com/jiesutd/NCRFpp

引言

这篇论文是 COLING 2018 的 Best Paper 之一 “Most Reproducible Paper”,论文基于的 PyTorch 代码框架 NCRF++ 也收录于 ACL 2018 的 Demo Paper。

作者用一个统一的序列标注框架实现了不同模型架构在 NER, Chunking, POS Tagging 数据集上的表现,并对已有工作的一些不一致的结论进行了检验,发现了新的结论。代码在 Github 上已经开源,使用文档也非常详尽,做序列标注的童鞋们又多了一把利器可以使用

任务

  • CoNLL 2003 英文的命名实体识别 (NER)

  • CoNLL 2000 Chunking

  • PTB POS Tagging

模型

字符序列表示

在词的表示方面,本文摒弃了基于传统的特征的方法,直接使用词本身的信息进行编码。除了词向量以外,为了更好地对那些不常见的词编码,文章使用 LSTM 或者 CNN 对构成词语的字符进行编码。

词序列表示

在整个句子级别,文章同样使用 LSTM / CNN 对构成句子的词语的表示进行上下文的编码。

预测层 

获取了每个词的上下文表示之后,在最后的预测层,文章使用了基于 Softmax 的和基于 CRF 的结构。和 Softmax 相比, CRF 往往更能有效地结合上下文的标签的依赖关系进行预测。

实验结果

NER的实验结果

Chunking的实验结果

POS Tagging的实验结果

从以上结果来看,字符序列的表示方面,CNN 和 LSTM 的结果差别不大;词序列的表示方面,LSTM 的结果比 CNN 的稍好一些,说明全局信息的有效性;预测层方面,POS Tagging 任务的 CRF 和 Softmax 表现相当,但是 NER、Chunking 的 CRF 的结果要比 Softmax 好一些。相比 POS 的tags,BIE 标签之间的依赖关系可能更容易被 CRF 所建模。

其他

这篇文章也检验了预训练的词向量的不同(GloVe/SENNA),标注体系的不同 (BIO/BIOES),运行环境的不同(CPU/GPU),以及优化器的不同 (SGD/Adagrad/Adadelta/RMSProp/Adam)对结果的影响。感兴趣的同学可以查看论文原文。

最后

本文代码已开源,使用非常方便,也可以加自定义的 feature,几乎不用自己写代码就可以使用了。

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!


点击标题查看更多论文解读:

  • DeepMind论文解读:让机器更深入地理解文本

  • 基于词向量的简单模型 | ACL 2018论文解读

  • 上海交大提出多模态情绪识别框架EmotionMeter

  • 综述:图像风格化算法最全盘点

  • CVPR 2018 最佳论文解读:探秘任务迁移学习

  • 深度学习模型复现难?句子对模型复现论文

AI活动推荐

 

中国人工智能大会 CCAI 2018

AI领域规格最高、规模最大

影响力最强的专业会议之一

热点话题√核心技术√科学问题√

 活动时间 

2018年7月28日-29日

中国·深圳

长按识别二维码,查看大会简介

关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 查看原论文

COLING 2018 最佳论文解读:序列标注经典模型复现相关推荐

  1. 复现计算机论文模型,COLING 2018 最佳论文解读:序列标注经典模型复现

    原标题:COLING 2018 最佳论文解读:序列标注经典模型复现 在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点 ...

  2. ECCV 2018最佳论文解读:基于解剖结构的面部表情生成

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  3. 祝贺| 蚂蚁金服年轻交互设计师陈凯翔,荣获HCII 2018 最佳论文奖

    小蚂蚁说: 科技作为21世界最重要的关键词之一,本身就是自带光环的存在,而作为人们畅想未来科技生活最为直观的方式,众多的科幻作品也一直为科技迷们所津津乐道.从经典科幻电影<她>.<人 ...

  4. ACL 2018最佳论文公布!计算语言学最前沿研究都在这里了

    国际计算语言学协会 (ACL,The Association for Computational Linguistics),是世界上影响力最大.最具活力的国际学术组织之一,其会员遍布世界各地.ACL ...

  5. 自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 | AI日报

    自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 12月8日至13日,第28届国际计算语言学会议(COLING 2020)在线上正式举行. 计算语言学国际会议COLING 2020(是计算 ...

  6. NLP经典模型复现之开宗明义

    文章目录 1. 为什么要写这个专栏 2. 专栏的主要内容 3. 阅读论文的正确姿势 1. 为什么要写这个专栏   大家好,我是herosunly,从985院校硕士毕业,现担任算法研究员一职.CSDN博 ...

  7. 从KDD 2018最佳论文看Airbnb实时搜索排序中的Embedding技巧

    作者丨王喆 单位丨Hulu高级机器学习工程师 研究方向丨计算广告.推荐系统 知乎专栏丨王喆的机器学习笔记 今天我们聊一聊 KDD 2018 的 Best Paper,Airbnb 的一篇极具工程实践价 ...

  8. ICLR 2022最佳论文解读

    微信公众号"圆圆的算法笔记",持续更新NLP.CV.搜推广干货笔记和业内前沿工作解读~ 后台回复"交流"加入"圆圆的算法笔记"交流群:回复& ...

  9. NIPS2018最佳论文解读:Neural Ordinary Differential Equations...

    雷锋网 AI 科技评论按,不久前,NeurIPS 2018 在加拿大蒙特利尔召开,在这次著名会议上获得最佳论文奖之一的论文是<Neural Ordinary Differential Equat ...

最新文章

  1. 调剂女人身材的十种食物
  2. 元素的   is_enable()、is_displayed()和is_selected()
  3. GET和POST两种基本请求方法的区别
  4. 【Kotlin】apply 内联扩展函数 ( apply 函数原型 | apply 函数示例 | Kotlin 调用 Java API )
  5. Robots at Warehouse(搜索+vector的使用)
  6. C语言数组学习 - 使用窗口版程序演示
  7. jquery.validate.unobtrusive的使用
  8. MariaDB通过命令行的方式导出指定数据库和还原指定数据库
  9. 哈夫曼树(Huffman Tree)的介绍、画法、哈夫曼树的可视化显示(Python代码实现)
  10. 2017.3.22 小z的袜子 思考记录
  11. 男人是房子,女人是车子
  12. javascript xml转json
  13. HTTP Basic Authentication
  14. 浅谈人工智能:现状、任务构与统一
  15. 单片机C语言的编译模式,手把手教你学单片机的C语言程序设计六编译预处理.pdf...
  16. FTP介绍及FlashXP的使用教程
  17. php免安装配置方法,mysql免安装版配置步骤详解
  18. 苹果将于4月20日举行产品发布会
  19. 淘宝美工教程:1小时让店铺高大上-优就业-专题视频课程
  20. 动态组件_插槽_自定义指令

热门文章

  1. python selenium webdriver入门基本操作
  2. mysql性能优化的一些建议
  3. keil_rtx特点
  4. Python基础-map/reduce/filter
  5. JAVA 1.2(原生数据类型 Primitive Data Type)
  6. OpenCV学习笔记(一) 环境配置
  7. 如何调用java的包_jsp如何调用java包
  8. canopen c++程序编写_JAVA、C、C++、Python同样是高级语言,为什么只有C和C++可以编写单片机程序?...
  9. dedecms mysql 支持_安装dedecms MySQL 支持 不支持无法使用本系统 GD 支持Off解决办法...
  10. scala maven plugin