点击上方,选择星标置顶,每天给你送干货

阅读大概需要14分钟

跟随小博主,每天进步一丢丢

zenRRan整理

知乎问题:

NLP领域,你推荐哪些综述性的文章?

https://www.zhihu.com/question/355125622

纯属学术分享,若侵权则马上删除!

优秀回答者:Y.Shu

1. 《Neural Reading Comprehension And Beyond》

Danqi Chen 的斯坦福博士论文,前段时间很火。其中提出的关于 MRC 的开放问题洞察得非常深,是一些现有研究几乎没有触及到的问题。

2.《Tackling Graphical NLP problems with Graph Recurrent Networks》图神经网络在图相关 NLP 问题中的应用

这同样是一篇博士论文,GNN 与图数据最近也很有热度。

3.《Core techniques of question answering systems over knowledge bases: a survey》知识库问答的关键技术

这篇文章稍微比较老了,而且算是前深度学习时代的综述,不过能理解该领域的一些基本问题,例如可以看到 lexical gap 这样的基本问题在深度学习之前的解决方法;KBQA 进入深度学习的阶段之后,也分为端到端模型和使用 DL 对传统方法做改进的模型,传统方法并不能完全抛弃。

4.《Introduction to Neural Network based Approaches for Question Answering over Knowledge Graphs》知识图谱问答系统的神经网络方法介绍

今年的一篇 KGQA 的综述,个人感觉 KGQA/KBQA 的研究热度总体上还是不如 MRC,相关综述比较少,因而也值得关注。

5.《Speech and Language Processing (3rd ed. draft)》自然语言处理综论

比起说是综述,更像一本不断更新的 NLP 教材,免费公布在互联网上,内容比较新,框架比较大,虽然写得很厚了,细节上肯定还是不足,按其参考文献应当能对一个子领域了解得比较多。

6.《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》Google 在 2019 年 10 月发布的迁移学习在自然语言处理中的综述。

T5 是该文对现有迁移学习在 NLP 中的应用进行深入洞察和反复试验后,所提出的模型。读该文的前面一部分能对迁移学习在 NLP 中的最新应用有非常清晰的认识,文章的大部分描述了 T5 模型的实验过程,实验细节非常复杂,数据集和参数数量规模之大令人叹为观止,不过其对 Transformer 的进一步改进能给研究者一些启示。

7.《Semantic search on text and knowledge bases》文本与知识库语义搜索

2016 年的综述,主要包括语义搜索的基本任务:词性标注、命名实体识别等;关键字搜索、结构化搜索、问答系统等方面的语义搜索方法。

8.《Neural Machine Reading Comprehension: Methods and Trends》神经网络方法的机器阅读理解:方法与趋势

arXiv 上比较新的文章,重点是近年来的神经网络方法,其中阐述了 MRC 系统的一般结构。

优秀回答者:debuluoyi

比较成熟的 子领域就不说了,这里主要介绍NLP领域内几个尚需继续更好地解决的子领域和一些较新较好的综述文.

1.零样本学习

这个其实不管是CV还是NLP领域其实都在研究,也都待进一步解决。强烈推荐 2019年来自新加坡南洋理工大学的综述长文:

Wei Wang, Vincent W. Zheng, Han Yu, and Chunyan Miao.(2019). A Survey of Zero-Shot Learning: Settings, Methods, and Applications. ACM Trans. Intell. Syst. Technol.10, 2, Article 13 (January 2019), 37 pages.

本人自己也写过一篇零样本的综述文章,可以参考下。(一种解决范式):

https://zhuanlan.zhihu.com/p/82397000

2 小样本学习

推荐 来自港科大和第四范式的Few-shot learning综述长文:Generalizing from a Few Examples: A Survey on Few-Shot Learning

https://arxiv.org/abs/1904.05046

3.迁移学习

推荐 迁移学习领域最具代表性的综述是A survey on transfer learning,杨强老师署名的论文,虽然比较早,发表于2009-2010年,对迁移学习进行了比较权威的定义。

Pan, S. J., & Yang, Q. (2009). A survey on transfer learning. IEEE Transactions on knowledge and data engineering, 22(10), 1345-1359.

另外还有一些比较新的综述Latest survey,在这里随手介绍几篇:

[1] 2019 一篇新survey:Transfer Adaptation Learning: A Decade Survey

Zhang, L. (2019). Transfer Adaptation Learning: A Decade Survey. arXiv preprint arXiv:1903.04687.

[2] 2018 一篇迁移度量学习的综述: Transfer Metric Learning: Algorithms, Applications and Outlooks

Luo, Y., Wen, Y., Duan, L., & Tao, D. (2018). Transfer metric learning: Algorithms, applications and outlooks. arXiv preprint arXiv:1810.03944.

另外这个领域 戴老板的论文也是非常有必要读的(非综述,个人强推)

[3] 戴文渊. (2009). 基于实例和特征的迁移学习算法研究 (Doctoral dissertation, 上海: 上海交通大学).

4.弱监督学习

这个比较推荐 南京大学周志华老师 的综述论文

Zhou, Z. H. (2017). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44-53.

5.预训练模型

2019 google的T5模型论文,把它当成综述来看就介绍的挺好:

Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., ... & Liu, P. J. (2019). Exploring the limits of transfer learning with a unified text-to-text transformer. arXiv preprint arXiv:1910.10683.

bert后还有一些改进模型比如华为刘群/百度的ERNIE,XLNet等相关非综述文章,可以自行阅读。

6 其他方向

还有一些比较新的不同方向的综述文:

[1] 注意力机制:Hu, D. (2019, September). An introductory survey on attention mechanisms in nlp problems. In Proceedings of SAI Intelligent Systems Conference (pp. 432-448). Springer, Cham.

[2] Elvis Saravia and Soujanya:PoriaElvis Saravia and Soujanya Poria:NLP方方面面都有涉及,颇有一些横贯全局的意思。

网址:

https://nlpoverview.com/index.html

这里只是分不同研究方向列举了一些,其余相关论文可以参考本文文章:

https://zhuanlan.zhihu.com/p/91408237

优秀回答者:paiisall

跨语言Embedding综述,19年作者也在arxiv上进行了版本更新(以及ACL19的tutorial)。

  • A Survey Of Cross-lingual Word Embedding Models

  • Unsupervised Cross-Lingual Representation Learning

GNN

  • Graph Neural Networks: A Review of Methods and Applications

Seq2Seq摘要综述。

  • Neural Abstractive Text Summarization with Sequence-to-Sequence Models

Domain Adaption

  • A Survey of Domain Adaptation for Neural Machine Translation

IJCAI19 survey track

  • https://www.ijcai19.org/accepted-papers.html

优秀回答者:小川Ryan

  • 预训练模型

基于神经网络的词和文档语义向量表示方法研究

这是中科院一位师兄的博士论文,全面而不失深度

  • 命名实体识别

A Survey on Recent Advances in Named Entity Recognition from Deep Learning models

  • 注意力机制

An Attentive Survey of Attention Models

今年4月份出的attention综述,相当全面

  • 图神经网络

https://github.com/thunlp/GNNPapers?tdsourcetag=s_pctim_aiomsg

清华nlp组推荐的一些GNN必读论文

上述都是非常精彩的综述类文章,也正好符合初学者的学习顺序

优秀回答者:tianchi7

  • Knowledge Embedding

    • 刘知远, 孙茂松, 林衍凯, et al. 知识表示学习研究进展[J]. 计算机研究与发展, 2016, 53(2):247-261.

    • Wang Q , Mao Z , Wang B , et al. Knowledge Graph Embedding: A Survey of Approaches and Applications. IEEE Transactions on Knowledge and Data Engineering, 2017, PP(99):1-1.

  • Name Entity Recognition

    • Li J , Sun A , Han J , et al. A Survey on Deep Learning for Named Entity Recognition[J]. 2018.

    • Vikas Yadav,Steven Bethard. A Survey on Recent Advances in Named Entity Recognition from Deep Learning models. COLING 2018

    • Jie Yang,Shuailong Liang,Yue Zhang. Design Challenges and Misconceptions in Neural Sequence Labeling. COLING 2018

  • Sentiment Analysis

    • 赵妍妍,秦兵,刘挺. 文本情感分析 软件学报 2010.

    • Lei Zhang,Shuai Wang,Bing Liu. Deep Learning for Sentiment Analysis: A Survey.

  • Text Match

    • 庞亮,兰艳艳等. 深度文本匹配综述 计算机学报 2017.

    • Wuwei Lan,Wei Xu. Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering COLING 2018

  • Others

    • Sebastian Ruder.An Overview of Multi-Task Learning in Deep Neural Networks

    • Sebastian Ruder.Neural Transfer Learning for Natural Language Processing. PhD thesis. National University of Ireland, Galway.


方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读:

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency  Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的?

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作


让更多的人知道你“在看”

NLP领域,哪些综述性的文章值得推荐?相关推荐

  1. 2019年,计算机视觉领域,你推荐哪些综述性的文章?

    来源:https://www.zhihu.com/question/355566860 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 作者:Amusi https://www.zhihu.co ...

  2. 如何查找和阅读综述性的文章

    转自http://blog.sina.com.cn/s/blog_4ded56360100wlwo.html 查找 综述类文献 的方法有三种: 第一种:直接用内容关键字+"overview. ...

  3. 三大C2C购物网站淘宝拍拍有啊之横向评测【转载,好文章值得推荐】

    随着互联网的高速发展以及支付手段.安全保障等的不断完善,网络购物已经广泛进入了大众生活. 相比几年前,网络购物已不再是劣质.欺骗的聚集地,而成为众多网友方便.实惠的淘货场所.因此,越来越多的人认可网上 ...

  4. 干货|4条实用小建议,送给初入NLP领域的你(附链接)

    来源:知乎 作者:李纪为 本文约5000字,建议阅读10分钟. 本文为你介绍了刚迈进NLP领域需要掌握的一些小技巧. ACL2019投稿刚刚落幕,投稿数超过了2800篇,可以说是历史以来最盛大的一届A ...

  5. 经验 | 初入NLP领域的一些小建议

    作者:香侬科技 李纪为 斯坦福大学计算机博士 链接:https://zhuanlan.zhihu.com/p/59184256 导读 ACL2019投稿刚刚落幕,投稿数超过了2800篇,可以说是历史以 ...

  6. 4条实用小建议,送给初入NLP领域的你

    来源:知乎 作者:李纪为 本文约5000字,建议阅读10分钟. 本文为你介绍了刚迈进NLP领域需要掌握的一些小技巧. ACL2021投稿刚刚落幕,投稿数超过了2800篇,可以说是历史以来最盛大的一届A ...

  7. 李纪为:初入NLP领域的一些小建议

    刚开始做算法的朋友会有遇到很多误区,比如沉迷新的模型,忽视基础等等.我强烈建议大家沉下心来读一下香侬科技李纪为博士的这个文章,对你会很有帮助.以下是原文. ACL2019投稿刚刚落幕,投稿数超过了28 ...

  8. NLP领域的最新研究进展

    2022年,在NLP领域,哪些技术场景最值得关注?为了回答这个问题,在本次 DataFun 举办的自然语言处理峰会上,我们邀请了NLP领域的领衔专家和学者,共同精选了大模型预训练.自然语言生成.多模态 ...

  9. 【转】初入NLP领域的一些小建议

    初入NLP领域的一些小建议 李纪为 ACL2019投稿刚刚落幕,投稿数超过了2800篇,可以说是历史以来最盛大的一届ACL.在深度学习的推动下,自然语言处理这个子领域也逐渐被推上人工智能大舞台的最前列 ...

  10. 初入NLP领域的一些小建议 1

    雷锋网(公众号:雷锋网) AI 科技评论按,本文作者是香侬科技的李纪为,原载于知乎,雷锋网获得授权转载. ACL2019 投稿刚刚落幕,投稿数超过了 2800 篇,可以说是历史以来最盛大的一届 ACL ...

最新文章

  1. jQuery获取带点的id元素
  2. 安装java打开.jar文件
  3. Windows Server 2003 备份和恢复的最佳做法
  4. 10、MySQL存储引擎有哪些?
  5. 类及其组成所使用的常见修饰符
  6. 美团下一代服务治理系统 OCTO 2.0 的探索与实践
  7. Pyqt5:使用多线程QThread
  8. 1064. 朋友数(20)-PAT乙级真题 Java
  9. 字符串标志“ u”和“ r”到底是做什么的,什么是原始字符串文字?
  10. python是干什么用的-python是做什么用的 python有什么用 - 驱动管家
  11. 如何在Docker上构建Node.js应用程序
  12. GStreamer1.0中no element “ffmpegcolorspace”报错解决(八)
  13. 训练深度神经网络时验证损失可能低于训练损失的三个原因:
  14. Word——如何统计除去标点符号的字数
  15. 新一代奔驰C级车型内饰大改动,预计2021年才会亮相?
  16. Matplotlib:科研绘图利器(写论文、数据可视化必备)
  17. 硬盘的修复(三)恢复删除文件
  18. PeopleSoft介绍
  19. 智能车入门——跑车前的零碎知识<新手从零做车>
  20. java 生成图片验证码结合struts2使用

热门文章

  1. Java经典编程题50道之四十二
  2. imx6 android power off
  3. 【MVC4升级到MVC5】ASP.Net MVC 4项目升级MVC 5的方法
  4. 移植SlidingMenu Android library,和安装example出现的问题解决
  5. python运算符及优先级顺序
  6. python3模拟扑克牌
  7. ActiveMQ Windows部署
  8. 【C#】开发可以可视化操作的windows服务
  9. oracle中between and闭合性
  10. (HoneyView)轻便好用的免费图片浏览器