栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI

一只萌新,想把自己修炼成一个成熟的NLP研究人员,要经过一条怎样的路?

有个名叫Tae-Hwan Jung的韩国小伙伴,做了一份完整的思维导图,从基础概念开始,到NLP的常用方法和著名算法,知识点全面覆盖。

可以说,从0到1,你需要的都在这里了:

这份精致的资源刚刚上线,不到一天Reddit热度就超过400,获得了连篇的赞美和谢意:

“肥肠感谢。”“我需要的就是这个!”“哇,真好啊!”

所以,这套丰盛的思维导图,都包含了哪些内容?

四大版块

就算你从前什么都不知道,也可以从第一个版块开始入门:

1 概率&统计

从中间的灰色方块,发散出5个方面:

基础 (Basic) ,采样 (Sampling) 、信息理论 (Information Theory) 、模型 (Model) ,以及贝叶斯 (Baysian) 。

每个方面,都有许多知识点和方法,需要你去掌握。

毕竟,有了概率统计的基础,才能昂首挺胸进入第二个板块。

2 机器学习

这个版块,一共有7个分支:

线性回归 (Linear Regression) 、逻辑回归 (Logistic Regression) 、正则化 (Regularization) 、非概率 (Non-Probabilistic) 、聚类 (Clustering) 、降维 (Dimensionality Reduction) ,以及训练 (Training) 。

掌握了机器学习的基础知识和常用方法,再正式向NLP进发。

3 文本挖掘

文本挖掘,是用来从文本里获得高质量信息的方法。

图上有6个分支:

基本流程 (Basic Procedure) 、 (Graph) 、文档 (Document) 、词嵌入 (Word Embedding)、序列标注 (Sequential Labeling) ,以及NLP基本假设 (NLP Basic Hypothesis)。

汇集了NLP路上的各种必备工具。

4 自然语言处理

装备齐了,就该实践了。这也是最后一张图的中心思想:

虽然只有4个分支,但内容丰盛。

一是基础 (Basic) ,详细梳理了NLP常用的几类网络:循环模型、卷积模型和递归模型。

二是语言模型 (Language Model) ,包含了编码器-解码器模型,以及词表征到上下文表征 (Word Representation to Contextual Representation) 这两部分。许多著名模型,比如BERTXLNet,都是在这里得到了充分拆解,也是你需要努力学习的内容。

三是分布式表征 (Distributed Representation) ,许多常用的词嵌入方法都在这里,包括GloVeWord2Vec,它们会一个个变成你的好朋友。

四是任务 (Task) ,机器翻译、问答、阅读理解、情绪分析……你已经是合格的NLP研究人员了,有什么需求,就调教AI做些什么吧。

看完脑图,有人问了:是不是要把各种技术都实现一下?

韩国少年说:

不不,你不用把这些全实现一遍。找一些感觉有趣的,实现一波就好了。

 作者Tae-Hwan Jung,来自庆熙大学

One More Thing

Reddit楼下,许多小伙伴对这套脑图表示膜拜,并且想知道是用什么做的。

韩国少年说,Balsamiq Mockups

GitHub传送门:https://github.com/graykode/nlp-roadmap

Reddit传送门:https://www.reddit.com/r/MachineLearning/comments/d8jheo/p_natural_language_processing_roadmap_and_keyword/

大会启幕!预见智能科技新未来

量子位MEET 2020智能未来大会启幕,将携手优秀AI企业、杰出科研人员呈现一场高质量行业盛会!详情可点击图片:

榜单征集!三大奖项,锁定AI Top玩家

2019中国人工智能年度评选启幕,将评选领航企业、商业突破人物、最具创新力产品3大奖项,并于MEET 2020大会揭榜,欢迎优秀的AI公司扫码报名!

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

超强NLP思维导图,知识点全面覆盖:从基础概念到最佳模型,萌新成长必备资源...相关推荐

  1. Dubbo思维导图知识点整理

    Dubbo思维导图知识点整理 下载地址:https://download.csdn.net/download/liuhenghui5201/12846897

  2. 导数与微分的知识点思维导图_高中生物思维导图知识点总结

    今天小编给大家整理一份高中生物思维导图知识点总结 ,打印出来给孩子学习吧,需要的请点下面赞同,并评论:我要高中生物思维导图知识点总结, 点头像私信获取,希望给你的孩子有所帮助. 刚开始学生物的时候,第 ...

  3. 计算机算法设计与分析第五章思维导图知识点总结 ( 初稿 )

    复习链接 计算机算法设计与分析第一章思维导图 计算机算法设计与分析第二章思维导图&&知识点总结 计算机算法设计与分析第三章思维导图&&知识点总结 计算机算法设计与分析第 ...

  4. 实变函数第一章思维导图知识点总结

    实变函数第四章思维导图知识点总结 实变函数第三章思维导图知识点总结 实变函数第二章思维导图知识点总结

  5. 大学物理质点动力学思维导图_高三物理期末考备考,牛顿运动定律思维导图知识点总结...

    高三物理期末考备考,牛顿运动定律思维导图知识点总结 12-28 浏览量: 分享: 高三物理期末考备考,牛顿运动定律思维导图知识点总结.高中物理经典力学是高考必考的知识点, 1.牛顿第一定律:一切物体总 ...

  6. 实变函数第四章思维导图知识点总结

    实变函数第三章思维导图知识点总结 实变函数第二章思维导图知识点总结 实变函数第一章思维导图知识点总结

  7. 实变函数第三章思维导图知识点总结

    实变函数第四章思维导图知识点总结 实变函数第二章思维导图知识点总结 实变函数第一章思维导图知识点总结

  8. 实变函数第二章思维导图知识点总结

    实变函数第四章思维导图知识点总结 实变函数第三章思维导图知识点总结 实变函数第一章思维导图知识点总结

  9. 思维导图学习—LINUX相关基础思维导图(3)

    思维导图学习-LINUX相关基础思维导图(3) 目录 思维导图学习-LINUX相关基础思维导图(3) 操作系统简介 linux 学习与入门 linux基本操作 linux基本命令集 Linux内核源码 ...

最新文章

  1. Unparseable date: 2015-8-8
  2. 所有的科学知识都是不确定的
  3. STL容器之Deque-《C++标准库(第二版)》读书笔记
  4. SPI-软件开发注意事项
  5. sscom 中文显示 乱码_解决SSM框架使用过程中的中文乱码问题
  6. 《数据库SQL实战》查找所有已经分配部门的员工的last_name和first_name
  7. 安防监控产业链全景梳理
  8. Spring Boot通过@RequestParam接收前端表单传来的数据
  9. ossim系统下nagios监控机器可用性用rrd图形显示
  10. Java静态变量注入配置值,工具类使用@Value将信息注入到静态变量中
  11. Mybatis框架插件PageHelper的使用
  12. zookeeper和Kafka的关系
  13. 数据 3 分钟 | TiDB 5.0 正式发布、Graph + AI 2021 全球峰会即将召开、2020 年图灵奖公布...
  14. latex常用最要快捷键
  15. CDC相关知识点总结
  16. 笑看 等什么君 简谱
  17. jwplayer播放器初探
  18. 程序猿DD《Spring Boot基础教程》系列汇总
  19. 配置网络地址转换NAT技术实验
  20. Oracle 11g重要特性

热门文章

  1. Go实现简单的K-V存储
  2. systemd设置静态IP
  3. Python生产环境部署(fastcgi,uwsgi)
  4. 深入理解HTTP Session
  5. VS2010/VS 2013 删除空行
  6. Iptables防火墙应用
  7. 15:18 2009-7-5 小结
  8. 关于验证码整理的新版本
  9. 通信upf是什么意思_5G给边缘计算带来了什么?
  10. 网站服务器宕机,B站服务器宕机 股价短线走低冲上热搜 官方回复称因机房故障...