继上一篇《我的机器学习入门之路(上)——传统机器学习》,这一篇博客主要记录深度学习(主要是自然语言处理)这一块内容的学习过程。以下均将自然语言处理简称NLP。

这一块内容的学习路线分为三部分:明确NLP的研究问题及传统的方法有哪些、深度学习(NLP)基础及深度学习框架的使用、NLP的深入学习。

一、明确NLP的研究问题及传统的方法有哪些

不像机器学习中研究的问题一般都是直接的分类或回归,在NLP中,有比较多样的分析,如分词、依存句法分析等。所以可以先看看一本书《python自然语言处理》。这本书可以比较快速地过一遍。

二、深度学习(NLP)基础及深度学习框架的使用

开门见山,深度学习入门资源推荐:黄海广博士主编的《DeepLearning.ai深度学习笔记》,由于版权关系,大家可以自行搜索。

原因:就如很多学习机器学习的人都人手一本西瓜书,我看很多学习深度学习的人都人手一本《深度学习》(那本花书),我也去看了那本花书,感觉不太适合我。《DeepLearning.ai深度学习笔记》这份笔记讲得非常通俗易懂,但又不失一定的深度,很适合作为深度学习的入门教材,总共七百多页,几天就能学完了,从神经网络基础,到CNN,计算机视觉中的深度学习,再到序列模型,NLP的很多问题,都有讲解,是相对全面的。

在有了深度学习的基础知识之后,就可以学习一些开源的深度学习框架的使用了,我选的是TensorFlow和PyTorch。

深度学习框架PyTorch书籍推荐:陈云的《深度学习框架PyTorch:入门与实践》,这本书写得比较接地气,也有相应的实战代码(GitHub上可下载)。所以边看这本书,边自己做做书上的项目,就能很快入门pytorch了。

深度学习框架TensorFlow书籍推荐:黄文坚的《TensorFlow实战》。

一些我收藏的资源:

1、TensorFlow相关

TensorFlow在Windows 10 64位下的安装:https://blog.csdn.net/u010099080/article/details/53418159

WIN10安装TENSORFLOW(GPU版本)详解:https://zhuanlan.zhihu.com/p/37086409

TensorFlow指定GPU进行训练:https://blog.csdn.net/u010238520/article/details/76165736

TensorFlow获取可用GPU设备:https://blog.csdn.net/weixin_35653315/article/details/71403386

TensorFlow自动求导原理:https://blog.csdn.net/qq_25094489/article/details/79390484

『深度长文』Tensorflow代码解析(一):https://zhuanlan.zhihu.com/p/25646408

2、PyTorch相关

新手如何入门pytorch?:https://www.zhihu.com/question/55720139

PyTorch中文文档:https://pytorch.apachecn.org/#/

PyTorch上搭建简单神经网络实现回归和分类的示例:https://blog.csdn.net/quincylk/article/details/86183752

PyTorch使用tensorboardX:https://zhuanlan.zhihu.com/p/35675109

PyTorch的远程可视化神器visdom:https://zhuanlan.zhihu.com/p/34692106

三、NLP的深入学习

首先推荐一个非常好的资源:斯坦福CS224n课程(在YouTube上可以找到课程视频)

还有一个对应的笔记资源:码农场网站上的CS224n课程对应的笔记:http://www.hankcs.com/nlp/cs224n-introduction-to-nlp-and-deep-learning.html

我的学习方法是:按照授课顺序,先看码农场网站上的中文笔记,理解这一次课教授的内容,然后看斯坦福CS224n的课程视频(用倍速看,会比较省时间)。

这样一整个课程下来,就可以说是入门NLP了。

下面是我收藏的一些资料链接

词向量相关:

1、word2vec

CS224n笔记2 词的向量表示:word2vec:http://www.hankcs.com/nlp/word-vector-representations-word2vec.html

word2vec原理推导与代码分析:http://www.hankcs.com/nlp/word2vec.html

word2vec模型原理与实现:https://www.cnblogs.com/Finley/p/6043769.html

word2vec源码解析:https://blog.csdn.net/google19890102/article/details/51887344

Word2vec和Doc2vec原理理解:https://blog.csdn.net/mpk_no1/article/details/72458003

2、Glove

理解GloVe模型:https://blog.csdn.net/coderTC/article/details/73864097

Glove详解:http://www.fanyeong.com/2018/02/19/glove-in-detail/

3、FastText

fastText原理及实践:https://zhuanlan.zhihu.com/p/32965521

4、Doc2vec

Doc2vec原理及实践:https://blog.csdn.net/john_xyz/article/details/79208564

5、Sentence Embedding

CS224n研究热点一:Sentence Embedding:http://www.hankcs.com/nlp/cs224n-sentence-embeddings.html

接下来是一些NLP模型的原理及相应深度学习框架函数的资料链接。

1、RNN

RNN 的梯度消失问题:https://zhuanlan.zhihu.com/p/44163528

RNN梯度消失和爆炸的原因:https://zhuanlan.zhihu.com/p/28687529

2、LSTM

人人都能看懂的LSTM:https://zhuanlan.zhihu.com/p/32085405

LSTM如何解决梯度消失问题:https://zhuanlan.zhihu.com/p/28749444

在Pytorch下搭建BiLSTM:https://www.jianshu.com/p/b9ad6b26e690

聊一聊PyTorch中LSTM的输出格式:https://zhuanlan.zhihu.com/p/39191116

3、GRU

人人都能看懂的GRU:https://zhuanlan.zhihu.com/p/32481747

4、TextCNN

TextCnn原理及实践:https://blog.csdn.net/John_xyz/article/details/79210088

基于Text-CNN模型的中文文本分类实战:https://www.imooc.com/article/40868

5、Seq2seq

玩转Keras之seq2seq自动生成标题:https://spaces.ac.cn/archives/5861/comment-page-1

TensorFlow文本摘要生成:https://www.ctolib.com/topics-113328.html

6、Attention

深度学习中的注意力模型:https://zhuanlan.zhihu.com/p/37601161

注意力机制在NLP中的应用:https://www.cnblogs.com/robert-dlut/p/5952032.html

自然语言处理中的Attention Model:是什么及为什么:https://blog.csdn.net/malefactor/article/details/50550211

BahdanauAttention与LuongAttention注意力机制简介:https://blog.csdn.net/u010960155/article/details/82853632

7、Transformer

图解Transformer:https://blog.csdn.net/qq_41664845/article/details/84969266

8、Elmo、GPT

看相应论文,然后自己搜搜讲解的博客吧,我累了,没收藏

9、Bert

谷歌BERT模型深度解析:https://blog.csdn.net/qq_39521554/article/details/83062188

为什么BERT有3个嵌入层,它们都是如何实现的:https://www.cnblogs.com/d0main/p/10447853.html

如何使用BERT实现中文的文本分类(附代码):https://blog.csdn.net/Real_Brilliant/article/details/84880528

从Word Embedding到Bert模型:https://zhuanlan.zhihu.com/p/49271699

10、ERNIE

中文任务全面超越BERT:百度正式发布NLP预训练模型ERNIE:https://zhuanlan.zhihu.com/p/59436589

11、HMM

隐马尔可夫(HMM)、前/后向算法、Viterbi算法 再次总结:https://blog.csdn.net/xueyingxue001/article/details/52396494

隐马尔可夫模型(HMM) - 1 - 基本概念:https://blog.csdn.net/xueyingxue001/article/details/51435728

隐马尔可夫模型(HMM) - 2 - 概率计算方法:https://blog.csdn.net/xueyingxue001/article/details/51435752

隐马尔科夫模型HMM(四)维特比算法解码隐藏状态序列:https://www.cnblogs.com/pinard/p/6991852.html

12、CRF

如何轻松愉快地理解条件随机场(CRF)?:https://www.jianshu.com/p/55755fc649b1

概率图模型学习笔记:HMM、MEMM、CRF:https://blog.csdn.net/Scotfield_msn/article/details/79195517

pytorch lstm crf 代碼理解:https://www.twblogs.net/a/5b7c1a1c2b71770a43d955a5

通俗理解BiLSTM-CRF命名实体识别模型中的CRF层:https://www.cnblogs.com/createMoMo/p/7529885.html

13、LDA

通俗理解LDA主题模型:https://blog.csdn.net/v_july_v/article/details/41209515

14、TF-IDF

生动理解TF-IDF算法:https://zhuanlan.zhihu.com/p/31197209

下面是其它的NLP或深度学习相关的资料的一些链接。

1、Batch Normalization

什么是批标准化 (Batch Normalization):https://zhuanlan.zhihu.com/p/24810318

Batch Normalization 学习笔记:https://blog.csdn.net/hjimce/article/details/50866313

详解深度学习中的Normalization,BN/LN/WN:https://zhuanlan.zhihu.com/p/33173246

2、TimeDistributed

keras中TimeDistributed的用法:https://blog.csdn.net/u012193416/article/details/79477220

如何在长短期记忆(LSTM)网络中利用TimeDistributed层:https://python.freelycode.com/contribution/detail/889

3、中文分词

中文分词:原理及分词算法:https://blog.csdn.net/DianaCody/article/details/40950169

自然语言处理基础-中文分词:https://ilewseu.github.io/2018/06/16/%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D/

文本挖掘的分词原理:https://www.cnblogs.com/pinard/p/6677078.html

从自然语言处理角度看 HMM 和 CRF:https://www.jianshu.com/p/59490ffe7f7c

4、文本(清洗)处理

文本清洗+文本分类:https://www.jianshu.com/p/a72b6a0cf895

通常的文本清理流程:https://www.zhihu.com/question/268849350

文本挖掘之特征选择(python 实现):https://cloud.tencent.com/developer/article/1061371

5、NLP比赛、实战

第二届搜狐内容识别算法大赛第一名分享:https://blog.csdn.net/qq_34695147/article/details/81006059

知乎看山杯夺冠记:https://zhuanlan.zhihu.com/p/28923961

文本分类实战(一)—— word2vec预训练词向量:https://www.cnblogs.com/jiangxinyang/p/10207273.html

6、NLP教程

一个不错的系列教程:https://www.jianshu.com/p/b87e01374a65

暂时先总结到这吧,内容实在有点多,很难面面俱到。

最后,NLP的这些模型都是发表在相应会议上的,有时间一定要去看看相对应的论文,这里就不一一罗列了。

我的微信公众号:帕尼尼古

欢迎关注~

我的机器学习入门之路(中)——深度学习(自然语言处理)相关推荐

  1. 我的机器学习入门之路(下)——知识图谱、推荐、广告

    继上一篇<我的机器学习入门之路(中)--深度学习(自然语言处理)>,这一篇博客主要记录了我对知识图谱.推荐和广告等方向的一些涉猎与基础学习. 一.知识图谱 从自然语言处理到知识图谱,是一个 ...

  2. 综述 | 万字长文带你入门近几年深度学习的重要研究成果

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :机器之心 [人工智能资源( ...

  3. 深度学习入门(一)——深度学习是什么?

    深度学习入门(一)--深度学习是什么? 看了标题,你心中或许已经有了疑惑.什么是深度学习?这和人工智能有什么关系吗?神经网络不是生物学知识吗?什么是全连接神经网络?如果你对本次技术分享内容足够感兴趣且 ...

  4. 五个入门深度学习自然语言处理资源

    From Richard Socher's slides 这里收集了五个入门深度学习自然语言处理资源,这些资源为你介绍了目前一些最新的技术.它也为你提供了一些下一步自然语言发展的方向. 1.Deep ...

  5. 机器学习/深度学习/自然语言处理学习路线

    原文地址:http://www.cnblogs.com/cyruszhu/p/5496913.html 未经允许,请勿用于商业用途!相关请求,请联系作者:yunruizhu@126.com转载请附上原 ...

  6. 科普贴开篇:到底什么是人工智能(AI)、机器学习(ML)和深度学习(DL

    [https://zhuanlan.zhihu.com/p/26442277] 科普贴开篇:到底什么是人工智能(AI).机器学习(ML)和深度学习(DL) 优雅的程序员 9 个月前 这两年创业圈.技术 ...

  7. 基于矢量成果从影像提取中深度学习样本库

    大数据之:影像提取中深度学习样本库获取的思考 话说,虾神一直是做空间统计和数据分析的,对于深度学习这个热门学科,一直以来也就停留在"了解"阶段,虽然这个平展开来,里面比较核心的技术 ...

  8. 哪些电脑最适合做机器学习、数据科学和深度学习呢?这里有份调研报告

    选自Medium 机器之心编译 作者:Towards AI Team 编辑:陈萍.杜伟 一份来自 Towards AI 的关于机器学习.数据科学和深度学习的最佳笔记本电脑.在预算范围内,入手最适合的笔 ...

  9. 高中计算机课主要学什么好处,高中信息技术课程中深度学习的重要性

    摘要:目前,信息技术课堂仍以讲述.复述.演示.训练为主,这完全不能满足培养时代新人的需求.因此,本文提出在高中信息技术课程中要提倡深度学习,因为深度学习能让学习更彻底,让学生体验学习的过程,感受新知的 ...

最新文章

  1. pandas模块学习笔记2--基本功能
  2. php纯面向过程--论坛
  3. PE文件数字签名信息读取存储及格式具体解释图之上(历史代码,贴出学习)
  4. PHP CRC16 校验码的算法怎么使用
  5. java String 转boolean
  6. php mysql怎么实现,使用php与mysql怎么实现一个无限级分类
  7. 15、Windows驱动开发技术详解笔记(11) 基本概念
  8. php如何用菜刀连接getshell,phpmyadmin之getshell总结
  9. HDOJ 1160 FatMouse's Speed
  10. Openresty 安装、源码编译,增加WAF模块naxsi
  11. 使用vb.net调用bartender并打印标签
  12. python 写入文件时编码问题
  13. 盘点微软出品的神级小工具:无比实用~
  14. Glide 加载圆形图片
  15. 处理txt文件下载下来以后,排版格式不对的问题
  16. 单片机应用系统设计技术——LCD滚动显示汉字
  17. 手机网页UI框架jQuery Mobile介绍之按钮篇
  18. 大三学生HTML个人网页作业作品——电影动漫言叶之庭(4页)带音乐
  19. cml sml区别_CML与SML有何联系和区别?
  20. 什么是语音通知 / 语音短信 / 语音外呼?

热门文章

  1. sihpostreboot 权限_记一次使用post请求重启TP-LINK TL-WDR7661路由
  2. javascript 权威指南第7版_免费领书 | 气相色谱与质谱实用指南(原著第2版)
  3. php 锁的使用场景,抢购秒杀的场景使用锁个人认为不太合理?
  4. Domain Model
  5. BZOJ 1685 [Usaco2005 Oct]Allowance 津贴:贪心【给硬币问题】
  6. P3390矩阵快速幂
  7. 关于如何判断程序和类库是Debug 还是 Release 的问题
  8. MSM8974 fastboot烧写软件
  9. kafka Windows安装
  10. C#发现之旅第九讲 ASP.NET验证码技术