欢迎直接到我的博客查看最近文章:www.pkudodo.com。更新会比较快,评论回复我也能比较快看见,排版也会更好一点。

原始blog链接:  http://www.pkudodo.com/2019/03/20/1-10/

每天来博客的人不太多,但稀稀拉拉也有一些固定的人群。自从上次发表了那篇面试的博客以后,陆陆续续就有一些同学来问我机器学习及NLP的学习路线,emm....因为有些问题有一些重复性,所以还是打算写一篇博客,把我的学习规划写出来。但是每个人都是独一无二的,我的计划可能对你有用,对他没有,也可能对别人有用,对你没用。需要自己去斟酌一下。

然后本文写的东西都是适合以后专门吃这碗饭的技术人员,不太合适其他方向需要使用机器学习技术的同学,比如说生物学的同学如果在数据分析上需要去学一些机器学习的方法来分析,就不太适合我这种学习方式了,没有必要去学那么深。

机器学习部分:

1.关于书籍

很多同学看的第一本这方向的书籍可能是西瓜书,包括我也是。但是这本书还是不建议大家看,它详细介绍了机器学习的各个方方面面,也就注定了每个方向都讲不深,有点泛泛而谈。还是强烈推荐李航的《统计学习方法》,书中有十来个算法,已经涵盖了机器学习的各方面了。

另外还有一本《机器学习实战》,封面印象里是一个农夫拿着锄头的,这本书只讲代码,理论讲得很浅。

一本理论,一本实践,两本书配合刚刚好。

2.关于视频

吴恩达的CS229比较强推,这个视频配合《统计学习方法》非常舒适。

其他视频像台湾有一个机器学习基石什么的课,评价也挺好,我舍友看的这个,他的意思是讲得比吴恩达好。但是如果让我推荐,我还是推荐大家看吴恩达的。

另外在B站上白板推公式系列,讲得也很好,我当时是挑着看的,看完手上的东西还是理解不了,可以看看这个视频。

3.关于学习方式

先看吴恩达的cs229,在最初阶段方面入门,同时一定要记笔记。期间《统计学习方法》等书可以不用看,先把视频看完,笔记记完。如果在视频中有看不懂的地方,可以找一些博客看一看。看视频阶段最好在10到20天搞定,最晚一个月也要看完了。

看完以后开始看《统计学习方法》,一个一个模型看下去,每次看之前可以先过一遍吴恩达视频记的笔记,重新捡起来吴恩达的思路。这本书比较难啃,但是一定啃下去。很多时候主要问题在不知道这个公式是怎么从上个公式推过来的,多思考,实在想不出来的,网上找博客(比如说我的博客,羞涩)。一定一定要跟着书把所有的公式推出来。

《统计学习方法》一个模型看完以后,好好再回过头来看他给每个部分起的小标题,再分析为什么书中这些小部分是顺序是这样的。你会慢慢理解推导一个算法的思路,这个很重要。

至于一个模型怎么算初步学到位了,我认为你学完以后,可以假装边上有个啥也不懂的学弟学妹,自己一点一点给他们讲,给他们推导。如果整个过程都能讲清楚,说明初步掌握了,这时候已经打败了大部分人了。(最好是可以写博客)

在全书都看完以后,给模型写算法,可以看《机器学习实战》上的代码来知道机器学习算法应该是怎么写的,numpy是怎么用的,但是一定不要照着书本写代码。对每个模型的公式充分理解,在纸张写下来大概思路,确定以后就开始写。(其实我觉得我的模型实现代码比这本书写得好一点....羞)

如果上面的部分都照着做完了,我觉得你已经比大部分人优秀了。

之后在出去找工作前,重新把《统计学习方法》过三遍,第一遍照着书本推公式,把思路捡回来。过几天第二遍,抛开书本推公式,如果有遗忘的地方看看书,再好好想想你忘记的这一步在整个过程中起了什么作用,基于什么的考虑,自己怎么能保证下一次不会忘记,再把书合上继续推。再过几天第三遍,这时候已经可以不用看书,说起哪个模型,就能直接手推了,如果还做不到,就第四遍、第五遍.....

NLP部分:

NLP目前分为了统计学习方法和深度学习方法两大部分,建议先从深度学习方法学起,容易出成果,内心成就感会高一点。

1.关于书籍:

统计学习方法:宗成庆 《统计自然语言处理》

深度学习方法:《TensorFlow实战google深度学习框架》

在NLP的深度学习方面其实我至今没有找到一本系统的书,所以只推荐了一本google的深度学习。

《统计自然语言处理》其实我也不太喜欢,但是他有配套视频(下面会讲),所以顺带推荐一下。(不过我基本上没看过)

2.关于视频

深度学习方法:

吴恩达的深度学习视频,在网易云课堂上有中文版,强烈推荐。一共好像5个章节,其中一个章节是图像处理的,可以不用看。其他的我感觉十天左右也能看完了吧。这个视频看完以后对TensorFlow和NLP已经可以形成一个初步的理解了。它每个章都有作业,一定要做(作业在github上可以搜到)。

同样,一定要记得做笔记。

至于广泛流传的CS224N,我不太喜欢,但不排除你会喜欢。(其实是我不太看得懂,感觉还有一些先修课我可能没修)

统计学习方法:

宗成庆有个自然语言处理的视频,一共是64讲,这个视频一定要吴恩达的视频看完,做完几个练手项目,不知道该做什么了的时候才开始看。或者说你什么时候觉得自己需要补这方面知识了,再看就可以了。

3.关于学习方式:

首先看吴恩达的视频,很通俗易懂也很舒服,它里面分为每周的学习计划,其实每周的视频一天就能看完,再花半天一天时间做作业。全部看完以后,去做一些文摘生成、文本相似度比较、文本分类、机器翻译这些任务。但是不用找个什么练手项目100个,然后一个个做过去什么的。(挺想推荐我自己的github的,但是我已经很久不更新....)。每次订个目标,比如说这次我要把rnn实践一遍,就找相关博客,多看几篇,然后再去干活。主要是也没个什么系统的书,这方面学习主要靠博客。把rnn、lstm、seq2seq、cnn这些主流的东西都实践一遍,我感觉也差不多了。

这个时候如果你已经有了很感兴趣的方向,比如说你对对话系统很感兴趣,那可以直接开始往这个方向深入研究了。宗成庆的视频你什么时候觉得需要看了,再看就可以了。

我尽力去不误导大家,但是回头看,文章里还是写了很多绝对的话。学习的方法不是绝对的,我的这些方法,你觉得还行,那不妨可以试一试。要觉得差点意思,笑一笑过去了也就算了。

最后祝大家心想事成。

学习规划|机器学习和NLP入门规划相关推荐

  1. 深度学习、机器学习与NLP的前世今生

    一.为什么做文本挖掘 二.为什么要用深度学习? 三.深度学习的具体应用        深度学习优点        深度学习缺点 随着深度学习的发展,自然语言处理领域的难题也得到了不断突破. Alpha ...

  2. 理解这25个概念,你的人工智能,深度学习,机器学习才算入门!

    相关阅读: 300本计算机编程的经典书籍下载 人工智能,深度学习,机器学习-无论你在做什么,如果你对它不是很了解的话-去学习它.否则的话不用三年你就跟不上时代的潮流了. --马克.库班 马克.库班的这 ...

  3. 深度学习保姆级别之NLP入门文本分类之情感分析

    缘起 作为一个菜鸟小硕,无师自通入门NLP已经一年多了,想着自己的第一个项目就是情感分析,以及第一篇CCF B类中文期刊也是情感分析,决定开一个关于文本分类的专栏,提供保姆级别的模型训练过程.很多同学 ...

  4. Chatbot大牛推荐:AI、机器学习、深度学习必看9大入门视频

    这年头,谈话间,不夹杂点"人工智能","机器学习","深度学习"这样的字眼,就跟九十年代追不上互联网的时髦一样--丢份! 可是呢,说白了,真 ...

  5. 干货 | 请收下这份2018学习清单:150个最好的机器学习,NLP和Python教程

    本文英文出处:Robbie Allen 翻译/雷锋网字幕组 吴楚 校对/ 雷锋网 田晋阳 机器学习的发展可以追溯到1959年,有着丰富的历史.这个领域也正在以前所未有的速度进化.在之前的一篇文章中,我 ...

  6. 机器学习中的双层规划问题

    [论文阅读] | 机器学习中的双层规划问题(Bilevel Programming)_August的学习笔记-CSDN博客_双层规划 第9讲 双层规划 - 百度文库 双层规划法 - 百度文库

  7. 入门深度学习与机器学习的经验和学习路径

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Caliber(清华大学 应用数学博士在读) 链接:http ...

  8. 测试工程师的职业规划和职业发展——入门篇

    测试工程师的职业规划和职业发展--入门篇 由于种种原因,很多人选择了测试这个职业,在职场和测试领域当中几经风雨,有的人顺时应势走出了一片天地,有的人选择离开从事其他职业-- 笔者作为一个在测试行业略有 ...

  9. 【组队学习】【29期】9. 基于transformers的自然语言处理(NLP)入门

    9. 基于transformers的自然语言处理(NLP)入门 航路开辟者:多多.erenup.张帆.张贤.李泺秋.蔡杰.hlzhang 领航员:张红旭.袁一涵 航海士:多多.张红旭.袁一涵.童鸣 基 ...

最新文章

  1. IJCV2021 人脸关键点检测器PIPNet
  2. H.264编码系统几个比较重要的算法
  3. Linux--Ubuntu12.04安装NDK
  4. ConcurrentSkipListMap深入分析
  5. 部署 SAP UI5 应用到 SAP BTP 时遇到的 error retrieving MTA 错误消息
  6. 中海达手部链接电脑安装软件_山东水文局:较大含沙量条件下中海达ADCP外接测深仪测流系统试验成功...
  7. Liunx常用的100条命令汇存
  8. .Net Excel 部分操作
  9. c python 传参数 数组_python函数传递数组参数吗
  10. Token实现单点登陆
  11. 拒绝空谈 AI 设想!手把手教你构建实时、高可用的 AI 调度平台
  12. nohup java 运行main_在linux下利用nohup来后台运行java程序
  13. 通过Ajax进行POST提交JSON类型的数据到SpringMVC Controller的方法
  14. ThinkPHP第七天(F函数使用,项目分组配置,项目分组模板文件放置规则配置)
  15. 计算机右键菜单太多,文件右键太多?win10 ghost小方法删除右键多余菜单
  16. 织梦标签调用:根据特定需求调用文章的标签代码
  17. java抽奖系统的设计参考文献,抽奖系统的设计与实现论文范文论文
  18. java 中心度_任务调度中心 (优化版)【原】
  19. 校招回忆录---小米篇
  20. MATLAB算法实战应用案例精讲-【图像处理】小目标检测(附matlab代码实现)

热门文章

  1. java中的实例初始化
  2. Scala Spark Streaming + Kafka + Zookeeper完成数据的发布和消费
  3. 为什么我使用 Linux 开发
  4. 网站建设教程:新手如何建设自己的网站?
  5. MySQL性能结构优化原理(技术核心)
  6. 记一次OutOfMemory定位过程
  7. 如何查看某个端口被谁占用
  8. java环境安装之不能安装exe文件
  9. Java如何配置ibmmq集群_如何在IBM MQ集群中动态创建订阅?
  10. ehcache config xml file