数据科学家的成长之路兼学习路线:如何学习ML/DL

前言

我从2012年一直以一个业余研究者的身份开始学习机器学习,参考了诸多资料写了篇SVM模型的学习笔记。在一直想继续写但每每错不开时间的反复纠结中,于14年年底终于腾出时间,又开始写最大熵、adaboost、聚类、贝叶斯、LDA等模型的学习笔记。当然,很多很多的知识点和模型,还是了解的太浅,所以能有机会就继续学习。

2015年年初正式创业,我们坚信好的内容依托于在线这个形式,一定可以让千千万万的人从中受益,践行我这几年来始终不变的唯一理想:创造价值 助千万人 领导行业 推动文明。所幸虽然15年全年一年磕磕绊绊,但最终还是所有问题都一一解决了。当然了,原本就没有达不成的目标、没有解决不了的问题、没有沟通不好的事情。然创业之累唯亲身经历创业之人才能真切体会,15年全年,基本没啥时间更新博客,除了终于把拖延了近3年之久的新书《编程之法:面试和算法心得》给出版了。我爱这本书,不管咋样 我付出了心血 对一些人起了帮助、对一些人有用。

2016年,创业第二年。如在那篇CNN笔记中所写的那样:“我虽不参与讲任何课程,然由于公司在不断开机器学习、深度学习等相关的在线课程,耳濡目染中,总会顺带着学习学习。”于是以一个学员之一的角度开始重写技术博客,谁叫我就是能“用最最小白的方式 把一些初看复杂的东西抽丝剥茧的通俗写出来”呢?写完CNN笔记之后,我们的深度学习课程也即将开始第二期,DL课程一期一期开,我当时想,除了上课听课之外,是不是可以和大家一起做点什么事情?这个时候,市场同事提议,我们可以做一些深度学习方面的实验,于是就有了利用DL学梵高作画、利用DL自动玩flappy bird等一系列有趣的深度学习实验,最终带动近1000人跟我们助教团队一起玩,不亦乐乎!

迈入到今年2017年,刚好创业两年整。公司的学员从0到2万,讲师团队从1人到现在的总计21人,课程种类从2类到现在的11类,算是取得了一些成绩。在这两年过程中,我们始终坚持品质第一、内容第一,并时刻敢为人先,包括去年11月份国内首家推出GPU云实验平台,后来市场同事再次提议,何不在今年整个全年GPU呢,于是最近,我们推出了2017年会员:¥2999包揽全年全套数据课程和全年GPU云服务。

回顾过去几年,从在博客里开始整理面试题,然后研究学习数据结构、算法,到后来开始学习机器学习、深度学习,及至15年创业,算是一直在与数据这个东西打交道,虽然自始至终始终是一个从门外窥探门内的业余研究者的身份,但到底是与数据科学渊源很深。

借助公司七月在线越发的强大,依托它强大的讲师资源,和课程资源,我特意在新的一年给想学数据科学、机器学习、深度学习的朋友,整理一份《数据科学家的成长之路兼学习路线》,祝所有朋友新年再上新巅峰。

数据科学家的成长之路兼学习路线

上面扯了一堆,现在直入主题。所谓万丈高楼平地起,搞数据科学、机器学习或深度学习,一开始至少得学会跟计算机打交道吧,怎么跟计算机打交道呢?编程。

第一步:学习编程

实话说,计算机体系很庞大,除了语言、数据机构、算法之外,计算机体系结构、操作系统、网络、数据库等等领域庞大。但不管怎样,学习如何编写代码、如何编程是必需的。学完语言、数据结构、算法等基础知识后,如何更进一步提高编程能力呢?上LeetCode刷题成为很多人的不二之选。
推荐教程:《面试求职算法班》、《LeetCode直播刷题班》

第二步:扎实数学

数学是搞数据科学的必备基础,数学不扎实,机器学习里很多原理、推导、公式便无法理解透彻,比如单单一个SVM就涉及到求导、凸优化等数学知识。所以如果数学忘了,很有必要复习并重新扎实数学基础。
涵盖内容:微积分、数理统计与概率论、矩阵、凸优化
推荐书籍:数理统计学简史、矩阵分析与应用by张贤达、凸优化(Convex Optimization)
推荐课程:《机器学习中的数学班》

第三步:掌握适合数据科学的Python

python在当今的数据分析很热,广泛应用于金融、电商等领域的大数据分析,也非常适合数据工作者利用它处理数据,所以Python在数据领域应用的越来越广泛。
推荐教程:《Python基础入门班》、《Python数据分析班》、《Python爬虫项目班》

第四步:开始学习机器学习

机器学习技术在很多领域应用广泛,包括在数据挖掘、搜索、推荐、广告、自然语言处理等等中。所以学好机器学习,是搞更多应用领域的前提条件。此外,学习机器学习,不单单只是学习一个个模型、算法就足够,因为实际的机器学习工作中,分析问题、处理数据、处理特征占绝大部分工作。所以不要以为看到一个课程涵盖许许多多的模型/算法就以为捡到了宝,看一个ML课程有没有工业实战,最快速的判断标准之一就是看它讲不讲以及是否能讲好特征工程、模型调优等工程点。
推荐书籍:PRML
推荐课程:《机器学习班》

第五步:再进一步之学习DL

得益于计算机越发强大的计算能力,神经网络的加强版深度学习(权且容许我这么不专业的叫法)越发火热,从AlphaGo、无人驾驶再到最近的AlphaGo 2.0横扫中日韩顶级棋手,AI可谓出尽了风头,在这个人工智能与大数据的时代,不学点AI,都不好意思出门跟人打招呼说我是搞计算机技术的了。
推荐课程:国内首家提供GPU云平台实战的《深度学习课程》

第六步:做实验及上kaggle实战

纸上得来终觉浅、绝知此事要躬行。理论学习再多最终还是要实战。为降低门槛起见,你可以从做一个一个有趣的深度学习实验开始,比如学梵高作画、自动玩flappy bird等等。然后,在kaggle上多刷刷一些数据竞赛项目
推荐课程:除了上面本身便有实战的机器学习、深度学习课程之外,还推荐《kaggle案例实战班》、《机器学习项目班》、《深度学习项目班》

第七步:实习或工作

如果你是想做数据挖掘、计算机视觉、自然语言处理,可以继续学相关的课程:https://www.julyedu.com/route。此外,很多经典最新论文值得一读。如果足够了,那就正式出山到实际江湖上闯一闯吧:找份工作,干一把!
推荐公司:有资源、有数据的偏大型一点的公司

参考文献

  1. 《数据科学家的成长之路兼学习路线》
  2. 《七月在线年会员:¥2999包揽全年全套数据课程和全年GPU云服务》
  3. 《教你从头到尾利用DL学梵高作画:GTX 1070 cuda 8.0 tensorflow gpu版》
  4. 《教你从头到尾利用DQN自动玩flappy bird(全程命令提示,GPU+CPU版)》
  5. 《机器学习中的数学班》
  6. 《Python数据分析班》
  7. 《10月机器学习算法班》
  8. 《11月深度学习班》
  9. 《kaggle案例实战班》
  10. 《如何入门机器学习》

后记

关于我所在公司七月在线,有三句话可以介绍之:1 国内最早、最专业、同时也是规模最大的数据教育机构,2 唯一一家拥有数据科学完整课程体系,3 全球首家提供全年GPU云服务。
另,关于学习数据科学难不难,一句话可概括之:只要你想学、你想做,没有你学不好、做不成的事情。
七月在线July、二零一七年一月十五日。

如何从零起步学习AI相关推荐

  1. 零起步学习 电源知识及技术

    电源知识http://blog.zol.com.cn/887/article_886863.html http://diybbs.zol.com.cn/4/620_34159.html 零起步学习 电 ...

  2. 零基础学习AI也有快捷方式?一文帮你提升竞争力!

    在科技高速发展的今天,人工智能是一个很酷很潮的字眼,丰富的任务,促使人工智能在不同行业中的应用不胜枚举:体育新闻可以通过AI帮助他们撰写格式固定的赛事新闻,新闻记者可以通过AI帮他们分析热点关键词,在 ...

  3. angular2 mysql_零起步学习angular2_angularjs教程_汇智网

    贱贱流氓兔 2016/8/31 17:28 大神,在安装typings时,控制台会报错,连接超时,请问如何处理: E:\Webstrom_code\Angular2Demo\angular2-less ...

  4. android 开发零起步学习笔记(三):Android权限标签uses-permission的书写位置

    场景 想获取手机内所有联系人.并且AndroidManifest.xml中也添加了 Xml代码   <uses-permission android:name="android.per ...

  5. android 开发零起步学习笔记(二十二):ANDROID应用ACTIVITY、DIALOG、POPWINDOW、TOAST窗口添加机制及源码分析(一)

    原文:http://www.cnblogs.com/shanzei/p/4654817.html 第一部分: ANDROID应用ACTIVITY.DIALOG.POPWINDOW.TOAST窗口添加机 ...

  6. 五节课从零起步(无需数学和Python基础)编码实现AI人工智能框架电子书V1

    五节课从零起步  (无需数学和Python 基础)  编码实现AI 人工智能框架          王  家  林        2018/4/15                          ...

  7. 零基础学习资料(建议收藏)

    本次整理分享的是一些零基础学习的资料,网盘资料建议大家收藏,分享永久有效,如果后续做调整删除文件的话可能会提示分享不存在,此次的分享针对没有基础从头学的小伙伴们比较友好些,有需要的赶紧收藏起来吧 「零 ...

  8. 第一节课:从零起步编码实现多层次神经网络

    第一节课:从零起步编码实现多层次神经网络 详细内容请关注微信公众号:从零起步学习人工智能 https://mp.weixin.qq.com/s?__biz=MzU3OTc4OTEzNw==&m ...

  9. 第55课:60分钟内从零起步驾驭Hive实战学习笔记

    第55课:60分钟内从零起步驾驭Hive实战学习笔记 本期内容: 1. Hive本质解析 2. Hive安装实战 3. 使用Hive操作搜索引擎数据实战 SparkSQL前身是Shark,Shark强 ...

最新文章

  1. C++关系运算符和关系表达式
  2. 无限轮播的N+2 策略
  3. Java中Map类型数据使用LinkedHashMap保留数据的插入顺序
  4. 文件上传 java 完美,vue+java实现文件上传(excel等),会出现跨域问题,直接用form表单提交就不会有问题了(new FormData())...
  5. 【原创】为什么 Redis 重启后没有正确恢复之前的内存数据
  6. C语言重难点总结:printf和scanf
  7. 51nod 1196
  8. C语言骚操作:结构体初始化方法
  9. Android ble covana,Android BLE低功耗蓝牙开发
  10. matlab虚拟现实之vrbuild2模型导入
  11. hdu 4911 “Inversion”——逆序对问题
  12. 决定明智地放弃对名手旋风等象棋引擎的破解...
  13. UE4联网机制和多人游戏总结 (第一部分)
  14. 用户画像 客户消费模型表
  15. yolo实现交通信号灯视频流识别代码搬运及调试
  16. 地铁三号线 - 搬家故事
  17. SAP MM MARD 表里的Storage Bin 字段
  18. 儿童节html5小游戏,适合儿童节活动上玩的亲子互动小游戏
  19. C++学习的一些经历
  20. 为什么手机充电时会感觉麻麻的,有问题吗?

热门文章

  1. ImageView 加载本地(手机)图片
  2. 关闭Window 10 Ctrl+Shift+B(表情包)快捷键冲突
  3. 微信小程序改变页面背景颜色
  4. 喝酒神器微信小程序源码 支持流量主解锁多人对战
  5. Python数据可视化第 7 讲:matplotlib绘制直方图函数hist
  6. 做眼镜识别的人脸检测
  7. mac环境 java找不到或无法加载主类
  8. Macos 安装MacTex SublimeText3 Skim环境
  9. 友芝友生物冲刺港交所上市:极其依赖单一供应商,周鹏飞为董事长
  10. 啥牌子的蓝牙耳机音质好?2023公认音质最好的蓝牙耳机