点击上方“视学算法”,选择“星标”公众号

第一时间获取价值内容

近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细、明了地介绍了机器学习中的相关概念、数学知识和各种经典算法。机器之心看到后,也迫不及待的推广给更多的读者。完整的 PDF 请从文后作者公开的链接下载。

在介绍中,Jim Liang 写到:

人工智能是这两年风头正劲的领域,也是未来具有颠覆性可能的新领域。不少人尝试去学习机器学习相关的知识。然而,一旦越过最初的 overview 阶段,很多人就开始打退堂鼓了,然后迅速放弃。

为什么会这样?

极 高 的 学 习 曲 线

  • 首当其冲就是数学,涉及统计学、微积分、概率、线性代数等,大家虽然都学过高等数学,但如果你还记得里面的细节,算你牛。更可能的情况是,多数人都对高等数学忘记了,面对各种算法里的大量公式,感到厌恶,甚至恐惧。

  • 其次因为机器学习本身是一个综合性学科,而且是一个快速发展的学科,知识点散乱,缺乏系统性。

  • 市面上的机器学习/深度学习书籍、文章、教程,遍地开花,但能以清晰的方式表达、循序渐进地讲解的教程,其实不多,大量的教程没有考虑到学习者的基础,使得初学者感到挫败和困惑。

图 解 机 器 学 习

正是对机器学习的过程中的痛苦有切身体会,我希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。我为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。

从结构来看,全部教程包含两部分:

Part 1 介绍了基本概念,包括:

  • 机器学习的流程

  • 数据处理

  • 建模

  • 评估指标(如 MSE、ROC 曲线)

  • 模型部署

  • 过度拟合

  • 正则化等

在第一部分,作者先介绍了如今应用普遍的机器学习:从自动驾驶、语音助手到机器人。其中有些思想,也是众多读者们了解过的,例如:为何机器学习在这个时候会火(大数据、计算力、更好的算法);机器学习、人工智能、深度学习三者的关系等。

除了这些基础概念,这份教程也对机器学习模型的开发流程做了图像化展示(如下图),即使对此不太了解的读者,也能通过这种流程展示有所学习。

建立机器学习解决方案的步骤

在 Part1 的其他小节,作者以类似的图像展示,对数据、建模、模型部署等内容做了详细介绍,这里就不一一列举,可以从原报告查看。

在 Part2,作者介绍了 常用的算法,包括:

  • 线性回归

  • 逻辑回归

  • 神经网络

  • SVM

  • Knn

  • K-Means

  • 决策树

  • 随机森林

  • AdaBoost

  • 朴素贝叶斯

  • 梯度下降

  • 主成分分析

这部分包含了大量的数学公式,但作者尽力注解了其中的每个公式,从而充分、清晰地表达了众多数学概念。

例如在「神经网络」部分,作者整理了 59 页的笔记(从 311 页到 369 页)。作者从人脑中的神经元架构说起,介绍了人工神经网络(ANN)、人工神经元工作的原理。这份笔记非常注重图像化的概念解释,理解起来非常直观。

例如,下图中的概念解释很形象地展现了生物神经元和人工神经元工作方式的相似性。

生物神经元的树突输入-轴突输出模式和人工神经元的输入输出模式对比。

过拟合的解释。

人工神经元的基础结构。

在涉及到数学公式时,作者会在旁边有详细的注解,如下图所示:

对于并列的可选项(如激活函数、常用神经网络架构等),也会有全面的列表:

常用的激活函数。

然后会有每个激活函数的单独介绍:

Sigmoid 激活函数。

用神经网络分类手写数字的前向传播示例(softmax 激活函数)。

对于神经网络中较为复杂的概念(如求导、反向传播),几张图就能解释清楚:

关于神经网络的完整训练过程,作者用简略流程图+计算细节展开的方式呈现:

反向传播算法完整流程。

前向传播部分的计算细节。

就像前面提到的,这部分除了「神经网络」的介绍,还包括随机森林、梯度下降等概念的介绍,读者们可查看原教程。

总结

看完这份教程之后,小编觉得这是一份包罗万象的学习笔记,既适合非专业人士了解有关机器学习的基础概念,又适合有专业背景的学生进一步学习。

写教程是为了自己持续学习,分享教程是为了帮助更多人学习。就像作者所说,「Learning by doing/teaching, 写这个教程主要是强迫自己持续学习,另外,也想分享给他人,希望能帮助到更多想学习 Machine Learning 的人,降低大家的学习痛苦。」

资源下载:

后台回复机器学习笔记(建议复制)即可获得百度网盘地址。

- END -
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「perfect_iscas」,关注后回复「进群」或者扫描下方二维码即可进入无广告技术交流群。
扫描二维码进群↓

在看 

一份520页的机器学习笔记!附下载链接相关推荐

  1. 从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂)

    导读:近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细.明了地介绍了机器学习中的相关概念.数学知识和各种经典算法.完整的 ...

  2. 【报告分享】2022年元宇宙全球年度(202页干货):蓄积的力量-北京大学.pdf(附下载链接)...

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 大咖话元宇宙:如果你想参与元宇宙,应该采取怎样的策略? 清华大学:元宇宙发展研究报告2.0版.pdf 大家好,我 ...

  3. 【报告分享】清华大学126页PPT:2020-2021年元宇宙发展研究报告.pdf(附下载链接)...

    大家好,我是文文(微信号:sscbg2020),今天给大家分享清华大学新媒体研究中心于2021年9月份发布的报告<2020-2021年元宇宙发展研究报告.pdf>,对元宇宙感兴趣的伙伴别错 ...

  4. 智能汽车产业148页深度研究报告:汽车智能开启,拥抱产业变革.pdf(附下载链接)...

    大家好,我是文文(微信:sscbg2020),今天给大家分享华西证券于2021年4月29日发布的报告<智能汽车产业148页深度研究报告:汽车智能开启,拥抱产业变革.pdf>,关注智能汽车的 ...

  5. 美团点评技术年货:900+页电子书,覆盖前端、后台、大数据、算法……(附下载链接)...

    今天给大家分享美团技术团队推出的<美团点评2019技术年货合集.pdf>,我们精选美团技术博客几十篇技术干货以及数篇国际顶会论文,整理制作成一本厚达900多页的电子书,作为新年礼物赠送给大 ...

  6. 100页PPT:从特斯拉看汽车智能化趋势(附下载链接)

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 近两年热门报告合集(按月度免费下载)为什么说产品能力是一个人的底层能力? 商业分析常用思维模型方法总结麦肯锡最新 ...

  7. 【干货】2021年技术趋势:全球企业加速数字化转型-德勤.pdf(附下载链接)

    大家好,我是文文(微信:sscbg2020),今天给大家分享德勤发布的干货报告<2021年技术趋势:全球企业加速数字化转型.pdf>,对技术趋势感兴趣的伙伴别错过啦! 本年度报告的主题是韧 ...

  8. 当个性化推荐遇上知识图谱.pdf(附下载链接)

    今天给大家带来新加坡国立大学NExT中心的王翔博士在2020年5月10日举办的"推荐系统前沿进展"系列学术沙龙活动中所做的分享<当个性化推荐遇上知识图谱>,在本次分享中 ...

  9. 程序员编程书籍-列表汇总(附下载链接)

    程序员编程书籍-列表汇总(附下载链接) 编程书籍索引,附在线链接. 国外程序员在 stackoverflow 推荐的程序员必读书籍,中文版. stackoverflow 上的程序员应该阅读的非编程类书 ...

最新文章

  1. 用可组合的构建块丰富用户界面?谷歌提出「可解释性」的最新诠释
  2. linux命令的使用实验报告,Linux实验报告一-常用命令使用.doc
  3. Mybatis: 返回不同实体(对象数组)
  4. 使用SharedPreferences
  5. linux批量远程多服务器FTP并下载文件的脚本
  6. diy直立双足机器人_Aelos Pro 机器人:让编程变得更有趣
  7. 华为fusionsphere整体架构及其各组件功能_华为数据之道:面向业务的信息架构建设...
  8. 使用 ssmtp 於 shell 透過 Gmail 寄信
  9. 征服大前端视频教程第一季(jQuery、HTML5、CSS3、Node.js)
  10. swf游戏保存进度_flash格式如何保存为swf格式动画?flash格式小游戏保存成swf格式方法 - 软件教程 - 格子啦...
  11. 云主服务器排行榜_国内云服务器排名
  12. 转:nginx allow 多个ip ipv4的网段表示方法解析
  13. 深度剖析mongos连接池
  14. 【内部流出,勿做商用】今日教大家如何抢聚划算
  15. acwing1113 红与黑
  16. python写音乐_你想过用代码来写音乐吗?我用业余时间开发的一个可以编程写音乐的python库(一)...
  17. 考试系统服务器考试机,考试系统
  18. 青龙羊毛——酷狗音乐(教程)
  19. 怎么让在线视频播放html,HTML5网页视频强制变速倍速播放
  20. Hinton:胶囊网络的专利是我的了

热门文章

  1. 高中计算机个人总结怎么写,毕业生自我总结范文
  2. 报告!插件×元宵来啦
  3. ​谷歌大神 Jeff Dean 领衔,万字展望5大 AI 趋势
  4. Python画出心目中的自己
  5. 李彦宏AI布局又下一城,成立生命科学公司“百图生科”
  6. 4000个“不会数学”的程序员出现大反转!居然能学AI,玩算法,搞逻辑!背后原因首次曝光...
  7. 女朋友啥时候怒了?Keras识别面部表情挽救你的膝盖
  8. 第三届“达观杯”文本智能信息抽取挑战赛丰厚奖金,群英集结,等你来战!...
  9. 2018年Python开源项目Top100!只在这里!
  10. 马上 2018 年了,该不该下定决心转型AI呢?