导读:近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细、明了地介绍了机器学习中的相关概念、数学知识和各种经典算法。完整的 PDF 请从文后作者公开的链接下载。

在介绍中,Jim Liang 写到:

人工智能是这两年风头正劲的领域,也是未来具有颠覆性可能的新领域。不少人尝试去学习机器学习相关的知识。然而,一旦越过最初的 overview 阶段,很多人就开始打退堂鼓了,然后迅速放弃。

为什么会这样?

极高的学习曲线

  • 首当其冲就是数学,涉及统计学、微积分、概率、线性代数等,大家虽然都学过高等数学,但如果你还记得里面的细节,算你牛。更可能的情况是,多数人都对高等数学忘记了,面对各种算法里的大量公式,感到厌恶,甚至恐惧。

  • 其次因为机器学习本身是一个综合性学科,而且是一个快速发展的学科,知识点散乱,缺乏系统性。

  • 市面上的机器学习/深度学习书籍、文章、教程,遍地开花,但能以清晰的方式表达、循序渐进地讲解的教程,其实不多,大量的教程没有考虑到学习者的基础,使得初学者感到挫败和困惑。

图解机器学习

正是对机器学习的过程中的痛苦有切身体会,我希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。我为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。

从结构来看,全部教程包含两部分:

Part 1 介绍了基本概念,包括:

  • 机器学习的流程

  • 数据处理

  • 建模

  • 评估指标(如 MSE、ROC 曲线)

  • 模型部署

  • 过度拟合

  • 正则化等

在第一部分,作者先介绍了如今应用普遍的机器学习:从自动驾驶、语音助手到机器人。其中有些思想,也是众多读者们了解过的,例如:为何机器学习在这个时候会火(大数据、计算力、更好的算法);机器学习、人工智能、深度学习三者的关系等。

除了这些基础概念,这份教程也对机器学习模型的开发流程做了图像化展示(如下图),即使对此不太了解的读者,也能通过这种流程展示有所学习。

▲建立机器学习解决方案的步骤

在 Part1 的其他小节,作者以类似的图像展示,对数据、建模、模型部署等内容做了详细介绍,这里就不一一列举,可以从原报告查看。

在 Part2,作者介绍了 常用的算法,包括:

  • 线性回归

  • 逻辑回归

  • 神经网络

  • SVM

  • Knn

  • K-Means

  • 决策树

  • 随机森林

  • AdaBoost

  • 朴素贝叶斯

  • 梯度下降

  • 主成分分析

这部分包含了大量的数学公式,但作者尽力注解了其中的每个公式,从而充分、清晰地表达了众多数学概念。

例如在「神经网络」部分,作者整理了 59 页的笔记(从 311 页到 369 页)。作者从人脑中的神经元架构说起,介绍了人工神经网络(ANN)、人工神经元工作的原理。这份笔记非常注重图像化的概念解释,理解起来非常直观。

例如,下图中的概念解释很形象地展现了生物神经元和人工神经元工作方式的相似性。

▲生物神经元的树突输入-轴突输出模式和人工神经元的输入输出模式对比。

▲过拟合的解释

▲人工神经元的基础结构

在涉及到数学公式时,作者会在旁边有详细的注解,如下图所示:

对于并列的可选项(如激活函数、常用神经网络架构等),也会有全面的列表:

▲常用的激活函数

然后会有每个激活函数的单独介绍:

▲Sigmoid 激活函数

▲用神经网络分类手写数字的前向传播示例(softmax 激活函数)。

对于神经网络中较为复杂的概念(如求导、反向传播),几张图就能解释清楚:

关于神经网络的完整训练过程,作者用简略流程图+计算细节展开的方式呈现:

▲反向传播算法完整流程

▲前向传播部分的计算细节

就像前面提到的,这部分除了「神经网络」的介绍,还包括随机森林、梯度下降等概念的介绍,读者们可查看原教程。

总结

看完这份教程之后,小编觉得这是一份包罗万象的学习笔记,既适合非专业人士了解有关机器学习的基础概念,又适合有专业背景的学生进一步学习。

写教程是为了自己持续学习,分享教程是为了帮助更多人学习。就像作者所说,「Learning by doing/teaching, 写这个教程主要是强迫自己持续学习,另外,也想分享给他人,希望能帮助到更多想学习 Machine Learning 的人,降低大家的学习痛苦。」

笔记作者:Jim Liang

来源:机器之心(ID:almosthuman2014)

教程文档下载地址(百度云):

https://pan.baidu.com/s/1tNXYQNadAsDGfPvuuj7_Tw

文章版权归原作者所有,转载仅供学习使用,不用于任何商业用途,如有侵权请留言联系删除,感谢合作。

从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂)相关推荐

  1. 复杂网络基础概念总结

    前言:最近刚定下的课题,现在主要学习网络基础概念的知识,凡是学习总是得做下总结笔记才能比较清楚.也分享给大家一起学习吧,如有错误可以提出私信我或者评论. 社会网络通常显示出较强的社区效应,网络中的节点 ...

  2. 【算法思想】Reed-Solomon 纠错编码基础概念,编码、解码算法原理、数学公式 Python代码实现

    [算法思想]Reed-Solomon 纠错编码基础概念,编码.解码算法原理.数学公式 & Python代码实现 文章目录 [算法思想]Reed-Solomon 纠错编码基础概念,编码.解码算法 ...

  3. 机器学习笔记(一)numpy的使用、机器学习基础概念

    目录 1.numpy 1.1.创建 numpy.array 1.1.1.常规创建 numpy.array 的方法 1.1.2.其他创建 numpy.array 的方法 1.1.2.其他创建随机数 ra ...

  4. VBA基础概念和宏的录制

    @示例文件 以下图为例,准备3份不同的Excel文件,分别命名为"2016 Revenues","2015 Revenues"和"2014 Reven ...

  5. TCP/IP基础概念及通信过程举例

    TCP/IP基础概念及通信过程举例 出现 上个世纪60年代,由于中央集中式网络的容灾性较弱,以美国国防部为中心的一家组织研究出分组交换网络.后来为了验证分组交换技术的实用性,ARPANET出现了,并且 ...

  6. Python+Dash快速web应用开发——基础概念篇

    作者:费弗里 来源:Python大数据分析 ❝本文示例代码与数据已上传至https://github.com/CNFeffery/DataScienceStudyNotes ❞ 1 简介 这是我的新系 ...

  7. 理解 angular2 基础概念和结构 ----angular2系列(二)

    前言: angular2官方将框架按以下结构划分: Module Component Template Metadata Data Binding Directive Service Dependen ...

  8. 数据库基础笔记(MySQL)1 —— 基础概念

    (写算法题目把自己心态搞崩了,休息两天顺便把之前学的数据库手写笔记记录在网上方便查阅,因为只是自己学的时候做的笔记,如果有错误欢迎大家指正,过两天再重回算法的怀抱哈哈) 如何下载配置 这个感觉视频讲的 ...

  9. python 舍去小数_零基础小白Python入门必看——编程基础概念

    1. 程序的构成 程序由模块组成,一个模块对应python的源文件 ,一般后缀为:.py 模块由语句构成 语句是python程序的构造单元,用于创建对象.变量赋值.调用函数.控制语句等. 2. 对象 ...

最新文章

  1. BEP 7:CUDA外部内存管理插件(上)
  2. session的使用
  3. shell mysql e_xshell怎么搭建mysql
  4. 泛函分析——有界线性算子和函数
  5. JVM空间申请流程图
  6. decimal转为string sql_PHP+Mysql防止SQL注入的方法
  7. wap开发使用jquery mobile之后页面不加载外部css样式文件/js文件
  8. php5.2 json,php5.2 对json格式的支持
  9. https 带端口_基于scapy模块的8种端口扫描
  10. 矢量图片转换 emf to eps
  11. 遗传算法原理及算法步骤(学习篇·上)
  12. 记项目现场的翻车事故
  13. 老男孩教育33期周末班-决心书
  14. pyQt5图片放大和缩小
  15. 微软/谷歌浏览器之争落幕:Edge向Chrome认输了?
  16. 空间3点求三点所在空间圆的圆心空间坐标
  17. 2016全球大数据战略版图剖析(4):分析篇下
  18. 可视化大屏项目-大屏界面测试点梳理
  19. 威世 | 新款 LLC 谐振变压器/电感器,优化 PCB 空间布局
  20. python 中execl等表格操作学习心得

热门文章

  1. 轻量级开源小程序SDK发车啦
  2. [原]排错实战——使用process explorer替换任务管理器
  3. 微软发布了开发社区采用.NET Standard的最新信息
  4. 动手造轮子:实现一个简单的 EventBus
  5. TIOBE 6月排行:C# 以微弱的优势超过了 Visual Basic .NET 的排名,再次进入 TOP 5
  6. 我,宇宙最强编辑器,支持远程开发
  7. 一码阻塞,万码等待:ASP.NET Core 同步方法调用异步方法“死锁”的真相
  8. .NET Core开发日志——Linux版本的SQL Server
  9. Asp.NET Core2.0 项目实战入门视频课程_完整版
  10. .NET Core多平台项目模板eShopOnContainers编译手记