点击“开发者技术前线”,选择“星标????”

在看|星标|留言,  真爱

来自:AI派

前段时间,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细、明了地介绍了机器学习中的相关概念、数学知识和各种经典算法。编者看到后,也迫不及待的推广给更多的读者。完整的 PDF 请从文后作者公开的链接下载。

在介绍中,Jim Liang 写到:

人工智能是这两年风头正劲的领域,也是未来具有颠覆性可能的新领域。不少人尝试去学习机器学习相关的知识。然而,一旦越过最初的 overview 阶段,很多人就开始打退堂鼓了,然后迅速放弃。

为什么会这样?

极 高 的 学 习 曲 线

  • 首当其冲就是数学,涉及统计学、微积分、概率、线性代数等,大家虽然都学过高等数学,但如果你还记得里面的细节,算你牛。更可能的情况是,多数人都对高等数学忘记了,面对各种算法里的大量公式,感到厌恶,甚至恐惧。

  • 其次因为机器学习本身是一个综合性学科,而且是一个快速发展的学科,知识点散乱,缺乏系统性。

  • 市面上的机器学习/深度学习书籍、文章、教程,遍地开花,但能以清晰的方式表达、循序渐进地讲解的教程,其实不多,大量的教程没有考虑到学习者的基础,使得初学者感到挫败和困惑。

图 解 机 器 学 习

正是对机器学习的过程中的痛苦有切身体会,我希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。我为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。

从结构来看,全部教程包含两部分:

Part 1 介绍了基本概念,包括:

  • 机器学习的流程

  • 数据处理

  • 建模

  • 评估指标(如 MSE、ROC 曲线)

  • 模型部署

  • 过度拟合

  • 正则化等

在第一部分,作者先介绍了如今应用普遍的机器学习:从自动驾驶、语音助手到机器人。其中有些思想,也是众多读者们了解过的,例如:为何机器学习在这个时候会火(大数据、计算力、更好的算法);机器学习、人工智能、深度学习三者的关系等。

除了这些基础概念,这份教程也对机器学习模型的开发流程做了图像化展示(如下图),即使对此不太了解的读者,也能通过这种流程展示有所学习。

建立机器学习解决方案的步骤

在 Part1 的其他小节,作者以类似的图像展示,对数据、建模、模型部署等内容做了详细介绍,这里就不一一列举,可以从原报告查看。

在 Part2,作者介绍了 常用的算法,包括:

  • 线性回归

  • 逻辑回归

  • 神经网络

  • SVM

  • Knn

  • K-Means

  • 决策树

  • 随机森林

  • AdaBoost

  • 朴素贝叶斯

  • 梯度下降

  • 主成分分析

这部分包含了大量的数学公式,但作者尽力注解了其中的每个公式,从而充分、清晰地表达了众多数学概念。

例如在「神经网络」部分,作者整理了 59 页的笔记(从 311 页到 369 页)。作者从人脑中的神经元架构说起,介绍了人工神经网络(ANN)、人工神经元工作的原理。这份笔记非常注重图像化的概念解释,理解起来非常直观。

例如,下图中的概念解释很形象地展现了生物神经元和人工神经元工作方式的相似性。

生物神经元的树突输入-轴突输出模式和人工神经元的输入输出模式对比。

过拟合的解释。

人工神经元的基础结构。

在涉及到数学公式时,作者会在旁边有详细的注解,如下图所示:

对于并列的可选项(如激活函数、常用神经网络架构等),也会有全面的列表:

常用的激活函数。

然后会有每个激活函数的单独介绍:

Sigmoid 激活函数。

用神经网络分类手写数字的前向传播示例(softmax 激活函数)。

对于神经网络中较为复杂的概念(如求导、反向传播),几张图就能解释清楚:

关于神经网络的完整训练过程,作者用简略流程图+计算细节展开的方式呈现:

反向传播算法完整流程。

前向传播部分的计算细节。

就像前面提到的,这部分除了「神经网络」的介绍,还包括随机森林、梯度下降等概念的介绍,读者们可查看原教程。

扫码关注下方二维码后回复“机器学习笔记”,获取下链接:

总结

看完这份教程之后,小编觉得这是一份包罗万象的学习笔记,既适合非专业人士了解有关机器学习的基础概念,又适合有专业背景的学生进一步学习。

写教程是为了自己持续学习,分享教程是为了帮助更多人学习。就像作者所说,「Learning by doing/teaching, 写这个教程主要是强迫自己持续学习,另外,也想分享给他人,希望能帮助到更多想学习 Machine Learning 的人,降低大家的学习痛苦。

简介

免费电子书《Machine Learning Yearning》是吴恩达历时两年总结整理的一本机器学习实践经验宝典,它以较高的层次为我们介绍了许多在机器学习时代AI工程师应该掌握的技术策略。该书并不聚焦于具体的AI算法,而是为我们介绍了许多具有泛化性的如何让AI算法有效工作的技术。

主要内容

部分内容如下:

  • 机器学习为什么需要策略?

  • 如何使用此书来帮助你的团队

  • 先修知识与符号说明

  • 规模驱动机器学习发展

  • 开发集和测试集的定义

  • 将大型开发集拆分为两个子集,专注其一

  • Eyeball 和 Blackbox 开发集该设置多大?

  • 小结:基础误差分析

  • 偏差和方差:误差的两大来源

  • 偏差和方差举例

  • 与最优错误率比较

  • 处理偏差和方差

  • 偏差和方差间的权衡

  • 减少可避免偏差的技术

  • 训练集误差分析

  • 减少方差的技术

  • 诊断偏差与方差:学习曲线

  • 绘制训练误差曲线

  • 流水线组件的选择:数据可用性

  • 流水线组件的选择:任务简单性

  • 建立超级英雄团队 - 让你的队友阅读这本书吧!

关注下面公众号

回复「MLY」即可获取

这本书的重点并不是教你具体的机器学习算法,而是如何让机器学习算法有效工作。

超给力的 520 页机器学习笔记!图文并茂可能更适合你,文末附下载方法相关推荐

  1. 520 页机器学习笔记!图文并茂可能更适合你

    点击上方"小詹学Python","星标"公众号 重磅干货,第一时间送达 本文经机器之心授权转载,禁二次转载 前段时间,来自SAP(全球第一大商业软件公司)的梁劲 ...

  2. 周志华《Machine Learning》学习笔记(6)--神经网络(文末附代码)

    上篇主要讨论了决策树算法.首先从决策树的基本概念出发,引出决策树基于树形结构进行决策,进一步介绍了构造决策树的递归流程以及其递归终止条件,在递归的过程中,划分属性的选择起到了关键作用,因此紧接着讨论了 ...

  3. Python网络爬虫与信息提取笔记(续篇)(文末附教学视频)只供教学讲解,请勿对有robots协议的网站(如淘宝网)造成骚扰

    接上篇博客:Python网络爬虫与信息提取笔记(文末附教学视频) 14:基于bs4库的HTML内容遍历方法 标签树的下行遍历: 用len(soup.body.contents)返回body标签的儿子节 ...

  4. 【干货分享】企业数据中台整体介绍及建设方案(文末附52页pdf下载链接)

    话不多说,直接上干货,文末附52页pdf文档下载链接. 更多细节请关注公众号并回复"1113",获取下载链接. 「 更多干货,更多收获 」 推荐系统系列教程之十二:Facebook ...

  5. 全程快捷键!硬核小哥超快配图1700页数学笔记,教你上手LaTeX+Inkscape

    边策 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 之前,我们介绍了一位神奇的本科生,他在数学课上用Vim+LaTeX,全程手打出1700页课堂笔记,速度直追老师的板书. 现在,这位G ...

  6. 【报告分享】2022年元宇宙全球年度(202页干货):蓄积的力量-北京大学.pdf(附下载链接)...

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 大咖话元宇宙:如果你想参与元宇宙,应该采取怎样的策略? 清华大学:元宇宙发展研究报告2.0版.pdf 大家好,我 ...

  7. 700+页机器学习笔记pdf下载

    作者       梁劲(Jim Liang),来自SAP(全球第一大商业软件公司). 书籍特点       条理清晰,含图像化表示更加易懂,对公式有详细的注解等. 内容概要        主要分为基本 ...

  8. 10W字!推荐一个牛逼的人工智能笔记教程!全部整理好了(附下载)!

    小伙伴从去年年底开始,一直叨叨要跳槽,大大小小的公司面试了很多,但总没有拿到一个满意的offer,要么package太低,要么就是面试被虐. 经过前几次的面试失利,终于明白了什么叫基础不牢,地动山摇. ...

  9. 提升机器学习数学,理论基础的7本著作(文末附资源下载!)

    来源:AI算法与图像处理 本文约1700字,建议阅读8分钟 本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物. [ 导读 ]机器学习和数据科学离不开数学,本文从数学基 ...

最新文章

  1. jquery中ajax的dataType属性包括哪几项
  2. Golang实现requests库
  3. mysql+keepalived搭建高可用环境
  4. 面试题准备--CSS
  5. centos09-nodejs与vue搭建
  6. mysql教程清华课后答案_mysql学习之路_sql
  7. XML文件读取工具类
  8. 计算机逻辑判断函数,Excel函数:逻辑判断IF函数如何使用,涨知识了
  9. 简单实用的网游服务器架构
  10. 【前端图表】echarts散点图鼠标划过散点显示信息
  11. [转载] python字符串只留数字_Python工匠:数字与字符串(下)
  12. java三色球问题_2020100期专业玩彩双色球走势分析
  13. iOS开发之获取LaunchImage启动图
  14. 关于CASS点自动连线方法
  15. bilibili哔哩哔哩网页版中视频资源下载方法(无需任何工具)
  16. U盘重装Mac全新的操作系统详细教程
  17. 计算机四级数据库分值分布,英语四级的题型及分值分布
  18. 用Python走入史学经典《三国演义》中的社交网络
  19. html5+交友app,国内5款高质量陌生人社交软件,你玩过几个
  20. 如何应对团队协作的五大障碍

热门文章

  1. 解决office3件套软件,下载插件---应用商店无法打开的问题
  2. 我,35岁Android开发,高龄入职鹅厂,试用期未过被劝退......今年实惨
  3. linux摄像头教程,linux 摄像头驱动编写方法教程
  4. ArcMap中获取要素的Extent值
  5. 软件测试灵魂问答【连载7】
  6. 关于Facebook Messenger CRM,这里有你想要知道的一切
  7. 弘易信泰,企业级SAAS数据采集技术分析
  8. 开源神器:如何用一行代码快速下载 B 站等全网视频!
  9. (javaweb基础
  10. 数据仓库搭建DWS层