来源:机器之心

本文约1500字,建议阅读5分钟。

本文为你分享近日《Mathematics for Machine Learning》的全部草稿已放出,我们整理了这本书的简要概述。

近日,Marc Peter Deisenroth、A Aldo Faisal 和 Cheng Soon Ong 所著书籍《Mathematics for Machine Learning》的全部草稿已放出,我们整理了这本书的简要概述。感兴趣的读者可从以下链接获取全文(英文版)。

书籍地址:https://mml-book.github.io/

以下是这本书的部分序言。

机器学习是捕捉人类知识、对适合构建机器和工程化自动系统的格式进行推理的最新尝试。随着机器学习越来越普遍,软件包越来越易用,自然而然地,从业者不会注意低级技术细节。但是,这带来了一些风险,即从业者不了解设计决策,更容易忽略机器学习算法的局限性。对成功的机器学习算法的背后机制感兴趣的从业者需要学习如下必备知识:

  • 编程知识和数据分析工具;

  • 大规模计算和相关框架;

  • 数学和统计学知识,以及机器学习如何在其上构建。

在大学里,机器学习的基础课程会先花时间介绍部分必备知识。由于历史原因,机器学习课程通常属于计算机科学系,学生通常接受过前两项必备知识领域的训练,但对数学和统计学知识可能涉猎不多。目前的机器学习教科书尝试用一两章的篇幅覆盖背景数学知识,可能在书的开头或者是附录。而本书将介绍基础机器学习概念的数学基础,并收集相关信息。

为什么要再写一本关于机器学习的书?

机器学习构建于数学语言之上,以表达看似直观实则难以形式化的概念。一旦得到恰当的形式化,我们就可以使用数学工具推导出机器学习算法设计的选择结果。这帮助我们理解正在解决的任务,同时了解智能的本质。全球数学专业的学生常见的一种抱怨是数学话题似乎与实际问题没有什么相关。我们认为机器学习是促使人们学习数学的直接动力。

本书旨在作为构建现代机器学习基础的大量数学文献的指南。我们通过直接指出数学概念在基础机器学习问题中的有用性来促进对数学概念学习的需求。为使书籍尽量简短,我们省略了很多细节和高级概念。本书主要介绍基础数学概念及其在机器学习语境中的意义,读者可在章节最后找到进一步学习的大量资源。对于具备数学背景的读者,本书提供简洁但表述准确的机器学习概览。与主要介绍机器学习方法和模型或编程知识的书籍不同,本书仅提供四个代表性机器学习算法。我们主要关注模型背后的数学概念,并描述其抽象之美。我们希望所有读者能够通过数学模型中的基础选择更加深入地了解机器学习应用中出现的机器学习基础问题和相关的实际问题。

目标读者

随着机器学习应用在社会中的广泛应用,我们认为每个人都应该了解其背后的原则。本书以学术数学风格写成,可以帮助读者准确理解机器学习背后的概念。我们鼓励不熟悉这一风格的读者坚持阅读本书,并牢记每个话题的目标。我们将在文本中插入大量评论,希望可以帮助读者获取对全局的理解。本书假设读者具备中学数学和物理知识。例如,读者应该了解过导数和积分,以及二维三维几何向量。因此,本书的目标读者包括本科大学生、夜校学生和参与机器学习在线课程的人们。

本书结构如下所示:

第一部分:数学基础

1. 引言和动机

2. 线性代数

3. 解析几何

4. 矩阵分解

5. 向量微积分

6. 概率和分布

7. 连续优化

第二部分:机器学习核心问题

1. 当模型遇到数据

2. 线性回归

3. 利用主成分分析进行降维

4. 利用高斯混合模型进行密度估计

5. 利用支持向量机进行分类

我们可以用以下两种策略来理解机器学习中的数学:

按从基础到高级的顺序构建概念。这通常是偏技术性领域(如数学)的首选方法。该策略的优点是,读者可以随时依赖自己以前学过的定义,不会遇到那些晦涩难懂、难以接受的观点。但对于从业者来说,许多基础概念本身并不怎么有趣,因此大多数基础定义会被他们很快遗忘。

从实际需求向下挖掘出更基础的要求。这种目标驱动方法的优点是,读者随时都知道为什么他们需要研究特定的概念,并且清晰地知道自己需要哪些知识。这种策略的缺点是知识的基础并不稳固,读者必须记住一组自己并不理解的单词。

本书分为两部分,第一部分讲数学基础,第二部分将第一部分的概念应用于基本的机器学习问题中,继而形成了图 1.1 中阐述的“机器学习四大支柱”。

图 1.1:机器学习的基础和四大支柱

第一部分关于数学

我们将数值数据表示为向量,并将这些数据的表格表示为矩阵。向量和矩阵的研究被称为线性代数,见本书第 2 章。

我们经常认为数据是一些真实潜在信号的噪声观测结果,并希望通过机器学习从噪声中识别出信号。为此我们需要一种语言来量化噪声的含义。我们也经常希望能有预测因子来表达某种不确定性,例如,量化我们对特定测试数据概率预测值的置信度。对不确定性的量化属于概率论的领域,在本书第 6 章有所涉及。

为了把爬山法(hill-climbing)应用于训练机器学习模型,我们需要形式化梯度的概念,它会告诉我们寻找解的方向。搜索方向这个想法是通过微积分来形式化的,我们在第 5 章介绍了这一点。如何使用这些搜索方向序列来找到山顶被称为优化,见本书第 7 章。

第二部分关于机器学习

本书第二部分介绍了机器学习的四大支柱,如下表所示。表中的每一行区分了问题的相关变量是连续还是类别。我们解释了如何将本书第一部分介绍的数学概念应用于机器学习算法的设计中。

表 1.1:机器学习的四大支柱

图 2.2:该思维导图展示了本章介绍的概念及其与其他章节的关联

机器学习中的数学:一份新鲜出炉的热门草稿相关推荐

  1. 2021阿里全球数学竞赛获奖名单出炉!北大获奖人数最多!

    来源:量子位 又一次的全球数学狂欢,落下帷幕! 经过4个月的赛程,第三届阿里巴巴全球数学竞赛结果新鲜出炉: 52850名参赛选手中,最终有70人获奖,99.9%的人无缘奖牌. 北大成最大赢家,不仅有2 ...

  2. 大数据进入人工智能时代:2017年大数据生态地图新鲜出炉

    随着人工智能技术的高速发展,2017年是大数据全面进入人工智能时代的关键一年,根据IDC的报告,未来几年大数据和数据分析市场规模将进入高速增长阶段,从2016年的1300亿美元,增长至2020年的20 ...

  3. 我们该如何学习机器学习中的数学

    数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少.通常离开学校后很难有机会静下心学习数学知识,因此我们最好能通过阅读小组或读书会等形式营造环境,并专注学习那些 ...

  4. 机器学习中的数学——蓄水池抽样算法(Reservoir Sampling Algorithm)

    分类目录:<机器学习中的数学>总目录 蓄水池抽样算法(Reservoir Sampling Algorithm)解决了未知长度数据的均匀抽样问题,即:给定一个数据流,数据流长度NNN很大, ...

  5. 机器学习中的数学(七)--凸优化的基础知识

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  6. 机器学习中的数学(六)--信息论与激活函数

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  7. 机器学习中的数学(三)--牛顿法

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  8. 机器学习中的数学(一)--基础数学与基本微分学

    写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...

  9. 机器学习中的数学——拟牛顿法(Quasi-Newton Methods)

    分类目录:<机器学习中的数学>总目录 相关文章: · 梯度下降法(Gradient Descent) · 随机梯度下降(Stochastic Gradient Descent, SGD) ...

最新文章

  1. 关于 ulimit -SHn 65535
  2. Linux基础——bash基础应用及文件系统基础命令
  3. 对象存储使用案例_杉岩MOS海量对象存储中标福建移动
  4. JZOJ 2308. 【中山市选2011】聚会
  5. 远程连接SQL Server2008的设置方式
  6. html2个表单,单个html angular2中的多个表单
  7. Vim 4 常用插件
  8. springboot不会运行gc_SpringBoot 深度调优,让你的项目飞起来!
  9. 【C++】std::是什么?
  10. 金融评分卡项目—2.银行客户流失预警模型介绍(单因子与多因子分析)
  11. Windows Store App 中使用Scrollviewer实现缩放功能
  12. ISO/IEC 20000 信息技术(IT)服务管理体系及全套最新标准资料
  13. 页面跳转 并将改页面从历史栈中删除
  14. 如何利用PS 更改图像背景颜色
  15. iOS APP启动函数调用顺序~详解
  16. 完美邮箱(@88.com/@111.com/email.cn):专用密码登录
  17. Windebug专题
  18. 怎样在线快速缩小动图大小?怎样在线压缩gif图片?
  19. 基于SSM的学生信息管理系统的设计
  20. 有效地址传送指令LEA

热门文章

  1. 什么是微服务架构,该从哪些方面深入理解?
  2. js中的三目运算符详解
  3. 阿里云成香港最大公共云服务商,获评最佳公共云服务商
  4. Fiddler小技巧-测试上传文件接口多参数并传情况
  5. HttpMessageConverter转换类型
  6. 【BZOJ1305】 [CQOI2009]dance跳舞
  7. Android studio 使用心得(六)---android studio 如何加载.so文件
  8. 黑马程序员-JAVA基础-IO流之流操作规律及读写转换流
  9. [每周软件]:Cucumber:未完待续的原因
  10. Javascript 中的长字符串拼接