现如今,计算机科学、人工智能、数据科学已成为技术发展的主要推动力
无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎:
  • 想过滤垃圾邮件,不具备概率论中的贝叶斯思维恐怕不行;

  • 想试着进行一段语音识别,则必须要理解随机过程中的隐马尔科夫模型;

  • 想通过观察到的样本推断出某类对象的总体特征,估计理论和大数定理的思想必须建立;

  • 在统计推断过程中,要理解广泛采用的近似采样方法,蒙特卡洛方法以及马尔科夫过程的稳态也得好好琢磨;

  • 想从文本中提取出我们想要的名称实体,概率图模型也得好好了解。

在看到这些专业术语后,很多人就开始打退堂鼓,然后马上选择放弃。
为什么会这样?
因为机器学习所需数学知识有极高的学习曲线。
那么需要多少数学知识呢?宾夕法尼亚大学的计算机教授所写的《计算机科学相关代数学、拓扑学、微分学以及最优化理论》,就用 1900 页的篇幅讲解了相关的数学知识。
不要着急,不要害怕,继续往下看……
我作为一个机器学习、自然语言处理方面的研究者和实践者,参与了大量涉及知识图谱、语义理解、智能问答等技术的工程和科研项目。我认为,有更简单、高效的方法可以让你掌握机器学习中所需的数学知识。
  • 首先,集中力量、紧紧围绕机器学习核心算法中所涉及到的知识进行学习,做好精确打击。

  • 然后,注重加强基础知识与算法、应用案例之间的联系,将理论和算法应用场景相互关联,形成学以致用的实践导向。

  • 同时,运用好 Python 工具,做到和工程应用无缝对接,利用 Numpy、Scipy、Matplotlib、Pandas 等工具强化对知识的理解、提升工作效率。

在上述理念的基础上,我花费数月时间撰写了《机器学习中的数学》系列专栏。
在这段时间里,我不仅要严密地梳理知识体系的内在逻辑,还在讲解技巧上投入了很大功夫,最终做到可以深入浅出地向你展现完整的知识体系。
在近期,我将在 GitChat 先后推出 《机器学习中的数学:概率统计》《机器学习中的数学:线性代数》《机器学习中的数学:微积分与最优化》三个专栏。这三部分数学知识的作用分别是:
  • 概率统计是利用数据发现规律、推测未知的思想方法

  • 线性代数是利用空间投射和表征数据的基本工具

  • 微积分与最优化是机器学习模型中最终解决方案的落地手段

机器学习应用中的思想方法与核心算法大多都是构筑在统计思维方法之上的,所以我们推出的第一个专栏《机器学习中的数学:概率统计》,正是与机器学习紧密相关的概率统计核心内容。
扫码了解专栏详情

专栏作者

张雨萌:清华大学硕士/机器学习书籍作者

毕业于清华大学计算机科学与技术系,目前从事机器学习、自然语言处理方面的研究。他参与的工程和科研项目涉及知识图谱、语义理解、智能问答等领域。热爱技术写作的他,尤其擅长梳理知识体系的内在逻辑,从而深入浅出地展现知识体系。

专栏特色

  • 详解 6 大核心板块:概率思想、随机变量、统计推断、随机过程、采样理论、概率模型,筑牢机器学习核心基础。

  • 教你熟练使用 Python 工具库:依托 numpy、scipy、matplotlib、pandas 工具,无缝对接工程实践。

  • 有理论还有实战:大量实战案例与完整详细源码,反复加深概率统计思想的深刻理解。

专栏大纲及内容特色

第 1 部分:概率思想。我们首先从条件概率和贝叶斯方法入手,阐明条件、独立、相关等基本概念,掌握联合、边缘的计算方法,我们将一起构建起认知世界的概率思维体系。
第 2 部分:随机变量。我们将重点介绍随机变量主干内容,从单一随机变量的分布过渡到多元随机变量的分析,最后重点阐述大数定理和中心极限定理,并初步接触蒙特卡洛方法,和读者一起建立重要的极限思维。
第 3 部分:统计推断。这部分我们关注的是如何通过部分的样本集合推断出我们关心的总体特征,这在现实世界中非常重要。在参数估计的思想方法基础上,我们重点关注极大似然估计和贝叶斯估计这两种方法。
第 4 部分:随机过程。我们将关注由一组随机变量构成的集合,即随机过程。股票的波动、语音信号、视频信号、布朗运动等都是随机过程在现实世界中的实例。我们在随机过程的基本概念之上,将重点分析马尔科夫链,梳理其由静到动的演变,探索变化的过程和不变的稳态。
第 5 部分:采样理论。我们将重点关注如何获取服从目标分布的近似采样方法,从基本的接受-拒绝采样入手,逐渐深入到马尔科夫链-蒙特卡洛方法,通过动态的过程进一步深化对随机过程、随机理论以及极限思想的理解。
第 6 部分:概率模型。这里我们将介绍概率图模型中的一种典型模型:隐马尔科夫模型,熟悉状态序列的概率估计和状态解码的基本方法,为后续学习的概率图模型打好基础。
知识图谱如下:

让我们一起开始这段学习旅程!

万丈高楼平地起,希望《机器学习中的数学》系列专栏能陪伴大家走好机器学习的学习与实践的必经之路、梳理纷繁复杂的知识网络、构筑好算法模型的数学基础。更重要的是,我希望我们能一起形成一种思维习惯:源于理论,我们条分缕析;面向实践,我们学以致用。有了扎实的数学理论和方法基础,相信同学们都能登高望远、一往无前。

福利:我们为本专栏付费读者创建了微信交流群,以便更有针对性地讨论专栏相关的问题(入群方式请在第 3 篇末尾查看)。
点击阅读原文,试读了解专栏详情

机器学习必备的数学基础有哪些?相关推荐

  1. ​清华硕士爆料:这些才是机器学习必备的数学基础

    现如今,计算机科学.人工智能.数据科学已成为技术发展的主要推动力. 无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎: 想过滤垃圾邮件,不具备概率论中的贝叶斯思维恐怕不行: 想 ...

  2. 清华硕士爆料:这些才是机器学习必备的数学基础

    现如今,计算机科学.人工智能.数据科学已成为技术发展的主要推动力. 无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎: 想过滤垃圾邮件,不具备概率论中的贝叶斯思维恐怕不行: 想 ...

  3. 清华硕士一针见血:这些才是机器学习必备的数学基础

    现如今,计算机科学.人工智能.数据科学已成为技术发展的主要推动力. 无论是要翻阅这些领域的文章,还是要参与相关任务,你马上就会遇到一些拦路虎: 想过滤垃圾邮件,不具备概率论中的贝叶斯思维恐怕不行: 想 ...

  4. 斯坦福CS229机器学习课程的数学基础(概率论)翻译完成

    Stanford cs229 manchine learning课程,相比于Coursera中的机器学习有更多的数学要求和公式的推导,课程全英文,基础材料部分还没有翻译.这个基础材料主要分为线性代数和 ...

  5. 斯坦福CS229机器学习课程的数学基础(线性代数)翻译完成

    Stanford cs229 manchine learning课程,相比于Coursera中的机器学习有更多的数学要求和公式的推导,课程全英文,基础材料部分还没有翻译.这个基础材料主要分为线性代数和 ...

  6. 机器学习必备的数学知识,一次学会

    面对机器学习,初学者的阻塞点往往不在于机器学习本身,而是数学.机器学习是计算机技术,但它的底层是数学. 通常,在机器学习相关的教材中,通篇都是复杂的数学公式.初学者如果数学基础不牢固,面对满篇的数学公 ...

  7. 学习人工智能需要哪些必备的数学基础?

    问题一:学习人工智能需要哪些必备的数学基础? 对于大多数的新手来说,如何入手人工智能其实都是一头雾水,比如到底需要哪些数学基础.是否要有工程经验.对于深度学习框架应该关注什么等等? 因为现在AI火了, ...

  8. 机器学习中的数学基础(2)——理解基、线性组合与向量空间

    https://www.toutiao.com/a6668922466275951118/ 这是<机器学习中的数学基础>系列的第2篇. 铺垫 在介绍各种"高大上"的名词 ...

  9. 免费教材丨第51期:数学基础课程----概率论教程、机器学习中的数学基础

    小编说 过去几个月里,有不少人联系我,向我表达他们对人工智能.数据科学.对利用机器学习技术探索统计规律性,开发数据驱动的产品的热情.但是,我发现他们中有些人实际上缺少为了获取有用结果的必要的数学直觉和 ...

最新文章

  1. 硅谷产品实战-总结:19、增长黑客的核心公式
  2. 短视频的生成,不要在技术上想当然
  3. A Horrible Poem(bzoj 2795)
  4. leetcode算法题--相交链表
  5. 全球及中国磁滑轮行业规模预测与供应规划研究报告2022版
  6. oracle / parallle /,Oracle海量数据迁移之使用shell启用多个动态并行
  7. Java:多线程,CyclicBarrier同步器
  8. web前端【补充】CSS补充
  9. php拖拽原理,JS拖拽原理
  10. asp.net 多文件上传,兼容IE6/7/8,提供完整代码下载
  11. OpenXR+Runtime:OpenXR SDK Source Code源码编译
  12. 01背包问题c语言,遗传算法的0-1背包问题(c语言)
  13. 萤火虫小程序_实测!成都人私藏的免费耍水地,抓螃蟹、烤烧烤、赏萤火虫,周末一天来回!...
  14. 移动硬盘插入提示需要格式化RAW_分区变成RAW格式怎么办?
  15. 彩色图像处理之色彩学基础
  16. 软件缺陷报告模板(微信缺陷报告案例)
  17. Verilog状态机详述
  18. 怎么给表格加一列序号_(表格的序号怎么顺下来)如何在excel表格填充一列序号列...
  19. Rosalind全排列的问题
  20. 算法将成为人工智能时代的“科技原力”

热门文章

  1. SQOOP 导出SQL SERVER中数据
  2. dockerfile COPY
  3. 为什么可积不一定可导_为什么很多人开车时一定要听歌?老司机:不听歌,要车何用?...
  4. optparse的模块编译参数使用
  5. python自定义类型转换_Python JSONDecoder自定义null类型的转换
  6. 将你一张表的值覆盖_粉一张移动小蓝卡,智慧出行潮选择
  7. Linux Shell编程笔记10 Shell数组的补充
  8. Flutter游戏:启动时的欢迎页
  9. 在Ubuntu 18.04上搭建HttpRunnerManager服务
  10. 第13章 祖玛(《C和C++游戏趣味编程》配套教学视频)