机器学习: 引言

听过人们谈论过机器学习,但对它的概念却是一知半解?

想要从零开始机器学习,却被网络上的海量资源冲昏头脑?

不用担心,我们给你们提供了机器学习从0到1系列,这个系列可以让你从入门到精通。

现在就开始学习吧!

· · ·

这份指南是为了那些对机器学习感兴趣,但不知如何开始的朋友们准备的。我想大多厌倦在网上搜索大量资料的人都会有挫败感,也放弃了有人能指引他们如何入门的希望。

这个系列的目标,就是教会你们从初学者的角度,正确学习机器学习。

· · ·

为什么说数学是必须的?

机器学习建立在一些数学的基础课程上的,比如微积分,线性代数,概率论,统计学和最优化。这篇文章旨在帮助你们学习一些基本概念,并提供一个可在 Jupiter Notebook 上使用 python 程序设计语言的可操作方法。

第1步 : 线性代数

线性代数是在计算机里设计优化算法的一种方式 ——可以解决线性系统约束问题。

线性代数中你需要了解的概念:

#1 矩阵的秩;
#2 矩阵向量积;
#3 矩阵的列空间和零空间;
#4 特征值和特征向量;
#5 矩阵的奇异值分解;

这是一个了解线性代数概念的速查表:

来源:https://minireference.com/static/tutorials/linear_algebra_in_4_pages.pdf

第2步 :概率论和数理统计

这一数学分支是用来解决随机分布量问题的。

概率论与数理统计中你需要了解的概念:

概率论:

#1 计数方法和组合方法;
#2 贝叶斯理论;
#3 随机变量;
#4 期望;
#5 方差;
#6 条件分布和联合分布;
#7 矩量母函数;
#8 指数型分布族;

数理统计:

#1 最大似然估计;
#2 最大后验概率;
#3 先验概率和后验概率;
#4 抽查法;
#5 吉布斯现象;
#6 平均数,众数,中位数,方差;

这是一个了解概率论和数理统计概念的速查表 :

来源: https://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf

来源: http://web.mit.edu/~csvoss/Public/usabo/stats_handout.pdf

第3步 :多元微积分

经典微积分研究变量和变化率之间的关系。但在机器学习中,我们主要使用微分运算来求解函数的极值,使用积分运算来求解概率模型。

多元微积分中你需要掌握的概念

#1 向量值函数
#2 偏导函数
#3 梯度
#4 方向梯度
#5 黑塞算子
#6 雅各比算子
#7 拉普拉斯算子(低量算子)
#8 拉格朗日乘子

来源: http://tutorial.math.lamar.edu/getfile.aspx?file=B,41,N

第4步:信息论入门

信息论是应用数学的一个分支,它关注如何“度量“信息。

信息论中你需要掌握的概念:

#1 熵
#2 互信息
#3 信息增益
#4 KL散度(相对熵)

来源:http://tuvalu.santafe.edu/~simon/cheat_sheet_info.pdf

第5步:NLP(自然语言处理)

自然语言出来指的是利用软件自动地处理注入讲话和文本的技术。

做为对文本数据感兴趣的机器学习实践者,我们关心自然语言领域的工具和方法。

广义上,利用计算机处理的任何自然语言,均视为自然语言处理,或缩写为NLP。一个极端的理解比如说,可以简单地通过统计词频来比较不同作者的写作风格。另一个极端理解是,NLP应该包括理解完整的人类话语,至少某种程度给予有意义的回应。

— 第9页,利用python进行自然语言处理,2009。

自然语言处理(NLP)指人类语言的一系列自动处理过程的集合名词。它既包含处理人类输出的文本,也包含输出人类可以看的文本。

— 第18页,利用神经网络进行自然语言处理, 2017。

语言学的目标是可以将我们周围所能大量观察到的对话、文章文本和其他媒介特征化并对其进行解释。这里既包括研究人类认知,产生和理解语言的能力,也包含理解语言表达方式和客观世界的关系,还包含理解不同语言的语言结构。

— 第3页,统计自然语言处理,1999。

这些是必备的数学、统计自然语言处理知识。我的建议是如果你想深入探索机器学习,你至少需要掌握提到的一些概念。

干货丨一份机器学习的初学者指南相关推荐

  1. 干货丨人工智能、机器学习和认知计算入门指南

    几千年来,人们就已经有了思考如何构建智能机器的想法.从那时开始,人工智能 (AI) 经历了起起落落,这证明了它的成功以及还未实现的潜能.如今,随时都能听到应用机器学习算法来解决新问题的新闻.从癌症检测 ...

  2. 干货丨一份不可多得的深度学习技巧指南

    数据预处理 What:输入神经网络数据的好坏直接关系着网络训练结果,一般需要对数据进行预处理,常用的数据预处理方式有: 去均值:每个原始数据减去全部数据的均值,即把输入数据各个维度的数据都中心化到0: ...

  3. 干货丨谷歌最新机器学习术语表

    作者:思颖     来源:雷锋网 日前,谷歌发布机器学习术语表,以下术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义. A A/B 测试 (A/B testing) 一种统计方 ...

  4. 干货丨11位机器学习大牛最爱算法全解

    1 来源:Quora 译者:朱焕 [导读]"你最喜欢的机器学习算法是什么?"这个问题有些像"你最喜欢的颜色是什么?"说不重要吧,细究起来,颇有深意.本文摘选一些 ...

  5. 干货丨深度解析机器学习五大流派中主算法精髓

    Pedro Domingos是华盛顿大学计算机科学与工程学教授,也是国际机器学习协会的联合创始人之一.本文是Pedro Domingos在Google所作的机器学习演讲内容整理. 让我们首先从一个简单 ...

  6. 干货丨贝叶斯机器学习前沿进展

    来源:人机与认知实验室 概要:随着大数据的快速发展,以概率统计为基础的机器学习在近年来受到工业界和学术界的极大关注,并在视觉.语音.自然语言.生物等领域获得很多重要的成功应用. 摘要  随着大数据的快 ...

  7. 让你少走弯路,这里有一份机器学习高效入门指南

    拥抱变化 自从Alpha围棋占据人类棋类智力顶峰以来,机器大有在各个领域大放异彩的趋势,那个几年前看起来还模糊不清的未来已经来临,这是关于人工智能和机器学习的时代. 机器学习/人工智能方向的人才异常抢 ...

  8. 干货丨先搞懂这八大基础概念,再谈机器学习入门

    翻译 | AI科技大本营 参与 | 林椿眄 准备好开始AI了吗?可能你已经开始了在机器学习领域的实践学习,但是依然想要扩展你的知识并进一步了解那些你听过却没有时间了解的话题. 这些机器学习的专业术语能 ...

  9. 干货丨【看图识算法】这是你见过最简单的 “算法说明书”

    文章来源:新智元 [导读]像阅读宜家的安装说明书一样学习算法,是怎样的体验?不伦瑞克工业大学的三名研究者制作了这份"算法说明书",简明传神地解释了一些基本算法,一起来看图说话. Q ...

最新文章

  1. android 重启后进入安全模式_图文详细教程:台式电脑或笔记本也可以运行Android系统,凤凰OS...
  2. myeclipse 修改模板
  3. Java 对象锁和类锁全面解析
  4. [JavaScript]利用JavaScript控制table中row的显示
  5. thinkphp3.2自定义success及error跳转页面
  6. 安装pytorch时,在安装 future-0.18.2.tar.gz (829 kB)时报错:ModuleNotFoundError: No module named ‘_ctypes’解决办法
  7. Matplotlib 中文用户指南 1 简介
  8. LeetCode 744. Find Smallest Letter Greater Than Target
  9. nodejs express 学习
  10. source insight设置Courier new字体
  11. pyecharts绘制条形图、饼图、散点图、词云图、地图等常用图形
  12. 2021-CSP-J2/S2 自我题解
  13. CodeForces - 1040B Shashlik Cooking(水题)
  14. java实现pdf旋转_Java实现PDF文本旋转倾斜的方法
  15. java obd_XTOOL X100 PAD3通过OBD给2014 BMW CAS4 Key编程
  16. 仓库智能化管理:WMS仓储管理系统解决方案
  17. Frontiers | 北林邬荣领/何晓青-网络作图揭示拟南芥与叶际微生物组互作机制
  18. 如何使用手机打印资料,手机资料怎么打
  19. html怎么创建盒子,html布局(盒子)
  20. matlab 中实现读取图像上点坐标并在图片上标记点和将坐标显示出来

热门文章

  1. 解析全球人工智能核心脉络——北京智源大会2周倒计时
  2. 他十年前的书在前端圈人手一本,豆瓣评分9.1。现在,王者归来了!
  3. GAN的基本原理与入门应用!
  4. 如何用python编写一个绘制马赛克图像的自写程序mask = np.zeros
  5. Apache Spark 介绍的演讲ppt (slice),全英文
  6. 王可汗:数据科学带我解开摩擦学的“反常现象” | 提升之路系列(七)
  7. 基于深度学习的交互式问答研究综述
  8. 独家 | 探索性文本数据分析的新手教程(Amazon案例研究)
  9. 近期活动盘点:​年末必学课程《社会网络分析》
  10. 商汤及联合实验室入选论文重点解读 | ECCV 2018