↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

Datawhale干货

作者:王茂霖,华中科技大学,Datawhale成员

本文分享了机器学习概念,学习路线和知识体系,希望帮助大家更好地入门机器学习。

Part 1 机器学习相关概念

现如今,关于人工智能(AI)领域出现了很多眼花缭乱的名词,包括机器学习,统计学习,数据科学,数据分析,数据挖掘,深度学习等。这些名词都是什么意思?有什么作用?这里区分介绍下。

如果大家没有接触过人工智能的话,大家可能最熟悉的就是统计学了,在大学期间就学习的概率论就是统计学的相关知识,所以首先我们介绍一下统计学统计学习。统计学和统计学习并非承接或者包含关系,两者可以看作两个不同的学科,不过统计学习中运用到了很多统计学的相关基础数学知识。

后台回复关键词'210531'可下载完整PPT

在介绍完这两个区别后,我们进一步来看一下机器学习,什么是机器学习,能不能用一句话来概括?

我们用一个脱离具体算法的视角来看:机器学习就是一套计算机机器利用数据来学习规则/映射关系的固定算法/方法。每一种机器用来从数据学习规则的方法,我们都可以视为一种机器学习算法,而机器学习最初的发展是由统计学习方法支撑的,所以很多时候机器学习(除开深度学习之外)和统计学习基本是等同的。

数据科学数据分析的概念可以大概解释如下:

对于统计学习机器学习,深度学习的一些区别和性质,我们可以大体介绍如下:

Part 2 机器学习的整体学习流程

在对于机器学习的名词基本概念有了理解后,我们来介绍一下机器学习的整体学习流程,我们可以把机器学习分为三个板块,数学基础,机器学习算法和编程实践。

但大家需要注意的是,三个版本并非承接关系,也就是说并非学完了数学才能学算法,学了算法才能编程实践——这也是极其不推荐的路径,除非本身是数学系的同学或者今后期望进行相关方面理论研究的同学,否则这条路径是很不友好的。

举个例子,我们其实可以先了解相关算法的概念和应用的方面然后直接学编程实践,在实践过程中学习理论,不清楚的理论知识再补充相应的数学基础,或者先学习相关机器学习算法理论,然后过程中进行实践和相关数学基础补充。

所以,可以把三者视为相互关联的,数学基础有助于我们更好的理解机器学习算法,而对于机器学习算法的理解能指导我们更好第进行编程实践。

数学基础部分

我们首先需要的是基础数学的相关知识,但这部分知识并非我们所有的知识点都会在机器学习中运用到,例如我们一般运用到的是微积分中的导数,线性代数中的矩阵计算,概率论中的全概率公式,条件概率等。当大家有了这些基础知识后就可以去看机器学习的相关算法理论了。

在学习算法理论的同时再进一步补充相关知识,例如决策树,优化方法等就涉及到的信息论中的信息熵,最优化中的梯度下降法,SVM涉及到对偶问题,KKT条件等。

一般机器学习算法理论的数学基础学习到基础数学衍生这一层就可以了,而如果大家有兴趣涉猎机器学习理论的研究,例如可学性,复杂度,泛化性,稳定性等的研究或者变分方法,随机分析方法等相关研究,那大家就需要学习进阶的相关知识了。

机器学习算法部分

对于机器学习算法部分,我们可以把整体的机器学习算法分为传统机器学习部分和深度学习部分,两个部分可以独立的学习,而传统机器学习部分,我们又可以分为多个模型,每个部分也可以单独学习,例如可以学习完最小二乘方法后学习逻辑回归。每个部分都是相对较为独立的。

对于深度学习领域,一般是先学习机器学习的基础网络ANN, CNN, RNN,然后结合一个具体的领域深入研究的。

编程实践部分

对于编程实践部分,对于机器学习的实践来说,个人认为现在Python是最容易上手和对于机器学习的相关学习支持最好的编程语言,大家可以先从python的基础语法入门,了解一些Numpy,Pandas的常规函数,然后学习scikit-learn机器学习算法框架,而对于深度学习部分可以从keras入门,然后在后续的学习中转移到另外的框架。

在学习过程中也建议大家边学习边实践,然后专心学1-2个系统的资料和书籍就好,一点一点学习,不断补充自己的知识体系。

Part 3 机器学习的知识体系

大家对于机器学习有一定的学习后就要形成自己的相关学习体系,同之前的我也把整体的学习体系分为了三部分,机器学习理论,机器学习算法和机器学习实践,对于各个部分,我也列出了推荐和Datawhale团队在相应部分做的项目实践(文字版课程链接见下方),希望能有助于大家的学习。

学习资料链接:

  • 钥匙书(机器学习理论导引补充):https://github.com/datawhalechina/key-book

  • 南瓜书(周志华西瓜书详细解读补充):https://github.com/datawhalechina/pumpkin-book

  • Easy-RL(深度强化学习教程):https://github.com/datawhalechina/easy-rl

  • LeeML-Notes(李宏毅老师-机器学习课程笔记):https://github.com/datawhalechina/leeml-notes

整理不易,三连

机器学习的学习经验总结!相关推荐

  1. 【机器学习】机器学习的学习经验总结!

    作者:王茂霖,华中科技大学,Datawhale成员 本文分享了机器学习概念,学习路线和知识体系,希望帮助大家更好地入门机器学习. Part 1 机器学习相关概念 现如今,关于人工智能(AI)领域出现了 ...

  2. 一些真诚的学习经验和生活感悟

    学习经验 首先分享一下自己在学习技术的过程中的一些经验啦,这些也是自己在学习的过程中慢慢总结出来的,希望对大家有所启发. 持续学习 当前互联网发展太快了,我们可以发现现在很多技术更迭太快.比如说前端吧 ...

  3. 深圳内推 | 华为诺亚方舟实验室招聘机器学习/深度学习算法实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 华为 华为诺亚方舟实验室是世界领先的工业实验室,在深圳.香港.北京.上海. ...

  4. 机器学习入门学习资源

    机器学习入门学习资源 [转载请注明出处]http://blog.csdn.net/guyuealian/article/details/51471085 这是一篇很难写的文章,因为我希望这篇文章能对学 ...

  5. 机器学习 深度学习 ai_人工智能,机器学习,深度学习-特征和差异

    机器学习 深度学习 ai Artificial Intelligence (AI) will and is currently taking over an important role in our ...

  6. 机器学习入门学习资料推荐

    今天介绍一些机器学习的学习资料,主要是分为以下几个方面的内容: 编程语言:实现机器学习,主要是介绍 Python 方面的语言: 书籍:看书通常是入门的一种方法,比较适合自律性强的同学: 视频:入门的第 ...

  7. 吴恩达《机器学习》学习笔记二——单变量线性回归

    吴恩达<机器学习>学习笔记二--单变量线性回归 一. 模型描述 二. 代价函数 1.代价函数和目标函数的引出 2.代价函数的理解(单变量) 3.代价函数的理解(两个参数) 三. 梯度下降- ...

  8. 吴恩达《机器学习》学习笔记一——初识机器学习

    吴恩达<机器学习>学习笔记一 一. 什么是机器学习? 二.监督学习 三.无监督学习 初识机器学习 这是个人学习吴恩达<机器学习>课程的一些笔记,供自己和大家学习提升.第一篇内容 ...

  9. CV好文推荐+迁移学习经验分享

    前几日,52CV分享了最近一本新出的书<深度学习500问>中迁移学习相关的内容:有故事.有实践,谈一谈深度迁移学习方法的基本思路,并举办了以"论文推荐+经验分享"赠送这 ...

最新文章

  1. python画数组曲线_python – 在matplotlib中如何填充由两组不同数组定义的两条曲线?...
  2. mysql中int(16)_MySQL中int(M)和tinyint(M)数值类型中M值的意义
  3. ftp服务器收集文件,ftp服务器收集文件
  4. 2021年国庆节旅游数据报告
  5. 毕设日志——tensorboardX无法连接的问题
  6. 3804. 构造字符串-AcWing题库
  7. spring整合SpringMVC Controller 和 Struts2 Action控制层Bean的默认作用域
  8. 程序设计实践——第二章
  9. android 实现页面跳转代码,Android 实现页面跳转
  10. 多传感器融合方法综述
  11. 《超越宝典汽配汽修管理系统——“美容管理”模块》项目研发阶段性总结
  12. 自旋锁学习系列(2):TAS锁
  13. PostgreSQL的全文检索(一)
  14. java导出excel_Java使用poi组件导出Excel格式数据
  15. HTML之基本布局设计之三栏式、两栏式设计
  16. Clouda开发笔记
  17. Android深入浅出系列课程---Lesson7 LLY110426_Android系统启动
  18. Linux 服务具体解释
  19. Django SVG 名字空间
  20. handle与HWND的差别

热门文章

  1. 超详细的k8s对接ceph RBD存储
  2. 论文笔记——扩散卷积循环神经网络进行交通预测
  3. win10 / linux计划任务
  4. 计算机图形学原理及实践学习笔记第一章
  5. OC xcode 两个view重叠,先后层次关系的调整
  6. linux系统宝塔安装nodejs,node安装,nodejs安装,Windows nodejs安装,Linux nodejs安装
  7. 禁用和启用input元素
  8. CentOS操作系统安装BT宝塔面板
  9. redirect-重定向
  10. 办公软件小技巧:Excel表格自动排序