点击上方“Python高校”,关注

文末干货立马到手

机器之心报道

算法公式挺费神,机器学习太伤人。任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到。但其实,如果有通俗易懂的图解,理解机器学习的原理就会非常容易。本文整理了一篇博客文章的内容,读者可根据这些图理解看似高深的机器学习算法。

机器学习这个主题已经很普遍了,每个人都在谈论它,但很少有人能够透彻地了解它。当前网络上的一些机器学习文章晦涩难懂,理论性太强,或者通篇云里雾里地介绍人工智能、数据科学的魔力以及未来的工作等。

所以呢,本文作者 vas3k 通过简洁的语言和清晰明了的图示内容,使得读者能够更容易地理解机器学习。抛却了晦涩难懂的理论介绍,文中侧重于机器学习中的实际问题、行之有效的解决方案和通俗易懂的理论。无论你是程序员还是管理者,本文都适合你。

AI 的范畴

AI 到底它包含了哪些领域,它与各种技术名词之间的关系又是什么样的?其实我们会有多种判断方式,AI 范畴的划分也不会是唯一的,例如最「常见」的认识可能如下图所示。

你可能会认为:

  • 人工智能是个完整的知识领域,类似于生物学或者是化学;

  • 机器学习是人工智能中非常重要的一部分,但并不是唯一一个部分;

  • 神经网络是机器学习的一种,现在非常受欢迎,但依然有其他优秀的算法;

但是,难道深度学习都是神经网络吗?明显并不一定是,例如周志华老师的深度森林,它就是第一个基于不可微构件的深度学习模型。因此,更科学的划分可能是下图花书中的这种:

机器学习下面应该是表示学习,即概括了所有使用机器学习挖掘表示本身的方法。相比传统 ML 需要手动设计数据特征,这类方法能自己学习好用的数据特征。整个深度学习也是一种表示学习,通过一层层模型从简单表示构建复杂表示。

机器学习路线图

如果你比较懒,那这有一张完整的技术路线图供你参考。

按照现阶段主流分类来看,机器学习主要分为四类:

  • 经典机器学习;

  • 强化学习;

  • 神经网络和深度学习;

  • 集成方法;

经典机器学习

经典机器学习经常被划分为两类:监督型学习和非监督型学习。

监督学习

在分类中,模型总是需要一个导师,即对应特征的标注,这样的话机器就可以基于这些标注学习进行进一步分类。万事皆可分类,基于兴趣去分类用户、基于语言和主题分类文章、基于类型而分类音乐以及基于关键词分类电子邮件。

而在垃圾邮件过滤中,朴素贝叶斯算法得到了极其广泛的应用。事实上,朴素贝叶斯曾被认为是最优雅、最实用的算法。

支持向量机 (SVM) 是最流行的经典分类方法。也是被用来对现有的一切事物进行分类: 照片中的植物外观,文件等等等。支持向量机背后的思路也很简单,以下图为例,它试图在数据点之间画出两条边距最大的线。

监督学习——回归

回归基本上是分类,但预测的标的是一个数字而不是类别。例如按里程计算的汽车价格,按时间计算的交通量,按公司增长计算出市场需求量等。当所预测的事物是依赖于时间时,回归是非常合适的选择。

无监督学习

无监督学习是 90 年代才被发明出来的,可以这么去描述它「根据未知特征对目标进行分割,而由机器去选择最佳方式。」

无监督学习——聚类

聚类是一种没有预先定义类的分类。比如当你不记得你所有的颜色时,把袜子按颜色分类一样。聚类算法试图通过某些特征从而找到相似的对象并将它们合并到一个聚类中。

无监督学习——降维

「将特定的特征组合成更高级的特性」

人们在使用抽象的东西总是比使用零碎的特征更具有方便性。举个例子,将所有长着三角形的耳朵、长鼻子和大尾巴的狗合并成一个很好的抽象概念——「牧羊犬」。

再比如有关科技的文章中拥有更多科技术语,而政治新闻里最多的是政客的名字。假如我们要将这些具有特性的单词以及文章组成一个新的特征,以保持其潜在关联度,SVD 便是个不错的选择。

无监督学习——关联规则学习

「在订单流中分析出特征模式」

包括分析购物车,自动化营销策略等。举个例子,顾客拿着六瓶啤酒走向收银台,在其路上是否该放些花生?如果放了,这些顾客多久会来买一次?如果啤酒花生是绝配,那还有其他什么事物也可进行这样的搭配呢?

现实生活中,每个大型零售商都有它们自己的专用解决方案,而当中技术水平最高的要数那些「推荐系统」。

集成方法

「团结就是力量」,这句老话很好地表达了机器学习领域中「集成方法」的基本思想。在集成方法中,我们通常会训练多个「弱模型」,以期待能组合成为一个强大的方法。像各种经典 ML 竞赛中,差不多效果最好的那一拨,如梯度提升树、随机森林等都属于集成方法。

一般而言集成方法的「组合方式」主要可以分为三种:Stacking、Bagging、Boosting。

如下图所示,Stacking 通常考虑的是异质弱学习器,弱学习器可以先并行地训练,而后通过一个「元模型」将它们组合起来,根据不同弱模型的预测结果输出一个最终的预测结果。

Bagging 方法通常考虑的是同质弱学习器,相互独立地并行学习这些弱学习器,并按照某种确定性的平均过程将它们组合起来。假设所有弱学习器都是决策树模型,那么这样做出来的 Bagging 就是随机森林。

Boosting 方法通常考虑的也是同质弱学习器,只不过它的思想是「分而治之」。它以一种高度自适应的方法顺序地学习这些弱学习器,且后续弱模型重点学习上一个弱模型误分类的数据。

这就相当于不同的弱分类器,专注于部分数据,达到「分而治之」的效果。如下所示,Boosting 就是以串行组合不同模型的范式。大名鼎鼎的 XGBoost、LightGBM 这些库或算法,都采用的 Boosting 方法。

现在,从朴素贝叶斯到 Boosting 方法,经典机器学习的主要分支已经具备了。如果读者希望有一个更系统与详细地了解,李航老师的《统计学习方法》与周志华老师的《机器学习》是最好的两本中文教程。

当然,在这篇博客中,作者还介绍了强化学习与深度学习等等,内容非常适合对人工智能感兴趣且非相关专业的读者,加上形象的配图,算得上是篇非常不错的科普文。如果你对这种简单易懂的叙述方式感兴趣的话,可以去博客上详细阅读。

参考链接:https://vas3k.com/blog/machine_learning/

来和小伙伴们一起向上生长呀!扫描下方二维码,添加Gao微信,可领 Python和AI 学习大礼包,想发推文、广告、砍价小程序的敬请绕道!一定记得备注「交流学习」。
????长按识别,添加微信(添加人数较多,会自动通过)
推荐:
开源库
Python 开发者必知的 11 个 Python GUI 库10款 Web开发最佳的 Python 框架推荐 GitHub 上100天学习 Python的开源项目Python绘图还在用Matplotlib?out了 !发现一款手绘可视化神器!面试
我用  Python 爬了天猫内衣店的数据Python爬完数据后,我终于买车不用坐引擎盖哭啦1年工作经验,拿下今日头条 Python 开发面经分享!
Python 面试中 8 个必考问题面试 4 个月,最终入职微软!
10 家公司 Python 面试题总结面试了9家公司,拿到5份Offer
面试Python怕? 你想要的315道题都在这了
如何拿到半数面试公司Offer——我的Python求职之路学习路线
基于TensorFlow 2.0的中文深度学习开源书来了!GitHub趋势日榜第一,斩获2K+星微软官方上线了Python 教程,7个章节就把Python说通了
最全 14 张思维导图:教你构建 Python 编程的核心知识体系  Python 从入门到精通:一个月就够了!  24招加速你的Python,超级实用!即学即用的 30 段 Python 非常实用的代码工具
最靠谱的Pycharm 汉化安装+ 破解详细教程!
Python数据分析、挖掘常用工具Python 最强 IDE 详细使用指南!一款 Python 自动抢票神器,收藏起来回家不愁!实践和数据分析
Python 开发植物大战僵尸游戏用 Python 来找合适的妹子一键分析你上网行为,看你是在认真工作还是摸鱼Python给照片换底色,基于opencv模块
10个经典的小技巧:快速用 Python 进行数据分析
使用 Python 进行微信好友分析
爬虫
我给曾经暗恋的初中女同学,用Python实现了她飞机上刷抖音
为了能早点买房,我用 Python 预测房价走势!
被女朋友三番五次拉黑后,我用 Python 写了个“舔狗”必备神器
谁偷偷删了你的微信?别慌!Python 揪出来为了给女友挑合适的内衣,我用  Python 爬了天猫内衣店的数据Python爬完数据后,我终于买车不用坐引擎盖哭啦
这里除了干货一无所有人生苦短,我选在看

图解机器学习:人人都能懂的算法原理相关推荐

  1. 图解机器学习:人人都能懂的算法原理(附链接)

    来源:机器之心 本文约2400字,建议阅读5分钟 本文整理了一篇博客文章的内容,读者可根据这些图理解看似高深的机器学习算法. 标签:机器学习 算法公式挺费神,机器学习太伤人.任何一个刚入门机器学习的人 ...

  2. 【图解机器学习】人人都能懂的算法原理

    简介: 算法公式挺费神,机器学习太伤人.任何一个刚入门机器学习的人都会被复杂的公式和晦涩难懂的术语吓到.但其实,如果有通俗易懂的图解,理解机器学习的原理就会非常容易.本文整理了一篇博客文章的内容,读者 ...

  3. 人人都能懂的图灵机原理

    人人都能懂的图灵机原理 图灵机是一个计算模型,最早用来解决判定一个问题到底可不可解,那么它是如何判定的呢? 在本篇文章开始之前,我们先来看一段视频: https://www.zhihu.com/zvi ...

  4. 这8个人人都该懂的电脑技巧,你都知道哪些?

    相信大家对电脑都特别感兴趣,其实玩电脑也是有很多技巧的,下面这8个人人都该懂的电脑技巧,你都知道哪些? 1.一键锁定屏幕 快捷键:[Win+L] 我们在使用电脑的时候,如果有事需要离开一会,但是又担心 ...

  5. 机器学习:朴素贝叶斯模型算法原理(含实战案例)

    机器学习:朴素贝叶斯模型算法原理 作者:i阿极 作者简介:Python领域新星作者.多项比赛获奖者:博主个人首页

  6. 为什么人人都需要懂一点高阶(中台)产品思维

    以下文章来源于三爷茶馆 ,作者三爷 小编说:当下的互联网产业已经进入了一个相对成熟的阶段,此时决定企业竞争力的关键因素已变成效率.因此如何用最低的成本完成最多的产出就成为互联网公司的新目标,而中台战略 ...

  7. 人人都能懂的量子力学

    源自: https://www.sohu.com/a/236628909_418353 你是否曾被量子物理里面那些稀奇古怪的思想搞得神经错乱? 首先,不要惊慌.神经错乱的不只你一个.正如具有传奇色彩的 ...

  8. 【机器学习】5:谱聚类算法原理介绍

    前言:学习谱聚类,最好有一些图论.矩阵分解(SVD)方面的知识,这样会更加有利于谱聚类的学习.当然,谱聚类理解起来并不困难,实际操作也大多是谱聚类+K-means聚类联合使用的. –--------- ...

  9. 这么讲音频算法,真是人人都能懂

    这一章开始介绍一些算法相关的内容.前面有几章对播放强调较多,这期本来想写录音方面的内容.但是普通的麦克风电路主要是模拟电路,独立做一章来写觉得内容有点少,所以会在其他章节穿插介绍.至于MEMS麦克风, ...

  10. 为什么人人都该懂点LLVM

    只要你和程序打交道,了解编译器架构就会令你受益无穷--无论是分析程序效率,还是模拟新的处理器和操作系统.通过本文介绍,即使你对编译器原本一知半解,也能开始用LLVM,来完成有意思的工作. LLVM是什 ...

最新文章

  1. java httpurl_Java HttpURLConnection使用方法详解
  2. php动态数组的存储过程,PHP数组作为存储过程的输入
  3. window下删除无效的区域通知图标
  4. Windows 10:开机显示C:\WINDOWS\system32\config\systemprofile\Desktop不可用 的解决方法
  5. laravel构造函数和中间件执行顺序问题
  6. 最简单的php导出excel文件方法
  7. MacBook M1苹果电脑安装 SVN 以及 简单使用SVN
  8. 阿里云抢月饼代码实验,自己写着玩的
  9. linux 服务器时钟同步设置
  10. Java并发练习:exchange简单使用
  11. .NET报表设计器ActiveReports入门:操作界面详解
  12. 五大电子邮件的营销方法,教你提高客户的回头率!
  13. 2020牛客暑期多校训练营Groundhog and Gaming Time(数学期望,线段树,逆元)
  14. 融云直播 SDK 2.0 上线,轻松获得视频直播能力
  15. linux去除内容重复行,Linux删除文本中的重复行 - 米扑博客
  16. python爬虫抓收费图片_简单的抓取淘宝图片的Python爬虫
  17. join()方法的作用
  18. 简单的Django系统模板
  19. 关于IOS的Autolayout特性的理解以及使用
  20. 《龙武》9.15正式上线链游玩家平台 | 再续仙侠、血雨江湖

热门文章

  1. 南邮物联网学院计算机考研,研友分享南京邮电大学物联网学院两个专业的一点看法...
  2. 《惢客创业日记》2019.05.07(周二)永远匿名的红颜知己(四)
  3. python正态分布代码_Tests for normality正态分布检验(python代码实现)
  4. 性能测试流程(超级详细)
  5. WTEditor(windows窗口标题栏文字修改工具)绿色单文件版V1.0 | windows窗口标题文字怎么修改?
  6. 【工具】-13UML泳道图
  7. 基于Python+Opencv的银行卡号识别系统(附完整代码)
  8. excel 制作二维码
  9. 插桩 java_“插桩”式技术
  10. python 如何判断一个三位数是不是水仙花数