点击上方↑↑↑蓝字关注我们~

2019 Python开发者日」,购票请扫码咨询 ↑↑↑

作者 | 武博士、宋知达、袁雪瑶、聂文韬

来源 | 大鱼AI(ID:DayuAI-Founder)

人类需要经过各式各样的学习才有办法认识这个世界。

当小朋友第一次看到猫后,可能会问爸爸妈妈,这个胖乎乎有胡子的可爱动物是什么。当父母告诉她:这就是猫的时候,她就会理解到,这种生物就是猫。 以后她碰到各种各样的猫的时候,都能认得出来。

计算机也是一样,在学习的过程中,可以自动找出“猫的具体特征”,以及形成自己一套识别方法,即使没有遇到的问题也可以按照原先的思路去解决。

但是,和人的学习略有不同,计算机是通过从大量的数据中,找到规律,进行预测和分类,达到即使没有遇到过的同类型的问题,它也能解决!

机器学习,顾名思义,机器可以像孩子一样学习。机器不再是简单运行人类程序的工具,它可以自己去学习!变得更加聪明!

机器学习大致上可以分为:监督学习、非监督学习、强化学习三类。 接下来我们依次说明这三类机器学习。

一、监督学习

在监督学习中,我们会将所有的数据和配对的答案都输入计算机,让计算机去学习这些数据的特征规则和答案之间的联系。

在监督学习中:

  • 带有答案的数据是必须的,因为计算机在学习(训练)的过程中,不断的在对答案,修正自己的问题。

  • 带有答案的数据的数量是巨大的,计算机没有我们想象中聪明,它需要在每次的错误中寻找自己的不足。目前少样本学习或者举一反三,还是只有人类能做到。

监督学习大致可以分为分类问题和回归问题。

(1) 分类问题 

监督学习中,我们一直在举识别猫的例子,其实这是一种分类的过程,计算机可以将图片进行分类。分类不仅仅局限于图片,我们对于文字内容也可以进行分类哦。

很困扰我们的垃圾邮件就是可以通过计算机识别文字后,进行分类。

计算机垃圾邮件的分类可不是向我们想象中那样,直接告诉你答案哦,它会进行垃圾邮件和正常邮件的概率标注。 比如这封邮件里面有大量的“”折扣、促销“”的字眼,是垃圾邮件的概率92%。我们人类按照计算机具体给出的概率标注进行具体的区分。

除了图片、文字,计算机还可以区分声音哦。

(2) 回归问题 

一提到回归问题,好多小伙伴就会感到困惑,什么是回归?回到那儿呀?归到哪儿呀?

其实,回归问题就是预测问题,只不过,在机器学习领域,把它称作回归。

大家熟悉的口袋妖怪-宝可梦的攻击力,我们可以从历史数据中进行预测的哦。

回归就是从一堆数据中,找到能够准确找到这对数据的趋势线,得出一个具体数值的过程。

分类和回归具体的区别:

我们可以将天气预测为晴天、阴天、雨天、雪天,这就是分类的过程。但是如果预测具体的天气温度,就是回归。

(3) 过度学习和懒散学习(过拟合问题和欠拟合问题)

我们会不会这么想:是不是给计算机给的数据越多,他就能越好的进行分类和回归呢。答案是“”NO!“”

计算机过度学习在学术上称为“过拟合” !

我举一个自己特别痛苦的例子:在我上初中的时候,有一天老师通知我们说过一段时间我们要进行数学测验,大家好好复习。 我就把课后题全部都做了3遍,心想,这次我的成绩肯定会很好! 但是,考试的时候,卷子发下来,发现是数学竞赛,我竟无语凝噎...

但是,话说回来,如果连课后题都懒得会做,考试就无从谈起了。 这就是“”懒散学习“”,得到结果恐怕不只是眼泪,可能还有肉体的摧残。 这就是“欠拟合“。

写到这里,不禁对咱们中国儒家文化中的“”中庸之道“”,暗自佩服!

二、非监督学习

世界中的许多问题,都不是监督学习能够解决的,因为好多连人类都不知道答案。

机器学习中的非监督学习,就是让计算机分析一堆不知道答案的数据,然后找出结构和规则的过程。

举例来说,电商对客户分类的过程,就是一种非监督学习。刚开始我们没有办法为客户贴上准确的标签,但是渐渐的,从不同客户群体购买记录、浏览记录中,就可以区分出一些共性的特征,把他们聚类。 我们经常收到的商品推荐服务,就是电商给某一类标签用户推荐的他们可能喜欢的商品。

三、强化学习

人类会在成功与失败的教训中,学习到如何才能顺利达到目的。

我想大多数同学都有小时候家长不在家的时候,有过玩游戏和写作业之间的纠结。如果玩游戏,现在是爽到了,但是如果爸爸妈妈突然回来... 如果明天老师检查.... 虽然头悬两把利剑,但是很多同学还是拿起来手柄和键盘。

写作业虽然现在很痛苦,但是如果爸妈突然回家,如果考试成绩很好,好处大大滴。

想必是只有经过了痛苦的经历,很多同学痛定思痛,还是拿起了笔,写作业。

同样的,计算机可以由尝试错误的方式,经历多次失败和成功,然后学习到规律。失败和成功完全就是以奖励的多少决定。 这就是强化学习。

让我们大众熟悉人工智能的AlphaGo ,基本原理就是强化学习。

(未完待续……)

(本文为 AI大本营转载文章,转载请联系原作者

精彩推荐

「2019 Python开发者日」演讲议题全揭晓!这一次我们依然“只讲技术,拒绝空谈”10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节,为开发者们带来更多深度实战机会。更多详细信息请咨询13581782348(微信同号)。

推荐阅读:

  • 技术头条

  • 收藏指数爆表!CVPR 2018-2019几十篇优质论文解读大礼包! | 技术头条

  • 分析11年21部漫威电影,一览导演、主演、口碑票房最佳......

  • 靠找Bug赚了6,700,000元!他凭什么?

  • 30位90后霸榜! 福布斯: 比你年轻、比你有颜、比你有才华, 就是他们了!

  • 程序员深夜逆行被拦后崩溃欲自杀:老板在催我!女朋友在催我!

  • 微软 CTO 韦青:“程序员 35 岁就被淘汰”是个伪概念 | 人物志

  • OpenStack已死?恐怕你想多了 | 技术头条

❤点击“阅读原文”,查看历史精彩文章。

宝宝都能看懂的机器学习世界相关推荐

  1. 春节充电 | 文科生都能看懂的机器学习教程:梯度下降、线性回归、逻辑回归(附动图解释)...

    来源:新智元 本文约4200字,建议阅读10+分钟. 本文浅显易懂的方式讲解机器学习,力求让没有理科背景的读者都能看懂. [ 导读 ]虽然在Coursera.MIT.UC伯克利上有很多机器学习的课程, ...

  2. 文科生都能看懂的机器学习教程:梯度下降、线性回归、逻辑回归

    来源:新智元 本文约4200字,建议阅读10+分钟. 本文浅显易懂的方式讲解机器学习,力求让没有理科背景的读者都能看懂. [ 导读 ]虽然在Coursera.MIT.UC伯克利上有很多机器学习的课程, ...

  3. 语言线性拟合线对称_文科生都能看懂的机器学习教程:梯度下降、线性回归、逻辑回归...

    [新智元导读]虽然在Coursera.MIT.UC伯克利上有很多机器学习的课程,包括吴恩达等专家课程已非常经典,但都是面向有一定理科背景的专业人士.本文试图将机器学习这本深奥的课程,以更加浅显易懂的方 ...

  4. 人人都能看懂的机器学习!3个案例详解聚类、回归、分类算法

    导读:机器是怎样学习的,都学到了什么?人类又是怎样教会机器学习的?本文通过案例给你讲清楚各类算法的原理和应用. 机器学习,一言以蔽之就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预 ...

  5. 随机森林的特征 是放回抽样么_机器学习超详细实践攻略(10):随机森林算法详解及小白都能看懂的调参指南...

    一.什么是随机森林 前面我们已经介绍了决策树的基本原理和使用.但是决策树有一个很大的缺陷:因为决策树会非常细致地划分样本,如果决策树分得太多细致,会导致其在训练集上出现过拟合,而如果决策树粗略地划分样 ...

  6. 计算机视觉:让冰冷的机器看懂这个多彩的世界

    计算机视觉:让冰冷的机器看懂这个多彩的世界 作者 微软亚洲研究院首席研究员 孙剑 2015年2月10日   从茹毛饮血的蛮荒,到钢筋水泥的城市,人类逐步将自身能力投射到计算机上.无论是计算能力,还是记 ...

  7. 【图解】连狗子都能看懂的Python基础总结(二)什么是库、包、模块?

    [图解]连狗子都能看懂的Python基础总结!(二)什么是库.包.模块? 本章内容 什么是模块? 什么是包? 什么是库? 什么是标准库和第三方库? 上次,我们解释了"变量".&qu ...

  8. 人人都能看懂的EM算法推导

    作者丨August@知乎(已授权) 来源丨https://zhuanlan.zhihu.com/p/36331115 编辑丨极市平台 估计有很多入门机器学习的同学在看到EM算法的时候会有种种疑惑:EM ...

  9. em算法 实例 正态分布_人人都能看懂的EM算法推导

    ↑ 点击蓝字 关注极市平台作者丨August@知乎(已授权)来源丨https://zhuanlan.zhihu.com/p/36331115编辑丨极市平台 极市导读 EM算法到底是什么,公式推导怎么去 ...

最新文章

  1. 将论文中的所有参考文献编号批量上标化
  2. win8音频服务器未响应,大神为你详解win8系统右键点击文件提示“未响应”的解决教程...
  3. 阿里云性能测试服务 PTS 新面貌 - 压测协议、施压能力全新升级
  4. Linux基本信号的使用
  5. Spring 基于Java的Bean声明
  6. 自然语言处理(2)-信息论基础
  7. 红袖添香唯美中国风PPT模板
  8. Docker,使生信分析更简单、可重复
  9. 滴滴顺风车回归倒计时!
  10. 【视频专访】他用3年时间,从0开始打造专属大学生的IT教育品牌,只为将他们送入国内最顶尖IT名企。...
  11. html在线比对工具,在线文本对比工具(mergely示例)
  12. echarts2的一个地图demo
  13. 笔记本电脑拔掉电源屏幕会黑一下怎么办
  14. linux tomcat bin目录,Tomcat bin目录详解-bin文件怎么打开
  15. QT VS2019 OpenCV yolo4 摄像头识别人脸
  16. 头同尾合十的算法_头同尾合十的计算规律
  17. python四级是什么水平_大学英语四级相当于高考什么水平
  18. 盘一盘 这些深度学习框架够你用一年
  19. php邮件服务器搭建,php发送邮件,不需要搭建邮件服务器方法
  20. 软工大作业·倾物语(三)

热门文章

  1. 2004-10-26+ 用户输入的安全问题
  2. Spring常见面试题及答案汇总1000道(春招+秋招+社招)
  3. 2018-3-20论文(一种新的群体智能算法--狼群算法)笔记一(引言中提到的的一些智能算法,以及自己的感想)
  4. 数值分析第三次作业-常微分方程的数值解法
  5. Boring counting HDU - 3518 (后缀数组)
  6. Python 之 杂谈(迭代器iter)、偏函数
  7. 【转】Linux思维导图
  8. 鸽巢原理(The Pigeonhole Principle)(抽屉原理)
  9. 最先进的开源游戏引擎KlayGE 3.12.0发布
  10. 使用 SAX 解析器简化文档处理程序的编写