前言

机器学习可以分为两大类:监督学习和无监督学习。
今天介绍机器监督学习和无监督学习。

** 监督学习和无监督学习很好区分:是否有监督(supervised),就看输入数据是否有标签(label),输入数据有标签,则为有监督学习,没标签则为无监督学习。**

举一个简单的例子:你小时候见到了狗和猫两种动物,有人告诉你这个样子的是狗、那个样子的是猫,你学会了辨别,这是监督学习;你小时候见到了狗和猫两种动物,没人告诉你哪个是狗、哪个是猫,但你根据他们样子、体型等特征的不同鉴别出这是两种不同的生物,并对特征归类,这是无监督学习。

监督学习(supervised learning)

监督学习是机器学习中的一种训练方式,是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。
通俗来讲是指我们给算法一个数据集其中包涵了正确的答案·。
特点:既有输入也有结果
监督学习包含回归问题和分类问题。

回归问题
分类问题是指设法预测连续值的属性。

1.回归模型—回归模型用于输出变量为实际值的问题,例如单一的数字、美元、薪水、体重或压力。它最常用于根据先前的观测数据来预测数值。一些比较常见的回归算法包括线性回归、逻辑回归、多项式回归和脊回归。

举个例子(这里借助吴恩达视频的例子):
通过房地产市场的数据,预测一个给定面积的房屋的价格就是一个回归问题。这里我们可以把价格看成是面积的函数,它是一个连续的输出值。 但是,当把上面的问题改为“预测一个给定面积的房屋的价格是否比一个特定的价格高或者低”的时候,这就变成了一个分类问题, 因为此时的输出是‘高’或者‘低’两个离散的值。


##分类问题
分类问题目的预测离散值的输出。

2.分类模型—分类模型用于可以对输出变量进行分类,例如“是”或“否”、“通过”或“失败”。分类模型用于预测数据的类别。现实生活中的例子包括垃圾邮件检测、情绪分析、考试记分卡预测等。

举个例子:
给定医学数据,通过肿瘤的大小来预测该肿瘤是恶性瘤还是良性瘤(课程中给的是乳腺癌的例子),这就是一个分类问题,它的输出是0或者1两个离散的值。(0代表良性,1代表恶性)。

分类问题的输出可以多于两个,比如在该例子中可以有{0,1,2,3}四种输出,分别对应{良性, 第一类肿瘤, 第二类肿瘤, 第三类肿瘤}。下图中上下两个图只是两种画法。第一个是有两个轴,Y轴表示是否是恶性瘤,X轴表示瘤的大小; 第二个是只用一个轴,但是用了不同的标记,用O表示良性瘤,X表示恶性瘤。



在这个例子中特征只有一个,那就是瘤的大小。 有时候也有两个或者多个特征, 例如下图, 有“年龄”和“肿瘤大小”两个特征。(还可以有其他许多特征,如下图右侧所示)

无监督学习

根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习,“监督”的意思可以直观理解为“是否有标注的数据”。

简单来讲就是训练机器使用即未分类也未标记的数据的方法,机器只能自行学习。

无监督学习的特点是,传递给算法的数据在内部结构中非常丰富,而用于训练的目标和奖励非常稀少。无监督学习算法学到的大部分内容必须包括理解数据本身,而不是将这种理解应用于特定任务。

1.聚类是最常见的无监督学习方法之一。聚类的方法包括将未标记的数据组织成类似的组,称为聚类。因此,聚类是相似数据项的集合。此处的主要目标是发现数据点中的相似性,并将相似的数据点分组到一个聚类中。

2.异常检测是识别与大多数数据显著不同的特殊项、事件或观测值的方法。通常在数据中寻找异常或异常值的原因在于它们是可疑的。异常检测常用于银行欺诈和医疗差错检测。

借助图文理解

在无监督学习中,我们基本上不知道结果会是什么样子,但我们可以通过聚类的方式从数据中提取一个特殊的结构。在无监督学习中给定的数据是和监督学习中给定的数据是不一样的。在无监督学习中给定的数据没有任何标签或者说只有同一种标签。如下图所示:

如下图所示,在无监督学习中,我们只是给定了一组数据,我们的目标是发现这组数据中的特殊结构。例如我们使用无监督学习算法会将这组数据分成两个不同的簇,,这样的算法就叫聚类算法。


无监督学习举例

  • 新闻分类

    通过房地产市场的数据,预测一个给定面积的房屋的价格就是一个回归问题。这里我们可以把价格看成是面积的函数,它是一个连续的输出值。 但是,当把上面的问题改为“预测一个给定面积的房屋的价格是否比一个特定的价格高或者低”的时候,这就变成了一个分类问题, 因为此时的输出是‘高’或者‘低’两个离散的值

第一个例子举的是Google News的例子。Google News搜集网上的新闻,并且根据新闻的主题将新闻分成许多簇, 然后将在同一个簇的新闻放在一起。如图中红圈部分都是关于BP Oil Well各种新闻的链接,当打开各个新闻链接的时候,展现的都是关于BP Oil Well的新闻。

  • 根据给定基因将人群分类

如图是DNA数据,对于一组不同的人我们测量他们DNA中对于一个特定基因的表达程度。然后根据测量结果可以用聚类算法将他们分成不同的类型。这就是一种无监督学习, 因为我们只是给定了一些数据,而并不知道哪些是第一种类型的人,哪些是第二种类型的人等等。

接下来提出一个很有趣的问题:

鸡尾酒会问题

鸡尾酒会问题

欢迎一起学习机器学习,文章内容是跟着吴恩达视频写的,后续会继续更新的,一起加油吧!

参考链接:

我的机器学习笔记

机器学习(学习笔记)——监督学习和无监督学习相关推荐

  1. 【吴恩达机器学习】学习笔记——1.5无监督学习

    1 无监督学习:在不知道数据点的含义的情况下,从一个数据集中找出数据点的结构关系. 2 聚类算法:相同属性的数据点会集中分布,聚集在一起,聚类算法将数据集分成不同的聚类.也就是说,机器不知道这些数据点 ...

  2. 吴恩达机器学习 学习笔记 之 一 监督学习和无监督学习

    一. 1-1 welcome 1-2 什么是机器学习--Machine Learning 机器学习尚无明确定义,现有的定义有: (1)Field of study that gives compute ...

  3. 机器学习概念 — 监督学习、无监督学习、半监督学习、强化学习、欠拟合、过拟合、后向传播、损失和优化函数、计算图、正向传播、反向传播

    1. 监督学习和无监督学习 监督学习 ( Supervised Learning ) 和无监督学习 ( Unsupervised Learning ) 是在机器学习中经常被提及的两个重要的学习方法. ...

  4. Coursera机器学习笔记(一) - 监督学习vs无监督学习

    转载 http://daniellaah.github.io/2016/Machine-Learning-Andrew-Ng-My-Notes-Week-1-Introduction.html 一. ...

  5. 【机器学习】机器学习算法模式:区别监督学习、无监督学习、半监督学习、强化学习

    机器学习的三大要素:数据.算法模型.计算. 机器学习最大的用处是通过对历史数据的分析,找出其中的潜在规律,从而对未来进行预测. 数据:目前是大数据时代,各行各业基本上都不缺数据,缺乏的只是从数据当中提 ...

  6. Chapter1:监督学习、无监督学习:AndrewNg吴恩达《机器学习》笔记

    文章目录 Chapter 1 Introduction 1.1 Welcome 1.2 Definition 1.2.1 定义1: --from **Arthur Samuel** 1.2.2 定义2 ...

  7. 机器学习、监督学习、无监督学习、强化学习和深度学习的区别

    机器学习按学习形式主要包括监督学习.半监督学习.无监督学习和强化学习.有监督学习就是根据有标签的数据集学习一个由输入到输出的映射:而无监督学习是学习一个没有标签的数据集,是基于数据之间的相似性进行聚类 ...

  8. 【机器学习 基本概念】监督学习、无监督学习、半监督学习与强化学习

    本文转载自:一文读懂监督学习.无监督学习.半监督学习与强化学习这四种深度学习方式 一般说来,训练深度学习网络的方式主要有四种:监督.无监督.半监督和强化学习.在接下来的文章中,计算机视觉战队将逐个解释 ...

  9. 监督学习和无监督学习_一篇文章区分监督学习、无监督学习和强化学习

    经过之前的一些积累,终于有勇气开始进军机器学习了!说实话,机器学习 这个概念是我入行的最纯粹的原因,包括大学选专业.学习 Python 语言-这些有时间仔细梳理下经历再写,总之这个系列的文章就是我自学 ...

最新文章

  1. 分层设计与领域设计融合架构设计
  2. api 和 C# 里的接口的区别?
  3. sum除以count 和avg 的区别_EXCEL函数之计数COUNT系列
  4. angularjs directive 实例 详解
  5. python11-28笔记(1.6-1.7)
  6. python中列表实现去重使用_Python实现嵌套列表去重方法示例
  7. 十字路口红绿灯plc程序_实例讲解红绿灯PLC程序设计方法
  8. 高通量数据中批次效应的鉴定和处理(三)- 如何设计尽量避免批次影响
  9. CF813E Army Creation
  10. UID 修改 UID 锁死修复
  11. 电脑账户与用户账户编码规则
  12. express 4.x 获取post提交的数据
  13. sql server 连接
  14. 轻松熊喵喵个人笔记 -- java学习路线记录
  15. 实用的chrome插件
  16. 微信小程序实现OCR扫描识别
  17. 第3.1~3.3节《合成孔径雷达成像原理-皮亦鸣》
  18. 儿童节html5小游戏,2016六一儿童节主题班会小游戏大全
  19. android模拟qq进场动画,Android用ViewPager仿QQ实现多页面滑动及动画效果
  20. 解决私有仓库 git 没有权限的问题

热门文章

  1. Python全栈最全学习之路-Python基础(六)
  2. EMC模式如何助力新能源服务商攻坚克难
  3. 社区故事|SmartX 用户社区技术发烧友独家专访
  4. Linux下查找文件
  5. the jre was not found in directory 安装weblogic踩过的坑
  6. 弘辽科技:拼多多礼品包怎么发?如何操作?
  7. R型隔离变压器是如何处理接地电流的呢?
  8. GitHub存储库泄露了API令牌和加密密钥
  9. 碧蓝航线维护服务器时间,《碧蓝航线》关于活动和维护时间的说明 补偿钻石调整建造配方...
  10. 前端和后端交互的一些原规范问题