作者:王丰
链接:https://www.zhihu.com/question/23194489/answer/25028661
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

这个问题可以回答得很简单:是否有监督(supervised),就看输入数据是否有标签(label)。输入数据有标签,则为有监督学习,没标签则为无监督学习。

但根据知乎惯例,答案还是要继续扩展的。

首先看什么是学习(learning)?一个成语就可概括:举一反三。此处以高考为例,高考的题目在上考场前我们未必做过,但在高中三年我们做过很多很多题目,懂解题方法,因此考场上面对陌生问题也可以算出答案。机器学习的思路也类似:我们能不能利用一些训练数据(已经做过的题),使机器能够利用它们(解题方法)分析未知数据(高考的题目)?

最简单也最普遍的一类机器学习算法就是分类(classification)。对于分类,输入的训练数据有特征(feature),有标签(label)。所谓的学习,其本质就是找到特征和标签间的关系(mapping)。这样当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据标签。

在上述的分类过程中,如果所有训练数据都有标签,则为有监督学习(supervised learning)。如果数据没有标签,显然就是无监督学习(unsupervised learning)了,也即聚类(clustering)。

目前分类算法的效果还是不错的,但相对来讲,聚类算法就有些惨不忍睹了。确实,无监督学习本身的特点使其难以得到如分类一样近乎完美的结果。这也正如我们在高中做题,答案(标签)是非常重要的,假设两个完全相同的人进入高中,一个正常学习,另一人做的所有题目都没有答案,那么想必第一个人高考会发挥更好,第二个人会发疯。

这时各位可能要问,既然分类如此之好,聚类如此之不靠谱,那为何我们还可以容忍聚类的存在?因为在实际应用中,标签的获取常常需要极大的人工工作量,有时甚至非常困难。例如在自然语言处理(NLP)中,Penn Chinese Treebank在2年里只完成了4000句话的标签……
<img src="https://pic1.zhimg.com/4b92820e4df9ab2ed4d56243d981cdcc_b.jpg" data-rawwidth="302" data-rawheight="237" class="content_image" width="302">

这时有人可能会想,难道有监督学习和无监督学习就是非黑即白的关系吗?有没有灰呢?Good idea。灰是存在的。二者的中间带就是半监督学习(semi-supervised learning)。对于半监督学习,其训练数据的一部分是有标签的,另一部分没有标签,而没标签数据的数量常常极大于有标签数据数量(这也是符合现实情况的)。隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果。(此处大量忽略细节)

因此,learning家族的整体构造是这样的:
有监督学习(分类,回归)

半监督学习(分类,回归),transductive learning(分类,回归)

半监督聚类(有标签数据的标签不是确定的,类似于:肯定不是xxx,很可能是yyy)

无监督学习(聚类)

参考文献:
[1] 各种教材
[2] Semi-Supervised Learning Tutorial, http://pages.cs.wisc.edu/~jerryzhu/pub/sslicml07.pdf‎

什么是无监督学习(监督学习,半监督学习,无监督聚类)?相关推荐

  1. 【机器学习 基本概念】监督学习、无监督学习、半监督学习与强化学习

    本文转载自:一文读懂监督学习.无监督学习.半监督学习与强化学习这四种深度学习方式 一般说来,训练深度学习网络的方式主要有四种:监督.无监督.半监督和强化学习.在接下来的文章中,计算机视觉战队将逐个解释 ...

  2. 理解监督学习、无监督学习、半监督学习、强化学习

    目录 监督学习 回归问题 分类问题 无监督学习 半监督学习 强化学习 参考链接 监督学习 监督学习简单来说就是我们给学习算法一个数据集. 这个数据集由"正确答案"组成,然后使用已知 ...

  3. 概念:监督学习、无监督学习与半监督学习

    (此为机器学习随笔之一) 机器学习中的算法,主要有两种:监督学习:半监督学习. 1 .名词 监督学习 : supervised learning 无监督学习 : unsupervised learni ...

  4. 监督学习、无监督学习、半监督学习

    监督学习.无监督学习.半监督学习 监督学习.无监督学习.半监督学习 监督学习 无监督学习 半监督学习 监督学习.无监督学习.半监督学习 监督学习 特点:训练过程中样本都是有标签的. 训练集的每一个数据 ...

  5. AI之强化学习、无监督学习、半监督学习和对抗学习

    1.强化学习 文章目录 1.强化学习 1.1 强化学习原理 1.2 强化学习与监督学习 2.无监督学习 3.半监督学习 4.对抗学习 强化学习(英语:Reinforcement Learning,简称 ...

  6. 监督学习、无监督学习、半监督学习概述

    前言 机器学习分为:监督学习,无监督学习,半监督学习(也可以用hinton所说的强化学习)等. 在这里,主要理解一下监督学习和无监督学习. 监督学习(supervised learning) 从给定的 ...

  7. [云炬python3玩转机器学习笔记] 2-3监督学习、非监督学习、半监督学习和增强学习

    监督学习:给机器的训练数据拥有"标记"或"答案" 主要处理分类.回归问题 k近邻.线性回归和多项式回归 逻辑回归 SVM 决策树和随机森林 非监督学习:给机器的 ...

  8. 机器学习-算法-半监督学习:半监督学习(Semi-supervised Learning)算法

    人工智能-机器学习-算法-半监督学习:半监督学习(Semi-supervised Learning)算法 一.半监督学习算法提出的背景 1.监督学习算法 2.无监督学习算法 3.监督学习的特征选择方法 ...

  9. 监督学习,非监督学习与半监督学习

    监督学习,非监督学习与半监督学习 监督学习非监督学习与半监督学习 监督学习Supervised learning 非监督学习Unsupervised learning 半监督学习Semi-superv ...

  10. 监督学习,非监督学习,半监督学习和增强学习

    分成四类 监督学习,非监督学习,半监督学习和增强学习 监督学习:给机器的训练数据拥有"标记"或者"答案" 监督学习:银行已经积累了一定的客户信息和他们的信用卡的 ...

最新文章

  1. VC控件 TreeCtrl 与 ListCtrl 演示(zz)
  2. 用两个栈(C++)实现插入排序
  3. java安装库源文件_JOGL安装
  4. 转:WF中的跟踪服务(1):Sql跟踪数据库表,视图,存储过程等相关说明
  5. Python的闭包的后期绑定问题
  6. 【文本摘要】BottleSum——文本摘要论文系列解读
  7. junit的命令行测试-Could not find class
  8. 大小端及转换(C++)
  9. Adobe Dreamweaver(DW)安装教程(附安装包下载地址)
  10. 此windows副本不是正版_阳光单职业传奇正版-阳光单职业传奇正版官网版v2.0
  11. 动态规划-击爆气球 Burst Balloons
  12. 智能分析的所见即所得——基于Lambda架构的实时数据引擎
  13. Mesosphere DCOS快速部署手册
  14. “春节游”还准备去海外猎食新鲜?麻烦!家门口明明啥都有!
  15. FF300R08W2P2B11A 汽车用EasyPACK 模块 2 个独立式
  16. BT源代码学习心得(九):客户端源代码分析(图形界面浅析) -- 转贴自 wolfenstein (NeverSayNever)
  17. 做短视频时如何将文字转为语音?分享三个小方法,教你轻松配音
  18. 遥感期刊影响因子(中科院分区)
  19. 程序员的免费编辑器-PsPad (上)
  20. WiFi进妇幼保健院 就诊、娱乐两不误

热门文章

  1. 【SHOI2017】相逢是问候【扩展欧拉定理】【复杂度分析】【线段树】
  2. 蓝桥杯 I.双向排序
  3. Subsequence Pair
  4. 【每日一题】4月6日数码
  5. 【学习笔记】浅谈广义矩阵乘法——动态DP
  6. P2490-[SDOI2011]黑白棋【博弈论,dp】
  7. P3466-[POI2008]KLO-Building blocks【Treap】
  8. jzoj4273-圣章-精灵使的魔法语【线段树】
  9. P1090-合并果子【离散化,队列,时间复杂度O(n)】
  10. C. Minimum Grid Path(思维)