无监督学习和监督学习是机器学习最基本的两种类型,其他的类似于它们的综合。最常用的无监督学习是从样本数据分布中,按它们的聚集来分类。例如,用一堆新旧不同的人民币硬币的尺寸和重量作为样本的数据,分布聚集在2维空间的几个不同地方。

人们看到了就知道它们是分成几类,依此知识,可以判断送来的硬币类别。机器也可以这样做它通过数据点之间相互距离的计算(K-means),将相近的数据点的聚集按距离自动划分成若干组。得到各组的中心和分布范围后,以此判别新输入硬币所对应的组别。许多事物看来杂乱无章,其实分属不同类别。例如,学生潜力、绘画风格和生物分类等应用对象,只要用足够多的特征属性来描述,就可以把它们区分开。但对于许多特征属性,人类只能抽取能理解其含义的少量特征,很难利用非常多的特征属性来分类,而机器却很容易做到。在人们现在的工作中,也可能应用现成的N维自动分类程序,在已经拥有的数据中发现潜藏的分类。

无监督学习就像无师自通,靠自己领悟,因此效率较差,有些情况则难以做到。有老师教学就会容易得多。监督学习是最广泛成功应用的机器学习,即用我们的知识来标记样本的正确答案,去教机器学会应用。

支持向量机(SVM)就是一种典型的监督学习算法,它是在单层神经网络基础上,采用非线性变换φ将输入的数据向量x映射到特征属性空间,让φ(x)在特征属性空间是线性可分的。它使得线性分类器可以用在非线性分类问题上,不需要明确给出这个非线性变换,它的实现是通过直接构造与特征属性空间中内积相等的“核函数(kernel function)”来简化计算。支持向量机用分段线性函数代替神经元里的Sigmoid作用函数,这样调整间隔分类超平面的参数,就只跟较少的支持点有关了,既可以大大减少计算量,又把计算转化成二次函数在线性约束下求极值的问题。实际应用中,涉及到巨大稀疏矩阵的计算。1998年,微软研究院约翰·帕拉特(John C. Platt)提出的SMO算法,可以高效地处理巨量的变量和样本数据,这使得支持向量机获得广泛的应用。

支持向量机包含单层感知器作为特例,它有清晰的数学理论的支持,能有效地控制训练结果,现在已有许多计算机语言实现的软件包可用。相对于多层神经网络,它所要求的机器资源较少,是非常实用的学习算法。但它要求有应用领域知识的人进行合作,来选取合适的核函数。它已成功地应用在许多分类领域,如文本、图像、蛋白质、垃圾邮件分类和手写体字识别等。

神经网络是多层感知器的网络,对每一层输入都用线性来分类,由于Sigmoid作用函数,每层的输入和输出是个非线性变换,不需要人为设计属性变换,便能通用地实现各种数据的分类。文章开头介绍的就是3层神经网络的一个例子。理论上,3层神经网络可以实现任何分类问题。但随着复杂程度的增加,要求中间隐藏层的神经元数会急剧地增加。每层神经网络实现一个线性分类函数,多层神经网络则实现了多重的复合函数,能大大提高学习功能,用较少的神经元解决复杂的问题。但对于多于3层的神经网络,采用反向传播误差的梯度法来统一训练,较难控制学习的结果,所以兴起深度学习的研究。

有监督学习和无监督学习_机器学习算法之监督学习和无监督学习比较相关推荐

  1. 机器学习系列(4)_机器学习算法一览,应用建议与解决思路

    作者:寒小阳 时间:2016年1月. 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334 声明:版权所有,转载请联系作者并注明出 ...

  2. 算法工程师面试问答_机器学习算法_MachineLearningAlgorithm

    [关于 集成学习]那些你不知道的事 一.动机 不同的模型通常会在测试集上产生不同的误差:如果成员的误差是独立的,集成模型将显著地比其成员表现更好. 二.集成学习介绍篇 2.1 介绍篇 2.1.1 集成 ...

  3. scaling之旅_机器学习算法之旅

    在这篇文章中, 我们将介绍最流行的机器学习算法. 浏览该领域的主要算法以了解可用的方法有哪些是有用的. 有很多算法是可用的, 当算法名称被抛出时, 它会让人感到无所适从, 而你只需要知道它们是什么以及 ...

  4. 机器学习系列(9)_机器学习算法一览(附Python和R代码)

    转载自:http://blog.csdn.net/longxinchen_ml/article/details/51192086 – 谷歌的无人车和机器人得到了很多关注,但我们真正的未来却在于能够使电 ...

  5. 算法的优缺点_机器学习算法优缺点 amp; 如何选择

    (点击上方公众号,可快速关注) 转自: 算法与数学之美 主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类.回归.聚类.推荐.图像识别领域等等,要想找到一个合适算法真的不容易,所以 ...

  6. 转机器学习系列(9)_机器学习算法一览(附Python和R代码)

    转自http://blog.csdn.net/han_xiaoyang/article/details/51191386 – 谷歌的无人车和机器人得到了很多关注,但我们真正的未来却在于能够使电脑变得更 ...

  7. scaling之旅_机器学习算法之旅 - lwaif的个人空间 - OSCHINA - 中文开源技术交流社区...

    机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一个特定问题,如何确定一个正确的算法是很困难的.本文中我想给你们两种方法来归纳在现实中会遇到的算法. 学习方式 根据如何处理经验.环境或者任何 ...

  8. 正确率能很好的评估分类算法吗_机器学习算法优缺点对比及选择(汇总篇)

    转自:机器学习与统计学 本文的目的,是务实.简洁地盘点一番当前机器学习算法.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的经验,将对此模型优缺点及 ...

  9. kmeans聚类算法_机器学习/算法校招面试考点汇总(附面试题和答案)【持续更新】_笔经面经...

    以下不作为机器学习/算法工程师的学习路径,只是汇总的校招机器学习/算法工程师面试考点(因为还有笔试考点,后面结合在一起给大家学习路径),后续会为大家更新10w+字数的机器学习/算法工程师校招面试题库, ...

  10. python算法的缺陷和不足_机器学习算法优缺点及其应用领域

    决策树 一.  决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...

最新文章

  1. boost::lambda::switch_statement用法的测试程序
  2. Spring源码:BeanFactory
  3. CSS实现垂直居中的方法
  4. 谷歌修复另一枚已遭利用的 Chrome 释放后使用0day,细节未公开
  5. Matlab括号使用详解
  6. 用java进行安卓开发的步骤_如何在windows下Android开发IDE搭建步骤
  7. windows黑窗命令
  8. 本特利电涡流传感器 330876-02-90-01-CN
  9. JS判断手机浏览器,并跳转到手机端网页
  10. insurgency服务器修改,insurgency指令大全 | 手游网游页游攻略大全
  11. 【Linux系统】第9节 linux系统中用户分类以及用户与组属性的修改示例
  12. 前端-基础篇-HTML-HTML基本结构
  13. python--os.chdir() 方法 切换当前工作路径
  14. 3分钟了解思极有容数据库的2020
  15. 20162316刘诚昊 第七周学习报告
  16. Towards Robust Tampered Text Detection in Document Image: New dataset and New Solution
  17. [附源码]SSM计算机毕业设计某城市参军和退役军人信息管理系统JAVA
  18. 西门子工控不求人---说说官方资源网站(强大到超出您想象)
  19. Codeforces Round #782 (Div. 2) C. Line Empire
  20. matlab电压传感器,MATLAB在光纤电压传感器温度补偿中的应用

热门文章

  1. CTF:攻防世界web PART01
  2. 减少 JavaScript 代码量的原生技术
  3. 何时不应该使用 Rails?
  4. 糟糕!原来你的电脑就是这样被木马远控了
  5. 数据科学家在“新常态”下发生了怎样的转变?
  6. 异构计算崛起,GPU加速计算服务器FP5468G2应运而生
  7. 分析了 3000 份 Bug 记录,可以发现什么?
  8. 为什么需要 Redis 哨兵?
  9. AI 六十年,强人工智能何时到来?
  10. 机器学习模型实战!如何从 900 万张图片中对 600 类照片进行分类? | 技术头条...