机器学习

1、概念

学习是一门多学科交叉专业，涵盖概率论知识，统计学知识，近似理论知识和复杂算法知识，使用计算机作为工具并致力于真实实时的模拟人类学习方式，并将现有内容进行知识结构划分来有效提高学习效率。

机器学习有下面几种定义：

（1）机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。

（2）机器学习是对能通过经验自动改进的计算机算法的研究。

（3）机器学习是用数据或以往的经验，以此优化计算机程序的性能标准

Tom 定义的机器学习是，一个好的学习问题定义如下，他说，一个程序被认为能从经验 E 中学习，解决任务 T，达到性能度量值 P，当且仅当，有了经验 E 后，经过 P 评判，程序在处理 T 时的性能有所提升。我认为经验E 就是程序上万次的自我练习的经验（在下棋训练中，任务 T 就是下棋。性能度量值 P 呢，就是它在与一些新的对手比赛时，赢得比赛的概率）

2、算法

目前存在多种不同类型的学习算法。主要的两种类型被我们称之为监督学习和无监督学习。
机器学习的算法分为监督学习算法和非监督学习算法。是否有监督，就看输入数据是否有标签。输入数据有标签，则为有监督学习，没标签则为无监督学习。

（1）监督学习

给计算机一个带有标签的数据集，让计算机进行给出想要的结果与确切的结果。

主要分为以下两类，回归与分类。

1.线性回归算法

线性回归算法通常用来构建一个预测模型。例如，根据房子年限、房屋面积这两个特性，来预测房屋价格，就可以构建一个线性回归算法。利用已有的数据训练模型，再用训练好的模型预测新的房价。

如果有一个输入x，对应一个输出y，就可以构建一个一维现行回归模型，通常表现为一条直线或取现，当给定一个x值时，对应可以求出y值。当有多个特征共同影响y值时，就可以构建一个多元的线性回归模型。

2.逻辑回归算法

逻辑回归算法用来进行对数据的分类。它和线性回归算法类似，不同之处在于，输出值y是给定的几类。最常见的是分成两类，如好和坏。使用逻辑回归算法，可以根据输入数据的特征，判断该条数据的输出是哪一类的。

（2）非监督学习

给计算机一个数据集，预先是不知道该数据集的具体情况，对于监督学习里的每条数据，我们已经清楚地知道训练集对应的正确答案。而非监督学习则不是这样，只是给数据集让计算机自行处理，给出处理后的结果。主要分为以下几种：

1.Kmeans聚类

聚类是一种非监督学习，它和分类的不同之处在于，分类是有标签的，而聚类是无标签的。分类的结果是知道哪个好哪个坏，而聚类是根据特性，将相似的事物聚集到一起，不考虑它们的好坏。
Kmeas算法是聚类算法中的一种，可以根据输入的特性，将一些数据聚集为成任意多个类别。Kmeas算法使用距离的远近来聚集一类数据。

2.降维

有的时候，一条数据的输入特性可能有很多。比如，在预测房价的问题上，可能会输入房间面积、年限、地理位置相关信息等近百个属性。使用这么多属性进行分析，会为分析过程带来麻烦。降维，就是将这些D个维度的输入属性，缩小成d个维度的输入属性。它将一些输入特性合并或进行某些操作，来减少变量的数量。

3.异常检测

异常检测用来判断某一个数据，其输入特性是否异常。例如，有多个属性来描述一个飞机的发动机，在大量的数据输入中，通过异常检测，来发现哪条数据记录存在异常。

机器学习之监督与非监督算法相关推荐

机器学习中的标签数据和无标签数据（监督、非监督和半监督学习）
原文链接http://www.shujuren.org/article/62.html 原文如下监督式和非监督式机器学习算法作者 Frankchen 什么是监督式机器学习,它与和非监督式机器学习有 ...
基本概念—监督与非监督
原文作者:python猫娘原文地址:监督学习与非监督学习一.监督学习(supervised learning) 监督学习(supervised learning)的任务是学习一个模型,使模型能够 ...
图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低
点上方蓝字计算机视觉联盟获取更多干货在右上方 ··· 设为星标 ★,与你不见不散编辑:Sophia 计算机视觉联盟报道 | 公众号 CVLianMeng 转载于 :专知 AI博士笔记系列推荐 ...
机器学习非监督机器学习算法有哪些
非监督机器学习可以分为以下几类 (1)聚类:K-均值聚类.谱聚类.DBSCAN聚类.模糊聚类.GMM聚类.层次聚类等 (2)降维:PCA.t-SNE.MDS等 (3)其它:PageRank.SOM等 ...
非监督多类域适应：理论，算法和实践
点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入! 『今日视频推荐』非监督多类域适应(UDA)是机器学习和迁移学习下的研究领域,它的任务是解决现实应用中源域和目标域之间存在差异的问题.本 ...
非监督异常点检测算法总结——没有想到矩阵分解和编码解码器也是一种思路...
非监督异常点检测算法总结一.基于密度 1) d(p,o):两点p和o之间的距离: 2) k-distance:第k距离对于点p的第k距离dk(p)定义如下: p的第k距离,也就是距离p第k远的点的 ...
非监督HMP算法的物体识别
原文Unsupervised Feature Learing for RGB-D Based Object Recognition 应该算是花了比较长时间来看的一篇论文,理解起来也相较容易,而且最近看 ...
非监督神经网络的wake-sleep算法
非监督神经网络的wake-sleep算法可以用来Fine tuning DBNs,该算法主要分为两个阶段,即"wake"阶段与"sleep"阶段,其中" ...
[机器学习入门]——第七课——非监督聚类
文章目录第七课--非监督聚类非监督学习一.聚类简介聚类中的问题常见距离度量划分式聚类 K-means聚类法算法步骤 K-means的目标/损失函数迭代优化算法复杂性算法分析聚类中 ...

机器学习之监督与非监督算法