机器学习

1、概念

学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。

机器学习有下面几种定义:

(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。

(2)机器学习是对能通过经验自动改进的计算机算法的研究。

(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准

Tom 定义的机器学习是,一个好的学习问题定义如下,他说,一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值 P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。我认为经验E 就是程序上万次的自我练习的经验(在下棋训练中,任务 T 就是下棋。性能度量值 P 呢,就是它在与一些新的对手比赛时,赢得比赛的概率)

2、算法

目前存在多种不同类型的学习算法。主要的两种类型被我们称之为监督学习和无监督学习。
机器学习的算法分为监督学习算法和非监督学习算法。是否有监督,就看输入数据是否有标签。输入数据有标签,则为有监督学习,没标签则为无监督学习。

(1)监督学习

给计算机一个带有标签的数据集,让计算机进行给出想要的结果与确切的结果。

主要分为以下两类,回归与分类。

1.线性回归算法

线性回归算法通常用来构建一个预测模型。例如,根据房子年限、房屋面积这两个特性,来预测房屋价格,就可以构建一个线性回归算法。利用已有的数据训练模型,再用训练好的模型预测新的房价。

如果有一个输入x,对应一个输出y,就可以构建一个一维现行回归模型,通常表现为一条直线或取现,当给定一个x值时,对应可以求出y值。当有多个特征共同影响y值时,就可以构建一个多元的线性回归模型。

2.逻辑回归算法

逻辑回归算法用来进行对数据的分类。它和线性回归算法类似,不同之处在于,输出值y是给定的几类。最常见的是分成两类,如好和坏。使用逻辑回归算法,可以根据输入数据的特征,判断该条数据的输出是哪一类的。

(2)非监督学习

给计算机一个数据集,预先是不知道该数据集的具体情况,对于监督学习里的每条数据,我们已经清楚地知道训练集对应的正确答案。而非监督学习则不是这样,只是给数据集让计算机自行处理,给出处理后的结果。主要分为以下几种:

1.Kmeans聚类

聚类是一种非监督学习,它和分类的不同之处在于,分类是有标签的,而聚类是无标签的。分类的结果是知道哪个好哪个坏,而聚类是根据特性,将相似的事物聚集到一起,不考虑它们的好坏。
Kmeas算法是聚类算法中的一种,可以根据输入的特性,将一些数据聚集为成任意多个类别。Kmeas算法使用距离的远近来聚集一类数据。

2.降维

有的时候,一条数据的输入特性可能有很多。比如,在预测房价的问题上,可能会输入房间面积、年限、地理位置相关信息等近百个属性。使用这么多属性进行分析,会为分析过程带来麻烦。降维,就是将这些D个维度的输入属性,缩小成d个维度的输入属性。它将一些输入特性合并或进行某些操作,来减少变量的数量。

3.异常检测

异常检测用来判断某一个数据,其输入特性是否异常。例如,有多个属性来描述一个飞机的发动机,在大量的数据输入中,通过异常检测,来发现哪条数据记录存在异常。

机器学习之监督与非监督算法相关推荐

  1. 机器学习中的标签数据和无标签数据(监督、非监督和半监督学习)

    原文链接http://www.shujuren.org/article/62.html 原文如下 监督式和非监督式机器学习算法 作者 Frankchen 什么是监督式机器学习,它与和非监督式机器学习有 ...

  2. 基本概念—监督与非监督

    原文作者:python猫娘 原文地址:监督学习与非监督学习 ​一.监督学习(supervised learning) 监督学习(supervised learning)的任务是学习一个模型,使模型能够 ...

  3. 图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 AI博士笔记系列推荐 ...

  4. 机器学习非监督机器学习算法有哪些

    非监督机器学习可以分为以下几类 (1)聚类:K-均值聚类.谱聚类.DBSCAN聚类.模糊聚类.GMM聚类.层次聚类等 (2)降维:PCA.t-SNE.MDS等 (3)其它:PageRank.SOM等 ...

  5. 非监督多类域适应:理论,算法和实践

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 『今日视频推荐』 非监督多类域适应(UDA)是机器学习和迁移学习下的研究领域,它的任务是解决现实应用中源域和目标域之间存在差异的问题.本 ...

  6. 非监督异常点检测算法总结——没有想到矩阵分解和编码解码器也是一种思路...

    非监督异常点检测算法总结 一.基于密度 1) d(p,o):两点p和o之间的距离: 2) k-distance:第k距离 对于点p的第k距离dk(p)定义如下: p的第k距离,也就是距离p第k远的点的 ...

  7. 非监督HMP算法的物体识别

    原文Unsupervised Feature Learing for RGB-D Based Object Recognition 应该算是花了比较长时间来看的一篇论文,理解起来也相较容易,而且最近看 ...

  8. 非监督神经网络的wake-sleep算法

    非监督神经网络的wake-sleep算法可以用来Fine tuning DBNs,该算法主要分为两个阶段,即"wake"阶段与"sleep"阶段,其中" ...

  9. [机器学习入门]——第七课——非监督聚类

    文章目录 第七课--非监督聚类 非监督学习 一.聚类简介 聚类中的问题 常见距离度量 划分式聚类 K-means聚类法 算法步骤 K-means的目标/损失函数 迭代优化 算法复杂性 算法分析 聚类中 ...

最新文章

  1. mysql实现pr曲线_ROC 曲线与 PR 曲线
  2. iOS进阶之底层原理-cache_t
  3. 出色技术团队的关键要素
  4. fork()与pid
  5. ftp 工具_ftp,ftp工具多大
  6. VoxelNet: 基于点云的三维空间信息逐层次学习网络
  7. log.php(157),Log出现permission Denied的错误
  8. linux cp 强制覆盖
  9. java thread setname_Java Thread setName()方法
  10. C++中size_t和int区别
  11. Mysql记录历史执行的sql
  12. 游戏环境检测工具_自带基准测试的游戏大作盘点
  13. greensock下载_面向初学者的GreenSock(第2部分):GSAP的时间表
  14. Elasticsearch常用搜索和分词器
  15. 工业以太网交换机常见的几种故障类型及分析排查方法
  16. 9:用户和权限-步入Linux的现代方法
  17. 【步兵 经验篇】one step
  18. 计算机二级c语言2019年3月,2019年3月计算机二级
  19. 攻防演练第四年的一些碎碎念
  20. 非投机性的 Web3 用例

热门文章

  1. web专题 HTTP介绍和HTTPS协议区别,以及http版本特性
  2. CAT分布式监控系统:CAT功能介绍,CAT监控系统是什么,能做什么?
  3. pandaboard Rev b3 刷boot和android系统
  4. 从漫画看源码管理方式
  5. JQuery之滑动效果slideDown , slideUp , slideToggle
  6. Redis 教程+redis微博设计处理(内涵笔记和源码)
  7. 微信支付银行卡限额是多少?
  8. 虚机上安装Windows11版本
  9. h5 微信分享和踩坑指南
  10. 彩虹显IP软件即使合法也不合理