什么是机器学习?

机器学习的定义有很多种,而且到目前为止也没有一个公认的定义,想要了解更多可以参考一下知乎https://www.zhihu.com/question/33892253的解答,有客观的回答,有深刻的幽默。
在这里我从定义的角度来让大家浅显的了解一下什么叫做机器学习,机器学习的定义有许多,比如:

“机器从原始的数据中提取模式的能力”(lan goodfellow)
    “在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。”(1959 Arthur Samuel)
    “机器学习这门学科所关注的问题是:计算机程序如何随着经验积累自动提高性能。”(1998 Mitchell)
    “对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习。”(1998 Tom Mitchell )

就比如在猪的识别问题中,我们不通过直接的编程教导机器说,猪是陆地行走四个蹄子肥头大耳的动物,而是间接的告诉机器哪些是猪哪些不是,通过经验的积累,计算机自我完善,从而区分是或者不是。

当然我的举例只是有监督的一个例子,还有半监督,弱监督,无监督学习等等很多都属于机器学习问题。

什么是监督学习、无监督学习、强化学习、弱监督学习、半监督学习、多示例学习?

随着机器学习问题不断深入人心,人们也将现实中遇到不同的问题分为不同的学习方式,其中,最基础的应属监督学习,无监督学习和强化学习了。

监督学习(supervised learning):已知数据和其一一对应的标签,训练一个智能算法,将输入数据映射到标签的过程。监督学习是最常见的学习问题之一,就是人们口中常说的分类问题。比如已知一些图片是猪,一些图片不是猪,那么训练一个算法,当一个新的图片输入算法的时候算法告诉我们这张图片是不是猪。

无监督学习(unsupervised learning):已知数据不知道任何标签,按照一定的偏好,训练一个智能算法,将所有的数据映射到多个不同标签的过程。相对于有监督学习,无监督学习是一类比较困难的问题,所谓的按照一定的偏好,是比如特征空间距离最近,等人们认为属于一类的事物应具有的一些特点。举个例子,猪和鸵鸟混杂在一起,算法会测量高度,发现动物们主要集中在两个高度,一类动物身高一米左右,另一类动物身高半米左右,那么算法按照就近原则,75厘米以上的就是高的那类也就是鸵鸟,矮的那类是第二类也就是猪,当然这里也会出现身材矮小的鸵鸟和身高爆表的猪会被错误的分类。

强化学习(reinforcement learning):智能算法在没有人为指导的情况下,通过不断的试错来提升任务性能的过程。“试错”的意思是还是有一个衡量标准,用棋类游戏举例,我们并不知道棋手下一步棋是对是错,不知道哪步棋是制胜的关键,但是我们知道结果是输还是赢,如果算法这样走最后的结果是胜利,那么算法就学习记忆,如果按照那样走最后输了,那么算法就学习以后不这样走。

弱监督学习(weakly supervised learning): 已知数据和其一一对应的弱标签,训练一个智能算法,将输入数据映射到一组更强的标签的过程。标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,分类的标签就是弱标签,如果我们知道一幅图,告诉你图上有一只猪,然后需要你把猪在哪里,猪和背景的分界在哪里找出来,那么这就是一个已知若标签,去学习强标签的弱监督学习问题。

半监督学习(semi supervised learning) :已知数据和部分数据一一对应的标签,有一部分数据的标签未知,训练一个智能算法,学习已知标签和未知标签的数据,将输入数据映射到标签的过程。半监督通常是一个数据的标注非常困难,比如说医院的检查结果,医生也需要一段时间来判断健康与否,可能只有几组数据知道是健康还是非健康,其他的只有数据不知道是不是健康。那么通过有监督学习和无监督的结合的半监督学习就在这里发挥作用了。

多示例学习(multiple instance learning) :已知包含多个数据的数据包和数据包的标签,训练智能算法,将数据包映射到标签的过程,在有的问题中也同时给出包内每个数据的标签。多示例学习引入了数据包的概念,比如说一段视频由很多张图组成,假如1000张,那么我们要判断视频里是否有猪出现,一张一张的标注每一帧是否有猪太耗时,所以人们看一遍说这个视频里有猪或者没猪,那么就得到了多示例学习的数据,1000帧的数据不是每一个都有猪出现,只要有一帧有猪,那么我们就认为这个包是有猪的,所有的都没有猪,才是没有猪的,从这里面学习哪一段视频(1000张)有猪哪一段视频没有就是多示例学习的问题。

机器学习?有无监督、弱监督、半监督、强化、多示例学习是什么相关推荐

  1. 西瓜书+实战+吴恩达机器学习(十六)半监督学习(半监督SVM、半监督k-means、协同训练算法)

    文章目录 0. 前言 1. 半监督SVM 2. 半监督k-means 2.1. 约束k-means 2.2. 约束种子k-means 3. 协同训练算法 如果这篇文章对你有一点小小的帮助,请给个关注, ...

  2. 【小样本基础】有监督小样本,半监督小样本,无监督小样本

    本篇博客探讨的主要是小样本的分类问题 目录 1. 问题定义 2. 有监督小样本分类 3. 半监督小样本分类 3.1 基于一致性约束的方法 3.2 基于伪标注的方法 4. 无监督小样本分类 4.1 基于 ...

  3. 图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 AI博士笔记系列推荐 ...

  4. 【半监督论文综述】A survey on semi-supervised learning

    下载 半监督学习 1. 半监督学习 1.1 三个假设 1.1.1 平滑假设 1.1.2 低密度假设 1.1.3 流形假设 1.1.4 聚类假设 1.2. 评估半监督学习算法 2. 半监督学习算法分类 ...

  5. 【半监督医学图像分割 2021 TMI】SimCVD 论文翻译

    文章目录 [半监督医学图像分割 2021 TMI]SimCVD 论文翻译 摘要 1. 介绍 2. 相关工作 3. 方法 3.1 总览 3.2 任务制定 3.3 基础体系结构 3.4 边缘对比蒸馏 4. ...

  6. 融合一致性正则与流形正则的半监督深度学习算法

    融合一致性正则与流形正则的半监督深度学习算法 王杰1,2, 张松岩1,2, 梁吉业1,2 1山西大学计算机与信息技术学院 2计算智能与中文信息处理教育部重点实验室 摘要:半监督学习已被广泛应用于大数据 ...

  7. 半监督3D医学图像分割(三):URPC

    Efficient Semi-supervised Gross Target Volume of Nasopharyngeal Carcinoma Segmentation via Uncertain ...

  8. 李宏毅ML笔记12:半监督

    目录 生成式模型 有监督生成式模型 半监督生成式模型 直观解释 具体操作 基本原理 低密度分离假设 Self Training Self Training与generative model对比 基于熵 ...

  9. 【机器学习】有监督、无监督、自监督、半监督、弱监督的区别

    有监督:用有标签的数据训练: 无监督:用无标签的数据训练: K-means等 半监督:利用数据分布上的模型假设建立学习器对未标签样例进行标签.通常是两阶段的训练,先用(较小规模的)有标签数据训练一个T ...

  10. 【机器学习基础】半监督算法概览(Python)

    前言 前阶段时间梳理了机器学习开发实战的系列文章: 1.Python机器学习入门指南(全) 2.Python数据分析指南(全) 3.一文归纳Ai数据增强之法 4.一文归纳Python特征生成方法(全) ...

最新文章

  1. libstrophe 安装
  2. Android的自定义键盘颜色,android自定义键盘(解决弹出提示的字体颜色问题)
  3. Zookeeper_zkClientAPI讲解
  4. 华为全面启航计算战略:“鲲鹏+昇腾”双引擎
  5. 软件工程导论 统一建模语言UML概述
  6. redis怎么开启_关于Redis数据库入门必备的学习点
  7. python自学-新手如何自学python课程?
  8. NRF52832学习笔记
  9. JAVA程序设计(11)-----面对对象0基础设计 麻将 创建麻将牌 然后洗牌 发牌~ 恩 就这样...
  10. 三种常用的js数组去重方法
  11. OtherSoftwares
  12. 计算机显卡驱动不匹配,显卡驱动不兼容怎么办 显卡驱动降低旧版本方法
  13. CNN结构:色彩特征提取-从RGB空间到HSV空间(色彩冷暖判断)
  14. 抓取每天必应bing背景图片
  15. AliOS Things 编译体系
  16. ${}和`${}`的用法
  17. 喜讯!双驰企业正式成为欧盟地平线2020 项目合作伙伴
  18. 英语零基础怎么学计算机,零基础学英语的步骤有哪些
  19. Java准备工作【感谢狂神说JAVA】
  20. 全链路压测原理剖析(Coding)

热门文章

  1. 链家重庆二手房爬取以及房价预测
  2. VSCode 使用code runner
  3. Shawn,别让我们失望
  4. excel合并两列内容_【238期】EXCEL扩展思维,一题多解,玩转数据两列合并,你都会?...
  5. 长时间看电脑,眼睛疼的原因和治疗方法
  6. 一个人的生命周期,就是人的一生
  7. react的生命周期函数(超详细)
  8. android读取sim卡,Android开发之获取SIM卡信息和手机号码
  9. 模数转换芯片AD7705的使用心得
  10. android:模仿微信联系人效果