监督学习(supervised learning)

已知数据和其对应的标签,训练一个算法,将输入数据映射到标签的过程

已知一些图片是狗,一些图片不是狗,那么训练一个算法,当一个新的图片输入算法的时候算法告诉我们这张图片是不是狗

无监督学习(unsupervised learning)

已知数据不知道任何标签,按照一定的偏好,训练一个智能算法,将所有的数据映射到多个不同标签的过程。所谓的按照一定的偏好,是比如特征空间距离最近,等人们认为属于一类的事物应具有的一些特点。举个例子,猪和鸵鸟混杂在一起,算法会测量高度,发现动物们主要集中在两个高度,一类动物身高一米左右,另一类动物身高半米左右,那么算法按照就近原则,75厘米以上的就是高的那类也就是鸵鸟,矮的那类是第二类也就是猪,当然这里也会出现身材矮小的鸵鸟和身高爆表的猪会被错误的分类。

半监督学习(semi supervised learning) :

已知数据和部分数据对应的标签,有一部分数据的标签未知,训练一个智能算法,学习已知标签和未知标签的数据,将输入数据映射到标签的过程。半监督通常是一个数据的标注非常困难,比如说医院的检查结果,医生也需要一段时间来判断健康与否,可能只有几组数据知道是健康还是非健康,其他的只有数据不知道是不是健康。

弱监督学习(weakly supervised learning):

已知数据和其一一对应的弱标签,训练一个智能算法,将输入数据映射到一组更强的标签的过程。标签的强弱指的是标签蕴含的信息量的多少,比如相对于分割的标签来说,分类的标签就是弱标签,如果我们知道一幅图,告诉你图上有一只猪,然后需要你把猪在哪里,猪和背景的分界在哪里找出来,那么这就是一个已知若标签,去学习强标签的弱监督学习问题。

对于目标检测任务,图像分类的标签相比物体的bounding box是一种弱监督的标注,对于语义分割任务,image-level的标签和物体的bounding box相比pixel-level(像素层面)的标签则是一种弱监督的标注。

强化学习(reinforcement learning):智能算法在没有人为指导的情况下,通过不断的试错来提升任务性能的过程。“试错”的意思是还是有一个衡量标准,用棋类游戏举例,我们并不知道棋手下一步棋是对是错,不知道哪步棋是制胜的关键,但是我们知道结果是输还是赢,如果算法这样走最后的结果是胜利,那么算法就学习记忆,如果按照那样走最后输了,那么算法就学习以后不这样走。

监督学习、无监督学习、半监督学习、弱监督学习、强化学习相关推荐

  1. 自监督学习、半监督学习、弱监督学习

    一.自监督学习 总结来说:就算利用没有标签的数据,训练模型的提取特征的能力,相当于对模型进行预训练,详细解释可以参考文章:自监督学习 二.弱监督学习 1.三种类别:不完全监督(Incomplete s ...

  2. Mosaix首席科学家劳逆:弱监督学习是未来发展趋势

    Robin.ly 是立足硅谷的视频内容平台,服务全球工程师和研究人员,通过与知名人工智能科学家.创业者.投资人和领导者的深度对话和现场交流活动,传播行业动态和商业技能,打造人才全方位竞争力. 本期Ro ...

  3. 独家 | 日本机器学习领军人杉山将:为什么说弱监督学习是未来的热门?

    前不久结束的第三届CCAI大会,日本人工智能和机器学习领域的新一代领军人物杉山将(Masashi Sugiyama)为我们带来了一场关于弱监督机器学习的精彩演讲,这是机器学习领域少有的来自日本的声音. ...

  4. 机器学习、监督学习、非监督学习、强化学习、深度学习、迁移学习

    机器学习.监督学习.非监督学习.强化学习.深度学习.迁移学习 机器学习(machine learning) 监督学习(supervised learning) 非监督学习(unsupervised l ...

  5. 机器学习、监督学习、非监督学习、强化学习传统机器学习、深度学习、迁移学习基本概念

    文章目录 机器学习(machine learning) 监督学习(supervised learning) 非监督学习(unsupervised learning) 强化学习(reinforcemen ...

  6. 一个简单的例子让你理解强化学习是什么,和有监督学习的区别又是什么

    一个简单的小例子: 对于一个正在学走路的小屁孩,他一不小心摔倒了,如果他一摔倒就哭,那妈妈就会打他小屁屁,如果他摔倒了会自己爬起来,那妈妈很高兴,就奖励他喝一口奶.这样小屁孩就学会了摔倒了要自己爬起来 ...

  7. 机器学习(一)监督学习,非监督学习和强化学习

    根据机器学习的应用情况,我们又把机器学习分为三类:监督学习(SupervisedLearning, SL), 非监督学习(Unsupervised learning, UL),和强化学习(Reinfo ...

  8. [论文]基于强化学习的无模型水下机器人深度控制

    基于强化学习的无模型水下机器人深度控制 摘要 介绍 问题公式 A.水下机器人的坐标框架 B.深度控制问题 马尔科夫模型 A.马尔科夫决策 B.恒定深度控制MDP C.弯曲深度控制MDP D.海底追踪的 ...

  9. 干货|浅谈强化学习的方法及学习路线

    作者:Angel_Kitty 来源:http://www.cnblogs.com/ECJTUACM-873284962/ 一.介绍 目前,对于全球科学家而言,"如何去学习一种新技能" ...

  10. 浅谈强化学习的方法及学习路线

    介绍 目前,对于全球科学家而言,"如何去学习一种新技能"成为了一个最基本的研究问题.为什么要解决这个问题的初衷是显而易见的,如果我们理解了这个问题,那么我们可以使人类做一些我们以前 ...

最新文章

  1. 【Zookeeper系列】ZooKeeper管理分布式环境中的数据(转)
  2. 天池和Kaggle:Notebook使用对比
  3. 自定义函数_python3基础07函数(自定义)
  4. Window7无法访问 Window server 2008 R2文件服务器的共享
  5. mysql 合计单条数据_mysql之数据去重并记录总数
  6. 【MATLAB技巧】——求解符号方程
  7. php大数除法保留精度问题
  8. sobel算子实现边缘检测及其c++实现及与matlab效果对比
  9. postgresql 数据库基本操作
  10. AR公共安全及应急指挥中的应用 | TVP思享
  11. 插桩java_字节码插桩技术
  12. 如何压缩word文档大小?
  13. channel小知识点
  14. 数仓01-概念的理解和方法论
  15. 不写默认无参构造方法,调用自定义构造方法时报错No constructor found in com...
  16. 三年又三年,我朋友都生娃了《打工人的故事》
  17. 微信昵称保存不了mysql_微信昵称存储mysql失败解决办法
  18. 老毛桃U盘启动盘制作工具V2013(UD+ISO超级版)-安装原版Win7或Win8教程
  19. 本硕博参考文献endnote插入,作者名全是大写怎么改。方法有2种
  20. 2009英语一text1

热门文章

  1. VMware中安装win7虚拟机后共享问题的解决
  2. 用java异或的方式去实现简单的视频加密
  3. ①编写一个程序,实现文件的复制。②写一个加密程序,对文件1.txt进行加密。它从输入流中读入一个密钥,并将文件密文输出。③ 编写一个应用程序,向数据文件out.dat中输入100个1000以内的随机整
  4. win10系统计算机物理地址,win10系统查看网卡的物理地址的操作方法
  5. wav转换mp3简单图文教程
  6. PLC梯形图设计全自动洗衣机S7-1200博途以及PLC仿真实现之 3. 仿真设计
  7. 教你用3DMAX打造个性鲜明卡通角色
  8. JavaScript基础知识
  9. 美团加载Dialog(小人奔跑)
  10. 关键接口性能测试报告