监督学习、无监督学习、半监督学习、弱监督学习、强化学习

监督学习（supervised learning）

已知数据和其对应的标签，训练一个算法，将输入数据映射到标签的过程

已知一些图片是狗，一些图片不是狗，那么训练一个算法，当一个新的图片输入算法的时候算法告诉我们这张图片是不是狗

无监督学习(unsupervised learning)

已知数据不知道任何标签，按照一定的偏好，训练一个智能算法，将所有的数据映射到多个不同标签的过程。所谓的按照一定的偏好，是比如特征空间距离最近，等人们认为属于一类的事物应具有的一些特点。举个例子，猪和鸵鸟混杂在一起，算法会测量高度，发现动物们主要集中在两个高度，一类动物身高一米左右，另一类动物身高半米左右，那么算法按照就近原则，75厘米以上的就是高的那类也就是鸵鸟，矮的那类是第二类也就是猪，当然这里也会出现身材矮小的鸵鸟和身高爆表的猪会被错误的分类。

半监督学习(semi supervised learning) ：

已知数据和部分数据对应的标签，有一部分数据的标签未知，训练一个智能算法，学习已知标签和未知标签的数据，将输入数据映射到标签的过程。半监督通常是一个数据的标注非常困难，比如说医院的检查结果，医生也需要一段时间来判断健康与否，可能只有几组数据知道是健康还是非健康，其他的只有数据不知道是不是健康。

弱监督学习(weakly supervised learning)：

已知数据和其一一对应的弱标签，训练一个智能算法，将输入数据映射到一组更强的标签的过程。标签的强弱指的是标签蕴含的信息量的多少，比如相对于分割的标签来说，分类的标签就是弱标签，如果我们知道一幅图，告诉你图上有一只猪，然后需要你把猪在哪里，猪和背景的分界在哪里找出来，那么这就是一个已知若标签，去学习强标签的弱监督学习问题。

对于目标检测任务，图像分类的标签相比物体的bounding box是一种弱监督的标注，对于语义分割任务，image-level的标签和物体的bounding box相比pixel-level（像素层面）的标签则是一种弱监督的标注。

强化学习(reinforcement learning)：智能算法在没有人为指导的情况下，通过不断的试错来提升任务性能的过程。“试错”的意思是还是有一个衡量标准，用棋类游戏举例，我们并不知道棋手下一步棋是对是错，不知道哪步棋是制胜的关键，但是我们知道结果是输还是赢，如果算法这样走最后的结果是胜利，那么算法就学习记忆，如果按照那样走最后输了，那么算法就学习以后不这样走。

监督学习、无监督学习、半监督学习、弱监督学习、强化学习相关推荐

自监督学习、半监督学习、弱监督学习
一.自监督学习总结来说:就算利用没有标签的数据,训练模型的提取特征的能力,相当于对模型进行预训练,详细解释可以参考文章:自监督学习二.弱监督学习 1.三种类别:不完全监督(Incomplete s ...
Mosaix首席科学家劳逆：弱监督学习是未来发展趋势
Robin.ly 是立足硅谷的视频内容平台,服务全球工程师和研究人员,通过与知名人工智能科学家.创业者.投资人和领导者的深度对话和现场交流活动,传播行业动态和商业技能,打造人才全方位竞争力. 本期Ro ...
独家 | 日本机器学习领军人杉山将：为什么说弱监督学习是未来的热门？
前不久结束的第三届CCAI大会,日本人工智能和机器学习领域的新一代领军人物杉山将(Masashi Sugiyama)为我们带来了一场关于弱监督机器学习的精彩演讲,这是机器学习领域少有的来自日本的声音. ...
机器学习、监督学习、非监督学习、强化学习、深度学习、迁移学习
机器学习.监督学习.非监督学习.强化学习.深度学习.迁移学习机器学习(machine learning) 监督学习(supervised learning) 非监督学习(unsupervised l ...
机器学习、监督学习、非监督学习、强化学习传统机器学习、深度学习、迁移学习基本概念
文章目录机器学习(machine learning) 监督学习(supervised learning) 非监督学习(unsupervised learning) 强化学习(reinforcemen ...
一个简单的例子让你理解强化学习是什么，和有监督学习的区别又是什么
一个简单的小例子: 对于一个正在学走路的小屁孩,他一不小心摔倒了,如果他一摔倒就哭,那妈妈就会打他小屁屁,如果他摔倒了会自己爬起来,那妈妈很高兴,就奖励他喝一口奶.这样小屁孩就学会了摔倒了要自己爬起来 ...
机器学习（一）监督学习，非监督学习和强化学习
根据机器学习的应用情况,我们又把机器学习分为三类:监督学习(SupervisedLearning, SL), 非监督学习(Unsupervised learning, UL),和强化学习(Reinfo ...
[论文]基于强化学习的无模型水下机器人深度控制
基于强化学习的无模型水下机器人深度控制摘要介绍问题公式 A.水下机器人的坐标框架 B.深度控制问题马尔科夫模型 A.马尔科夫决策 B.恒定深度控制MDP C.弯曲深度控制MDP D.海底追踪的 ...
干货｜浅谈强化学习的方法及学习路线
作者:Angel_Kitty 来源:http://www.cnblogs.com/ECJTUACM-873284962/ 一.介绍目前,对于全球科学家而言,"如何去学习一种新技能" ...
浅谈强化学习的方法及学习路线
介绍目前,对于全球科学家而言,"如何去学习一种新技能"成为了一个最基本的研究问题.为什么要解决这个问题的初衷是显而易见的,如果我们理解了这个问题,那么我们可以使人类做一些我们以前 ...

监督学习、无监督学习、半监督学习、弱监督学习、强化学习

监督学习、无监督学习、半监督学习、弱监督学习、强化学习相关推荐

最新文章

热门文章