监督学习

监督学习简单来说就是我们给学习算法一个数据集。这个数据集由“正确答案”组成，然后使用已知正确答案的示例来训练网络，从而得到一个最优的模型。

也就是说，在监督学习中训练数据既有特征(feature) 又有标签(label)，通过训练，让机器可以自己找到特征和标签之间的联系，在面对只有特征没有标签的数据时，可以判断出标签。

一般步骤：数据集的创建和分类----》训练----》验证----》应用

经典算法：支持向量机、线性判别、决策树、朴素贝叶斯

监督学习分为：回归问题和分类问题

回归问题

回归：我们在试着推测出一系列连续值属性
回归问题：我们试着推测出一个连续值的结果，输出一个数值，针对连续型变量。简单来说：

对已经存在的点（训练数据）进行分析，拟合出适当的函数模型y=f(x)，这里y就是数据的标签，而对于一个新的自变量x，通过这个函数模型得到标签y

举个栗子：预测房价。根据收集到的一系列房子的数据，我们给定数据集中每个样本的正确价格，即它们实际的售价，然后运用学习算法，算出更多的正确答案。比如预测购买的新房子的价格。

分类问题

与回归问题不同的是输出的内容不一样。在回归问题中机器输出的是一个数值，在分类问题里面机器输出的是类别，针对离散型变量。

无监督学习

与监督学习相比，无监督学习更像是自学。所给的数据集是未加标签的数据，没有类别信息，也没有给定的目标值，需要根据聚类或一定的模型得到数据之间的关系。

经典算法：聚类K-means算法（K均值算法），主成分分析PCA

半监督学习

半监督学习在训练阶段结合了大量未标记的数据和少量标签数据。与使用所有标签数据的模型相比，使用训练集的训练模型在训练时可以更为准确，而且训练成本更低。

强化学习

强化学习，又称再励学习或者评价学习，目标就是获得最多的累计奖励。

强化学习采用的是边获得样例边学习的方式，在获得样例之后更新自己的模型，利用当前的模型来指导下一步的行动，下一步的行动获得reward之后再更新模型，不断迭代重复直到模型收敛。

个人理解就是：别想太多，先干起来，如果方向对了，就继续干；如果错了，就吸取经验，加以改正，通过不断的"试错"来学习积累。

即想要理解信息，获得输入到输出的映射，就需要从自身的以往经验中去不断学习来获取知识，从而不需要大量已标记的确定标签，只需要一个评价行为好坏的奖惩机制进行反馈，强化学习通过这样的反馈自己进行“学习”。（当前行为“好”以后就多往这个方向发展，如果“坏”就尽量避免这样的行为，即不是直接得到了标签，而是自己在实际中总结得到的）

对于 强化学习和监督式学习的区别与强化学习和无监督式学习的区别 见参考链接③

参考链接

①一文读懂监督学习、无监督学习、半监督学习、强化学习这四种深度学习方式

②机器学习、监督学习、非监督学习、强化学习、深度学习、迁移学习_明月清风-程序员宅基地

③李宏毅《深度学习》（一）

理解监督学习、无监督学习、半监督学习、强化学习相关推荐

《强化学习周刊》第25期：DeepMind提出无模型风险敏感强化学习、谷歌发布 RLDS数据集生态系统...
No.25 智源社区强化学习组强化学习研究观点资源活动关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...
监督学习和无监督学习_让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法...
新智元报道来源:GoogleAI 编辑:元子 [新智元导读]Google AI最新研究用无监督数据增强推进半监督学习,取得令人瞩目的成果.该方法超越了所有现有的半监督学习方法,并实现了仅使用 ...
监督学习、无监督学习、半监督学习和强化学习
https://www.toutiao.com/a6673066493946626574/ AI 想必大家都知道,在机器学习训练一个模型的过程中需要大量的数据进行喂养.根据训练的模型不同,一般有如下的 ...
AI之强化学习、无监督学习、半监督学习和对抗学习
1.强化学习文章目录 1.强化学习 1.1 强化学习原理 1.2 强化学习与监督学习 2.无监督学习 3.半监督学习 4.对抗学习强化学习(英语:Reinforcement Learning,简称 ...
机器学习_监督学习、非监督学习、半监督学习以及强化学习概念介绍
机器学习中通常根据数据是否有标签可以分为监督学习(supervised learning).非监督学习(unsupervised learning) 和半监督学习(semi-supervised le ...
机器学习中的有监督学习，无监督学习，半监督学习
在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning). 非监督学习(Unsupervised learning). 半监督 ...
半监督学习深度学习算法
该文章主体摘自知乎糯米稻谷的文章,对一些细节添加了自己的理解文章链接https 半监督学习啥是半监督学习(Semi-supervised Learning) 1.简单自训练(simple self ...
为什么ChatGPT用强化学习而非监督学习？
为什么ChatGPT非得用强化学习,而不直接用监督学习?原因不是那么显而易见.在上周发布的<John Schulman:通往TruthGPT之路>一文中,OpenAI联合创始人.ChatG ...
【科普】半监督学习的概述与思考，及其在联邦学习场景下的应用
关注公众号,发现CV技术之美在现实世界中,数据往往存在各种各样的问题,例如:图片分类模型对标注数据的依赖性很强.标注图片数据难以获取.大量未标注数据存在.针对某个场景的数据量过小-等等问题. 在联邦 ...
机器学习、监督学习、非监督学习、强化学习、深度学习、迁移学习
机器学习.监督学习.非监督学习.强化学习.深度学习.迁移学习机器学习(machine learning) 监督学习(supervised learning) 非监督学习(unsupervised l ...

理解监督学习、无监督学习、半监督学习、强化学习