目录

监督学习

回归问题

分类问题

无监督学习

半监督学习

强化学习

参考链接


监督学习

监督学习简单来说就是我们给学习算法一个数据集。 这个数据集由“正确答案”组成,然后使用已知正确答案的示例来训练网络,从而得到一个最优的模型。

也就是说,在监督学习中训练数据既有特征(feature) 又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。

一般步骤:数据集的创建和分类----》训练----》验证----》应用

经典算法:支持向量机、线性判别、决策树、朴素贝叶斯

监督学习分为:回归问题  和  分类问题

回归问题

回归:我们在试着推测出一系列连续值属性
        回归问题:我们试着推测出一个连续值的结果,输出一个数值,针对连续型变量。简单来说:

        对已经存在的点(训练数据)进行分析,拟合出适当的函数模型y=f(x),这里y就是数据的标签,而对于一个新的自变量x,通过这个函数模型得到标签y

举个栗子:预测房价。根据收集到的一系列房子的数据,我们给定数据集中每个样本的正确价格,即它们实际的售价,然后运用学习算法,算出更多的正确答案。比如预测购买的新房子的价格。

分类问题

与回归问题不同的是输出的内容不一样。在回归问题中机器输出的是一个数值,在分类问题里面机器输出的是类别,针对离散型变量。

无监督学习

与监督学习相比,无监督学习更像是自学。所给的数据集是未加标签的数据,没有类别信息,也没有给定的目标值,需要根据聚类或一定的模型得到数据之间的关系。

经典算法:聚类K-means算法(K均值算法),主成分分析PCA

半监督学习

半监督学习在训练阶段结合了大量未标记的数据和少量标签数据。与使用所有标签数据的模型相比,使用训练集的训练模型在训练时可以更为准确,而且训练成本更低。

强化学习

强化学习,又称再励学习或者评价学习,目标就是获得最多的累计奖励

强化学习采用的是边获得样例边学习的方式,在获得样例之后更新自己的模型,利用当前的模型来指导下一步的行动,下一步的行动获得reward之后再更新模型,不断迭代重复直到模型收敛。

个人理解就是:别想太多,先干起来,如果方向对了,就继续干;如果错了,就吸取经验,加以改正,通过不断的"试错"来学习积累。

即想要理解信息,获得输入到输出的映射,就需要从自身的以往经验中去不断学习来获取知识,从而不需要大量已标记的确定标签,只需要一个评价行为好坏的奖惩机制进行反馈,强化学习通过这样的反馈自己进行“学习”。(当前行为“好”以后就多往这个方向发展,如果“坏”就尽量避免这样的行为,即不是直接得到了标签,而是自己在实际中总结得到的)

对于 强化学习和监督式学习的区别与强化学习和无监督式学习的区别 见参考链接③

参考链接

①一文读懂监督学习、无监督学习、半监督学习、强化学习这四种深度学习方式

②机器学习、监督学习、非监督学习、强化学习、深度学习、迁移学习_明月清风-程序员宅基地

③李宏毅《深度学习》(一)

理解监督学习、无监督学习、半监督学习、强化学习相关推荐

  1. 《强化学习周刊》第25期:DeepMind提出无模型风险敏感强化学习、谷歌发布 RLDS数据集生态系统...

    No.25 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

  2. 监督学习和无监督学习_让半监督学习再次伟大!谷歌最新无监督数据增强研究,全面超越现有半监督学习方法...

      新智元报道   来源:GoogleAI 编辑:元子 [新智元导读]Google AI最新研究用无监督数据增强推进半监督学习,取得令人瞩目的成果.该方法超越了所有现有的半监督学习方法,并实现了仅使用 ...

  3. 监督学习、无监督学习、半监督学习和强化学习

    https://www.toutiao.com/a6673066493946626574/ AI 想必大家都知道,在机器学习训练一个模型的过程中需要大量的数据进行喂养.根据训练的模型不同,一般有如下的 ...

  4. AI之强化学习、无监督学习、半监督学习和对抗学习

    1.强化学习 文章目录 1.强化学习 1.1 强化学习原理 1.2 强化学习与监督学习 2.无监督学习 3.半监督学习 4.对抗学习 强化学习(英语:Reinforcement Learning,简称 ...

  5. 机器学习_监督学习、非监督学习、半监督学习以及强化学习概念介绍

    机器学习中通常根据数据是否有标签可以分为监督学习(supervised learning).非监督学习(unsupervised learning) 和半监督学习(semi-supervised le ...

  6. 机器学习中的有监督学习,无监督学习,半监督学习

    在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning). 非监督学习(Unsupervised learning). 半监督 ...

  7. 半监督学习深度学习算法

    该文章主体摘自知乎糯米稻谷的文章,对一些细节添加了自己的理解 文章链接https 半监督学习 啥是半监督学习(Semi-supervised Learning) 1.简单自训练(simple self ...

  8. 为什么ChatGPT用强化学习而非监督学习?

    为什么ChatGPT非得用强化学习,而不直接用监督学习?原因不是那么显而易见.在上周发布的<John Schulman:通往TruthGPT之路>一文中,OpenAI联合创始人.ChatG ...

  9. 【科普】半监督学习的概述与思考,及其在联邦学习场景下的应用

    关注公众号,发现CV技术之美 在现实世界中,数据往往存在各种各样的问题,例如:图片分类模型对标注数据的依赖性很强.标注图片数据难以获取.大量未标注数据存在.针对某个场景的数据量过小-等等问题. 在联邦 ...

  10. 机器学习、监督学习、非监督学习、强化学习、深度学习、迁移学习

    机器学习.监督学习.非监督学习.强化学习.深度学习.迁移学习 机器学习(machine learning) 监督学习(supervised learning) 非监督学习(unsupervised l ...

最新文章

  1. python for循环求和_python用for循环求和的方法总结
  2. 程序员2004下载地址
  3. 计算机键盘为啥要这样分布,你知道电脑键盘为什么这么排列吗?
  4. fcm模糊聚类matlab实例_一文学会使用MATLAB将仿真、试验数据可视化附带源程序
  5. svn服务的安装与设置 .
  6. ES6 String和Number扩展
  7. 将labelme工具生产的json文件批量转dataset
  8. 最新的easymule版本,使用vs2005编译
  9. 编程中的幂等性(一):http幂等性
  10. 【OpenCV】 300行写出全能扫描王
  11. Ps 初学者教程「68」如何创建海报?
  12. ERROR 2005 (HY000): Unknown MySQL server host 'locahost' (2)解决
  13. 九宫格构图学习[1]
  14. python股票策略_用Python编程彼得林奇PEG价值选股策略
  15. golang:kratos生成proto以及API编写
  16. Kotlin和Swift语言在Redmonk榜上排名大幅提升
  17. 2023最新支付宝微信运动步数网页源码+附带原始接口
  18. Translatium for Mac(Google在线翻译工具)
  19. Javaweb之JSTL
  20. 工资条: TableMaker部分

热门文章

  1. 7只老鼠找除100瓶水的有毒的水
  2. 免费国产化Hypervisor系统安装
  3. 计算机内存条属于组合电路吗,寄存器和内存条的基础实现电路方案
  4. Exchange控制台错误:WinRM客户端已将请求发送到HTTP服务器
  5. [MOVE]-音频翻唱检索论文笔记
  6. 机器学习 (十五) 关联分析之Apriori算法
  7. JAVA技术及其应用实验三(抽象类和匿名类)
  8. 百度地图经纬度转换腾讯地图经纬度
  9. 从开发转网络安全工程师一点不后悔,兴趣大于一切!
  10. 服务器正在维护中王者荣耀,王者荣耀7月服务器正在维护中_王者荣耀7月3日服务器正在维护中解决方法_游戏吧...