什么是监督学习非监督学习,强化学习

机器学习按照学习方式的不同,分为很多的类型,主要的类型分为

  • 监督学习
  • 非监督学习
  • 强化学习
  • 半监督学习

什么是监督学习?

利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练。

正如下图中给出了好多鸭子的特征那样,指示出那些是鸭子哪些不是鸭子,然后让计算机进行学习,计算机要通过学习才能具有识别各种事物和现象的能力。

用来进行学习的材料就是与被识别对象属于同类的有限数量样本,在本例子中指的是哪些选择的鸭子。

除此之外,监督学习中在给予计算机学习样本的同时,还告诉计算各个样本所属的类别。

当再次给出一个特征图片的时候,就可以通过预测模型进行判断。

监督学习就是标明一些数据是对的,另一些数据是错的,然后让程序预测,新的数据是对的还是错的。所以说,有监督学习,必须是有标签的。

什么是无监督学习?

无监督学习,顾名思义,就是不对数据进行标明,让机器自动去判断,哪些数据比较像,归到一类等等

无监督学习注重的是把特征对象归为类

什么是半监督学习?

半监督学习是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。

所给的数据有的是有标签的,而有的是没有标签的。

通过下图来进行举例,如果比做人的话,半监督学习就类似于人的生活,一些人是有标签的,比如商界的精英,总裁,一些人是无标签的,在社会中无标签的人占

大多数,有标签的精英占少部分。

当一个人进来的时候,就会对他的特征进行判断,也就是是否是精英进行判断,是否需要归为相同的类。

 什么是强化学习?

强化学习的核心是一个概念,即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化学习算法,通过以环境的反馈为基础来确定理想行为。

强化学习算法可以在必要时随时间保持适应环境,以便长期获得最大的回报。比如一个通过强化学习来学习行走的机器人将通过尝试不同的方法获得有关这些方式成功的反馈,然后进行自我的调整直到达到行走的目标。大步伐会让机器人摔倒,通过调整步距来判断这是否是保持直立的原因,通过不同的变化持续学习,最终能够行走。

以上说明,奖励是保持直立,惩罚就是摔倒,机器人基于对其动作的反馈信息进而优化并强化。

强化学习需要大量的数据。

比如在超级玛丽这一款游戏中,水道工通过环境的不断地变化,通过吃蘑菇进行不断地强化自己完善自己,这个过程就可以类比如强化学习

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

什么是监督学习非监督学习,强化学习相关推荐

  1. 《强化学习周刊》第47期:MEDAL、RL4Rec、H-GRAIL 非情景强化学习

    No.47 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<强化学习周刊>已经开启"订阅功能",以后我们会向您自动推送最 ...

  2. 机器学习(一)监督学习,非监督学习和强化学习

    根据机器学习的应用情况,我们又把机器学习分为三类:监督学习(SupervisedLearning, SL), 非监督学习(Unsupervised learning, UL),和强化学习(Reinfo ...

  3. 机器学习_监督学习、非监督学习、半监督学习以及强化学习概念介绍

    机器学习中通常根据数据是否有标签可以分为监督学习(supervised learning).非监督学习(unsupervised learning) 和半监督学习(semi-supervised le ...

  4. 为什么ChatGPT用强化学习而非监督学习?

    为什么ChatGPT非得用强化学习,而不直接用监督学习?原因不是那么显而易见.在上周发布的<John Schulman:通往TruthGPT之路>一文中,OpenAI联合创始人.ChatG ...

  5. 机器学习——监督学习、非监督学习、半监督式学习、增强学习

    机器学习的主要问题 supervised learing:监督学习 unsupervised learing:非监督学习 discrete:离散的 continuous:连续的 classificat ...

  6. 监督学习,非监督学习,半监督学习和增强学习

    分成四类 监督学习,非监督学习,半监督学习和增强学习 监督学习:给机器的训练数据拥有"标记"或者"答案" 监督学习:银行已经积累了一定的客户信息和他们的信用卡的 ...

  7. 监督学习,非监督学习与半监督学习

    监督学习,非监督学习与半监督学习 监督学习非监督学习与半监督学习 监督学习Supervised learning 非监督学习Unsupervised learning 半监督学习Semi-superv ...

  8. 逻辑回归和非监督学习

    目录 一.逻辑回归 1.模型的保存与加载 2.逻辑回归原理 ①逻辑回归的输入 ②sigmoid函数 ③逻辑回归的损失函数 ④逻辑回归特点 3.逻辑回归API 4.逻辑回归案例 ①案例概述 ②具体流程 ...

  9. 被追捧为“圣杯”的深度强化学习已走进死胡同

    作者 | 朱仲光 编译 | 夕颜 出品 | AI科技大本营(ID:rgznai1100) [导读]近年来,深度强化学习成为一个被业界和学术界追捧的热门技术,社区甚至将它视为金光闪闪的通向 AGI 的圣 ...

最新文章

  1. tf.gather( )的详细解析
  2. exception in thread main java,【异常】idea执行Main方法出现 Exception in thread main java.lang.NoClassDefFo...
  3. log4j:WARN No appenders could be found for logger (org.apache.ibatis.logging.LogFactory). log4j:WARN
  4. 风控策略分析中最重要的五步心法
  5. VxWorks 6.9 内核编程指导之读书笔记 -- VxWorks kernel application (一)
  6. 根据需求进行批量新增
  7. SignalR 跨域解决方案全面
  8. 高彩色显示图标(转)
  9. 093 一个人的固执里,藏着低水平的认知
  10. 中华酷联小米:未来谁将干掉三星?
  11. 宝塔备份文件到ftp服务器上,宝塔自动备份网站到FTP空间,宝塔备份ftp空间
  12. 四川师范大学计算机科学学院分数线,2020四川师范大学计算机科学学院考研复试分数线已公布...
  13. 如何保证战略落地_如何保障企业战略落地实施
  14. 1688图片批量采集技巧
  15. Python自动检查哪位学生未提交作业
  16. python画图横坐标_python画图把时间作为横坐标的方法
  17. 微服务团队_为什么团队文化对于成功的微服务至关重要
  18. Final Cut Pro 10.4.7 全面支持的你GPU
  19. 60 个 Python 小例子
  20. [Windows] Flash.Player|AX|PP|32.0.0.142 去广告 不跳更新版

热门文章

  1. 集合专辑(二):List实现类ArrayList解读
  2. 【转】解决——DBR记录的分区扇区总数溢出
  3. 成都市等市《2009工程量清单计价定额》 人工费调整的批复〔2016〕16
  4. openId -( 关注者Id )如何获取 open ID
  5. STM32之定时器(TMI)
  6. android开发新浪微博客户端 完整攻略
  7. 系统迁移到ssd_如何将操作系统迁移到HDD / SSD?
  8. FPGA差分转单端,单端转差分 IBUFDS OBUFDS BUFG
  9. 我把 Python 协程的本质扒得干干净净
  10. 机器学习建模基本过程