监督学习

训练集的数据都是有标签的数据,在输入数据时,我们知道这个数据对应的输出,模型不断的建模数据输入和输出之间的关系。

不断的调整模型,缩小与真实输出的loss,直到输入输出一致。比如已知一些图片是猫,一些图片不是猫,那么训练一个算法,当一个新的图片输入算法的时候算法告诉我们这张图片是不是猫。

分类问题:输入x,如果输出 y是连续值,例如预测房价

回归问题:输入x,输出 y是确定值,例如判断是不是猫

无监督学习

训练的数据没有分类,希望模型自动的将数据按照自己学到的特征进行分类,比如输入猫和狗的图片,但是并不知道那一张对应的是什么,希望模型自动可以判别那一张是猫,那一张是狗。

弱监督学习

训练的数据有一个弱标签,希望通过深度学习,得到一个强标签。

比如说,知道一张图片是一只猫,通过训练知道猫在那里,将猫和背景分离开来。

半监督学习

是监督学习和无监督学习的合并。待补充。

强化学习

学习的是一个策略,输出的是一个序列,不断的达到最终的结果,一个动作如果是好的策略的组成部分,它就是好的动作。

系统在没有人为指导的情况下,通过不断的试错来提升任务性能的过程。对学习过程有记忆,可以通过以往好的动作来决定下一步动作。比如:下棋游戏,不知道每一步是对还是错,但是知道一系列决策后最终的结果是输还是赢。

参考:https://blog.csdn.net/limiyudianzi/article/details/78921450

参考:https://www.jianshu.com/p/d1c97a4d2e70

监督学习、无监督学习、弱监督学习、半监督学习、强化学习概念相关推荐

  1. 《ARPG游戏深度强化学习 》深度强化学习概念:ARPG0.1世界的构造

    深度强化学习概念:ARPG0.1世界的构造 背景:决策.计划及更复杂的任务需要更高水平的智能.更强的人工智能系统还需要具备推理.思考和规划能力. 深度学习=深度神经网络+数据平衡+各类体系化的优化算法 ...

  2. 什么是强化学习?(主要的强化学习概念)

    文章目录 什么是强化学习?(主要的强化学习概念) 4.主要的强化学习概念 4.1 基于模型与无模型(Model-based vs. Model-free) 4.2 预测(prediction)和控制( ...

  3. 机器学习_监督学习、非监督学习、半监督学习以及强化学习概念介绍

    机器学习中通常根据数据是否有标签可以分为监督学习(supervised learning).非监督学习(unsupervised learning) 和半监督学习(semi-supervised le ...

  4. 强化学习(一)——强化学习概念、方法汇总及游戏例子

    一.什么是强化学习 监督学习:有数据和数据对应的标签,根据这些数据和标签进行学习,从而判断出新的数据属于哪一类标签. 强化学习:比监督学习更进一步,一开始就没有数据和对应的标签.通过在环境中尝试获取数 ...

  5. 【强化学习】逆强化学习概念

    逆向强化学习 什么是逆向强化学习 强化学习时求累计回报期望最大时的最优策略,在求解过程中的奖励函数是人为指定的,而奖励函数的设置与最后获得最优的策略有很大关联,而在很多复杂任务中,回报函数是很难定下来 ...

  6. 【机器学习 基本概念】监督学习、无监督学习、半监督学习与强化学习

    本文转载自:一文读懂监督学习.无监督学习.半监督学习与强化学习这四种深度学习方式 一般说来,训练深度学习网络的方式主要有四种:监督.无监督.半监督和强化学习.在接下来的文章中,计算机视觉战队将逐个解释 ...

  7. 监督学习、无监督学习、半监督学习、强化学习

    图:pixabay 「机器人圈」导览:一般说来,训练深度学习网络的方式主要有四种:监督.无监督.半监督和强化学习.在接下来的文章中,机器人圈将逐个解释这些方法背后所蕴含的理论知识.除此之外,机器人圈将 ...

  8. 有监督学习和无监督学习_比监督学习做的更好:半监督学习

    近期大热的半监督学习! 本文转载自:AI公园 作者:Andre Ye | 编译:ronghuaiyang注:文末附CV学习交流群. 导读 为什么半监督学习是机器学习的未来. 监督学习是人工智能领域的第 ...

  9. 监督学习、无监督学习、半监督学习概述

    前言 机器学习分为:监督学习,无监督学习,半监督学习(也可以用hinton所说的强化学习)等. 在这里,主要理解一下监督学习和无监督学习. 监督学习(supervised learning) 从给定的 ...

  10. 【深度学习】半监督学习入门:伪标签学习和无监督SVM

    一.半监督学习 1-1.什么是半监督学习 让学习器不依赖外界交互.自动地利用未标记样本来提升学习性能,就是半监督学习(semi-supervised learning). 要利用未标记样本,必然要做一 ...

最新文章

  1. 为什么重新new两个线程线程号相同_C++ 20中的新线程(jthread)功能
  2. 高质量程序程序设计指南摘录
  3. eclipse 鲜为人知的调试技巧,你用过多少
  4. 自嗨锅要持续嗨,还得碾碎这四个“绊脚石”
  5. esp32 micropython spiffs_spiffs 文件系统在esp32中的应用
  6. 【BZOJ】1901: Zju2112 Dynamic Rankings(区间第k小+树状数组套主席树)
  7. 【LeetCode】【HOT】226. 翻转二叉树(递归)
  8. 使C#代码现代化——第四部分:类型
  9. AWS想到办法让Alexa能在毫秒内做出回复
  10. 联想y7000p电池固件下载_联想拯救者Y7000P安装双系统win10+ubuntu18.04
  11. Android控件开发之Gallery3D酷炫效果(带源码)
  12. php 微信 other,PHP——仿造微信OpenId
  13. springboot接口签名统一效验_Spring Boot 优雅地实现接口参数校验
  14. 我用vc+仿照金山毒霸软件工具界面(创世纪篇)
  15. 北京程序员小哥哥的故事
  16. SequoiaDB 巨杉数据库产品下载
  17. 微信小程序自定义组件使用阿里矢量图标库图标
  18. 简单图像滤镜功能的Java实现
  19. 基站定位经纬度查询免费api接口-LBS数据仓库
  20. Spring-AOP 代理,增强

热门文章

  1. 基于AES的图像加密
  2. maxscale mysql 主从_MariaDB主从配置与MaxScale实现MySQL读写分离
  3. scara机器人运动学正逆解
  4. DVWA安装教程(懂你的不懂·详细)
  5. sqlserver格式化-年月日
  6. excel24张函数图解
  7. 实对称矩阵可对角化证明
  8. PID控制最通俗的解释与PID参数的整定方法
  9. Excel学习笔记:P1-Excel入门
  10. Python网络数据采集的方法