【Machine Learning】监督学习、非监督学习及强化学习对比
- Supervised Learning
- Unsupervised Learning
- Reinforced Learning
Goal:
- How to apply these methods
- How to evaluate each methods
What is Machine Learning?
1.computational statistics
2.computational artifacts(人工制品) that learn over time based on experience
一、分类
- Supervised Learning
- Unsupervised Learning
- Reinforcement Learning
1.1 Supervised learning——Approximation
- 一句话实质:About Function Approximation(函数逼近),or Approximate function induction(近似函数归纳)
- feed with labeled examples,comeing up with some function that generalizes beyond(泛化函数)
- 有反馈
1.2 Unsupervised learning——Description
- 一句话实质:About Compact(简洁的) Description
- 无监督学习是密切相关的统计数据密度估计的问题。
- 无反馈
- Unsupervised learning could be helpful in the supervised Setting
1.3 Reinforcement learning (增强学习)
- 一句话实质:Learning from delayed reward (通过延迟性奖励进行学习)
- 执行许多步之后才知道反馈,就像下棋(对比监督学习的立即反馈)
二、归纳法(induction)与演绎法(deduction)
- Generalize 泛化
- 了解机器学习发展史
- 机器学习算法与归纳而不是演绎有关
- Inductive bias 归纳偏差
归纳:从示例到一般规律(从一个示例得出更普遍的规律)
演绎:从规则到实例,a general rule to specific instances,basically like reasoning(推理)
三、三种机器学习的比较
表述成:优化问题
Supervised Learning —— labels data well(to find a funtion to score that) (标记数据)
Unsupervised Learning —— cluster scores well(最好的分类方法)
Reinforcement learning —— behavior scores well (最好的表现)
3.2 Data
Data is king in machine learning.
转变:以算法为中心——》以数据为中心
- Believe in your data!
转载于:https://www.cnblogs.com/Neo007/p/8242544.html
【Machine Learning】监督学习、非监督学习及强化学习对比相关推荐
- Machine Learning | (12) 非监督学习-k-means
Machine Learning | 机器学习简介 Machine Learning | (1) Scikit-learn与特征工程 Machine Learning | (2) sklearn数据集 ...
- 强化学习(Reinforcement Learning)是什么?强化学习(Reinforcement Learning)和常规的监督学习以及无监督学习有哪些不同?
强化学习(Reinforcement Learning)是什么?强化学习(Reinforcement Learning)和常规的监督学习以及无监督学习有哪些不同? 目录
- 什么是监督学习非监督学习,强化学习
什么是监督学习非监督学习,强化学习 机器学习按照学习方式的不同,分为很多的类型,主要的类型分为 监督学习 非监督学习 强化学习 半监督学习 什么是监督学习? 利用一组已知类别的样本调整分类器的参数,使 ...
- Machine Learning(吴恩达) 学习笔记(一)
Machine Learning(吴恩达) 学习笔记(一) 1.什么是机器学习? 2.监督学习 3.无监督学习 4.单变量线性回归 4.1代价函数 4.2 梯度下降 5.代码回顾 最近在听吴恩达老师的 ...
- 【Machine Learning 一】监督学习与无监督学习
机器学习分为:监督学习,无监督学习,半监督学习(也可以用hinton所说的强化学习)等. 在这里,主要理解一下监督学习和无监督学习. 监督学习: (supervised learning) 给定一 ...
- python 线性回归与逻辑回归区别(有监督学习【分类、回归】、无监督学习【聚类、强化学习】、损失函数、梯度下降、学习率、过拟合、欠拟合、正则化)
引用文章1 https://blog.csdn.net/viewcode/article/details/8794401 引用文章2:一.线性回归和逻辑回归 一.什么是机器学习 利用大量的数据样本,使 ...
- 【Machine Learning系列】带你快速学习十大机器学习算法
前言 机器学习算法是一类用于从数据中学习模式和规律的算法.这些算法可以通过训练样本的输入和输出来推断出模型的参数,然后用于预测新的未知数据. 文章目录 前言 机器学习算法 1. 线性回归算法 Line ...
- Machine learning(ML)常用的几类学习器及Python实现
Machine learning(ML)常用的几种学习器及Python实现 一.决策树 1.函数的参数主要为: 2. 决策树的保存 二.Boostings 1.Adaboost 1.构建训练函数 2. ...
- Multiple Landmark Detection using Multi-AgentReinforcement Learning基于多智能体强化学习的多重地标检测
目录 摘要 介绍 贡献 相关工作 方法 协作代理 实验 数据集 训练 测试 讨论 计算性能 结论 References 摘要 解剖标志的检测是医学图像分析和诊断.解释和指导应用的重要步骤. 对地标进行 ...
最新文章
- 6-12 二叉搜索树的操作集
- Python培训教程分享:Python模块如何导入__all__属性?
- AIX系统CPU性能评估-1
- 计算机系统结构广义定义,《计算机系统结构》电子教案(清华版).ppt.ppt
- c# socket接收字符串_socket通信很难?这一文让你轻松搞定!
- Linux shell脚本基础学习详细介绍(完整版)
- [TJOI2013]拯救小矮人(反悔贪心证明),「ICPC World Finals 2019」Hobson 的火车(基环树,差分)
- 代码回到之前版本_聊一聊版本控制
- 网络虚拟化技术(二): TUN/TAP MACVLAN MACVTAP
- vue项目 报sockjs.js?9be2:1606 GET http://192.168.43.226:8080/sockjs-node/info?t=1584966826465 net::ERR
- Silverlight下载-Silverlight 1.1 Tools下载
- 鸟哥的linux私房菜 简书,《鸟哥的linux私房菜》学习笔记
- 芯烨Xprinter XP-D3601B 打印机驱动
- 常用机器视觉软件介绍
- 苹果自研Apple M1芯片对机器学习意味着什么?
- 微信电脑端【多开问题】+附赠,解决桌面图标变小白块问题
- 单身的我写了一个七夕表白程序
- 一套策划正确的网页配色方案
- 抖音电商主播考核绩效直播运营KPI方案
- 郭大侠与Rabi-Ribi
热门文章
- spring@Transactional注解
- 非寻常实习记Ⅱ:改变中的快乐成长
- Python少打字小技巧
- 【SQL】电商网站各模块指标的统计以及分析
- 接口测试之post常见数据提交方式
- java数组循环动态赋值_04、Java基础语法(循环嵌套、break、continue、方法、方法的重载、数组动态初始化)...
- c++ 从double变为long int 数据丢失_面试官:Java 中有几种基本数据类型是什么?各自占用多少字节?...
- python图像处理模块_Python图像处理库PIL的ImageEnhance模块使用介绍
- 复杂存储过程学习_AI数据存储设备选型的6个关键要素
- 初学WEB前端的建议,你不看给别人可惜了!