【Machine Learning】监督学习、非监督学习及强化学习对比

Supervised Learning
Unsupervised Learning
Reinforced Learning

Goal：

How to apply these methods
How to evaluate each methods

What is Machine Learning?

1.computational statistics
2.computational artifacts(人工制品) that learn over time based on experience

一、分类

Supervised Learning
Unsupervised Learning
Reinforcement Learning

1.1 Supervised learning——Approximation

一句话实质：About Function Approximation(函数逼近)，or Approximate function induction(近似函数归纳)
feed with labeled examples，comeing up with some function that generalizes beyond(泛化函数)
有反馈

1.2 Unsupervised learning——Description

一句话实质：About Compact(简洁的) Description
无监督学习是密切相关的统计数据密度估计的问题。
无反馈
Unsupervised learning could be helpful in the supervised Setting

1.3 Reinforcement learning (增强学习)

一句话实质：Learning from delayed reward (通过延迟性奖励进行学习)
执行许多步之后才知道反馈，就像下棋（对比监督学习的立即反馈）

二、归纳法(induction)与演绎法(deduction)

Generalize 泛化
了解机器学习发展史
机器学习算法与归纳而不是演绎有关
Inductive bias 归纳偏差

归纳：从示例到一般规律（从一个示例得出更普遍的规律）

演绎：从规则到实例，a general rule to specific instances,basically like reasoning(推理)

三、三种机器学习的比较

表述成：优化问题

Supervised Learning —— labels data well(to find a funtion to score that) （标记数据）
Unsupervised Learning —— cluster scores well(最好的分类方法)
Reinforcement learning —— behavior scores well (最好的表现)

3.2 Data

Data is king in machine learning.

转变：以算法为中心——》以数据为中心

Believe in your data！

转载于:https://www.cnblogs.com/Neo007/p/8242544.html

【Machine Learning】监督学习、非监督学习及强化学习对比相关推荐

Machine Learning | (12) 非监督学习-k-means
Machine Learning | 机器学习简介 Machine Learning | (1) Scikit-learn与特征工程 Machine Learning | (2) sklearn数据集 ...
强化学习（Reinforcement Learning）是什么？强化学习（Reinforcement Learning）和常规的监督学习以及无监督学习有哪些不同？
强化学习(Reinforcement Learning)是什么?强化学习(Reinforcement Learning)和常规的监督学习以及无监督学习有哪些不同? 目录
什么是监督学习非监督学习，强化学习
什么是监督学习非监督学习,强化学习机器学习按照学习方式的不同,分为很多的类型,主要的类型分为监督学习非监督学习强化学习半监督学习什么是监督学习? 利用一组已知类别的样本调整分类器的参数,使 ...
Machine Learning（吴恩达）学习笔记（一）
Machine Learning(吴恩达) 学习笔记(一) 1.什么是机器学习? 2.监督学习 3.无监督学习 4.单变量线性回归 4.1代价函数 4.2 梯度下降 5.代码回顾最近在听吴恩达老师的 ...
【Machine Learning 一】监督学习与无监督学习
机器学习分为:监督学习,无监督学习,半监督学习(也可以用hinton所说的强化学习)等. 在这里,主要理解一下监督学习和无监督学习. 监督学习: (supervised learning) 给定一 ...
python 线性回归与逻辑回归区别（有监督学习【分类、回归】、无监督学习【聚类、强化学习】、损失函数、梯度下降、学习率、过拟合、欠拟合、正则化）
引用文章1 https://blog.csdn.net/viewcode/article/details/8794401 引用文章2:一.线性回归和逻辑回归一.什么是机器学习利用大量的数据样本,使 ...
【Machine Learning系列】带你快速学习十大机器学习算法
前言机器学习算法是一类用于从数据中学习模式和规律的算法.这些算法可以通过训练样本的输入和输出来推断出模型的参数,然后用于预测新的未知数据. 文章目录前言机器学习算法 1. 线性回归算法 Line ...
Machine learning(ML)常用的几类学习器及Python实现
Machine learning(ML)常用的几种学习器及Python实现一.决策树 1.函数的参数主要为: 2. 决策树的保存二.Boostings 1.Adaboost 1.构建训练函数 2. ...
Multiple Landmark Detection using Multi-AgentReinforcement Learning基于多智能体强化学习的多重地标检测
目录摘要介绍贡献相关工作方法协作代理实验数据集训练测试讨论计算性能结论 References 摘要解剖标志的检测是医学图像分析和诊断.解释和指导应用的重要步骤. 对地标进行 ...