机器学习系列笔记一:Intro

文章目录

  • 机器学习系列笔记一:Intro
    • 数据
    • 基本任务
      • 1. 分类
      • 2. 回归
    • 机器学习的工作流程
    • 机器学习算法的传统分类
      • 监督学习
      • 无监督学习
      • 半监督学习
      • 增强/强化学习DRL
    • 机器学习算法的其他分类方式
      • 批量学习(离线学习)/在线学习
        • 批量学习(离线学习)
        • 在线学习
      • 参数学习/非参数学习
        • 参数学习
        • 非参数学习

数据

以鸢尾花的数据集为例:

花萼长度 花萼宽度 花瓣长度 花瓣宽度 种类
5.1 3.2 1.4 0.2 se(0)
7.0 3.2 4.7 1.4 ve(1)
6.3 3.3 6 2.5 vi(2)
  • 数据整体叫数据集(data set)

  • 每一行数据称为一个样本(sample)

  • 除最后一列,每一列表达样本的一个特征(feature)

  • 第iii 个样本的所有特征集合写作特征向量 X(i)X^{(i)}X(i),第iii个样本的第jjj 个特征值写作Xj(i)X_{j}^{\left( i \right)}Xj(i)​

  • 最后一列,称为标记(label),用向量yyy表示,第iii个样本的标记写作y(i)y^{(i)}y(i)

  • 如果X(i)X^{(i)}X(i) 为列向量,则特征空间可以表示为
    X=[(X(1))T(X(2))T(X(3))T⋮]X=\left[ \begin{array}{c} \\\left( X^{\left( 1 \right)} \right) ^T \\ \\\left( X^{\left( 2 \right)} \right) ^T \\ \\\left( X^{\left( 3 \right)} \right) ^T \\ \\\vdots \end{array} \right] X=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡​(X(1))T(X(2))T(X(3))T⋮​⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤​
    从可视化的角度,二维(在高维空间同理)的特征空间如下所示:
    其中红色表示一类,而蓝色表示另一类,从此我们可以看出分类任务的本质就是在特征空间进行切分。

基本任务

1. 分类

  • 二分类任务:
    比如猫狗分类(猫/狗)、垃圾邮件判断(是/否)、银行风险判定(有/无)

  • 多分类任务

    • 手写数字识别
    • 图像识别
    • 银行对客户的风险评级
  • 可转换为多分类问题的任务

    • 围棋
    • 自动驾驶(设置级别)
  • 如何处理分类任务

    • 一些算法只支持二分类的任务
    • 但是多分类的任务可以转换为二分类的任务
    • 有一些算法天然可以完成多分类任务
  • 多标签分类

    对图片中的人物以及其他物品都进行划分。

2. 回归

针对以波士顿房价数据为例的连续数据,机器学习将之处理为回归任务

房屋面积(平方米) 房屋年龄(年) 卧室数量(间) 最近地铁站距离(km) 价格(W)
80 3 1 10 300
120 8 3 5 500
200 5 4 12 700
  • 结果是一个连续数字的值而非一个类别

    • 房屋价格
    • 市场分析
    • 学生成绩
    • 股票价格
  • 如何处理回顾任务
    • 有一些算法可以解决回归问题
    • 在一些情况下,也可以将回归问题处理为分类问题,通过分类问题的算法来解决
      • 无人驾驶(划分操作级别)
      • 学生成绩(划分成绩的等级)

机器学习的工作流程

  • 数据集

    • 特征空间
    • 标签向量
  • 机器学习算法
    • 处理分类的算法
    • 处理回归的算法
  • 模型
    • 分类模型
    • 回归模型
    • 核心参数
      • 权重矩阵W
      • 偏置量b

机器学习算法的传统分类

监督学习

给机器的训练数据拥有“标记”或者“答案”,则称为监督式学习。

监督学习算法

  • K近邻
  • 线性回归和多项式回归
  • 逻辑回归
  • SVM
  • 决策树和随机森林

无监督学习

给机器训练的数据是没有任何标记或"答案",称之为非/无监督学习

应用场景

  • 对没有标记的数据进行分类-聚类分析

  • 对数据进行降维处理

    • 特征提取:抽取有用特征,抛弃无用特征,比如信用评级与人的胖瘦无关
    • 特征压缩:PCA,可以理解为某种降维打击
  • 异常检测

半监督学习

一部分数据有“ 标记”或者“答案”,而另一部分没有。

常规处理方案

  • 先使用无监督学习手段对数据进行处理(将那部分没有标记的数据打上标记)
  • 然后用监督学习手段做模型的训练和预测。

增强/强化学习DRL

根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式。这样的机器学习方法称之为增强学习。
代表算法

  • Q-Learning
  • Sarsa
  • DQN
  • Policy Grandients
  • Actor-Critic
  • DDPG
  • AC3

机器学习算法的其他分类方式

批量学习(离线学习)/在线学习

批量学习(离线学习)

模型只会被离线时输入的学习资料优化,当模型投入生产环境时,后续在线输入的大量数据不会再作为该模型的学习资料。

  • 优点:简单

  • 问题:适应环境变化的能力不强

    • 解决方法:定时重新批量学习(仅限于环境变化缓慢的场景)
  • 缺点:每次重新批量学习都会对CPU/GPU造成极大的开销,同时会产生时间的开销。
    在某些环境变化非常块的情景,重新批量学习是没有意义的。

在线学习

  • 优点:

    • 及时反映新的环境变化
    • 适用于数据量巨大,完全无法批量学习的环境
  • 问题:新的数据(不正常的数据)可能带来不好的变化
    • 解决方案:加强对数据的监控-无监督式学习之异常检测

参数学习/非参数学习

参数学习

假设可以最大程度地简化学习过程,与此同时也限制可以学习到是什么,这种算法简化成一个已知的函数形式,即通过固定数目的参数来拟合数据的算法。

特点: 一旦模型学习到了参数,就不再需要原有的数据集。

比如房价预测就是参数学习的一种,我们试图找到房屋各个特征对房价结果的影响程度,而这些影响程度就是参数:

参数学习算法包括两个步骤:

  • 选择一种目标函数的形式
  • 从训练数据中学习目标函数的系数

参数学习算法的一些常见例子包括:

  • Logistic Regression
  • LDA(线性判别分析)
  • 感知机
  • 朴素贝叶斯
  • 简单的神经网络

参数机器学习算法的优点:

  • 简单:这些算法很容易理解和解释结果
  • 快速:参数模型可以很快从数据中学习
  • 少量的数据:它们不需要太多的训练数据,甚至可以很好地拟合有缺陷的数

参数机器学习算法的局限性:

  • 约束:这些算法选择一种函数形式高度低限制模型本身
  • 有限的复杂性:这种算法可能更适合简单的问题
  • 不适合:在实践中,这些方法不太可能匹配潜在的目标(映射)函数

非参数学习

特点:不对模型进行过多假设,将模型视作一个黑盒,非参数不等于没参数。通过不做假设,它们可以从训练数据中自由地学习任何函数形式,即参数数量会随着训练样本数量的增长的算法。

非参数学习算法的一些常见例子包括:

  • KNN
  • 决策树,比如CART和C4.5
  • SVM

非参数机器学习算法的优点:

  • 灵活性:拟合大量的不同函数形式
  • 能力:关于潜在的函数不需要假设(或者若假设)
  • 性能:可以得到用于预测的高性能模型

非参数机器学习算法的局限性:

  • 更多的数据:需要更多的训练数据用于估计目标函数
  • :训练很慢,因为它们常常需要训练更多的参数
  • 过拟合:更多的过度拟合训练数据风险,同时它更难解释为什么要做出的具体预测

局部加权线性回归其实是一个非参数学习算法(non-parametric learning algorithm);

线性回归则是一个参数学习算法(parametric learning algorithm),因为它的参数是固定不变的,而局部加权线性回归的参数是随着预测点的不同而不同。

  • 更多的数据:需要更多的训练数据用于估计目标函数
  • :训练很慢,因为它们常常需要训练更多的参数
  • 过拟合:更多的过度拟合训练数据风险,同时它更难解释为什么要做出的具体预测

局部加权线性回归其实是一个非参数学习算法(non-parametric learning algorithm);

线性回归则是一个参数学习算法(parametric learning algorithm),因为它的参数是固定不变的,而局部加权线性回归的参数是随着预测点的不同而不同。

由于每次预测时都只看预测点附近的实例点,因此每一次预测都要重新运行一遍算法,得出一个组参数值,因此其计算代价很大。

机器学习系列笔记一:Introduction相关推荐

  1. 机器学习系列笔记六:主成分分析PCA[下]

    机器学习系列笔记六:主成分分析PCA[下] 文章目录 机器学习系列笔记六:主成分分析PCA[下] scikit-learn中的PCA 基本使用 进阶操作 对比实验 设置合理的n_components ...

  2. 机器学习系列笔记:林轩田机器学习基石——机器学习的可行性

    机器学习系列笔记:林轩田机器学习基石--机器学习的可行性

  3. 机器学习系列笔记十三: 集成学习/模型聚合

    机器学习系列笔记十三: 集成学习/模型聚合 文章目录 机器学习系列笔记十三: 集成学习/模型聚合 什么是集成学习 Voting Hard Voting 模拟实现Hard Voting 集成学习 使用V ...

  4. 李宏毅老师2022机器学习课程笔记 01 Introduction of Deep Learning

    01 Introduction of Deep Learning 机器学习相关规定 什么是机器学习 机器学习的概念 我觉得李老师讲得非常好的一点就是,他真正说清楚了机器学习中的一些因果逻辑. 比如我之 ...

  5. [李宏毅机器学习2020笔记] 1.introduction

    1. 基本概念 ⚪李宏毅老师眼中机器学习的定义--自动找函数 无论是监督学习.非监督学习.强化学习 都是某种信息或者情境到一种结果的映射 ⚪根据函数映射结果的离散性和连续性,可以分为分类和回归问题 c ...

  6. Coursera公开课笔记: 斯坦福大学机器学习第一课“引言(Introduction)”

    Coursera公开课笔记: 斯坦福大学机器学习第一课"引言(Introduction)" 注:这是我在"我爱公开课"上做的学习笔记,会在52opencours ...

  7. 吴恩达《机器学习系列课程》学习笔记(一)

    大家都想做在线教育,结果最后,B 站反而更像中国的 YouTube. 在 B 站上看到吴恩达的<机器学习系列课程>,看了看发现挺有意思,就梳理一下在此形成学习笔记. 第一节:前言 机器学习 ...

  8. 机器学习-白板推导系列笔记(二十八)-BM

    此文章主要是结合哔站shuhuai008大佬的白板推导视频:玻尔兹曼机_147min 全部笔记的汇总贴:机器学习-白板推导系列笔记 参考花书20.1 一.介绍 玻尔兹曼机连接的每个节点都是离散的二值分 ...

  9. 机器学习-白板推导系列笔记(十三)-MCMC

    此文章主要是结合哔站shuhuai008大佬的白板推导视频:MCMC_218min 全部笔记的汇总贴:机器学习-白板推导系列笔记 一.蒙特卡洛方法 蒙特卡洛方法(Monte Carlo Method) ...

最新文章

  1. NeuralRecon:单目视频的实时Coherent 三维重建
  2. 跨域解决方案一:使用CORS实现跨域
  3. linux下模拟cc攻击命令,介绍几种用Linux命令判断CC攻击的方法
  4. C语言在有序的数组是否存在固定点(附完整源码)
  5. 电商网站前端架构 学习笔记(全是干货)
  6. [html] html5都有哪些新的特性?移除了哪些元素?
  7. 2012,字王强势回归
  8. java删除数组里的两个_java – 如何从两个数组列表中删除常用值
  9. poj 1872 A Dicey Problem (bfs+WordFinal题)
  10. php curl 返回cookie_分享新浪图床上传接口PHP源码
  11. Echarts实现双y轴(不同刻度)
  12. 新人面试时候需要注意的写法
  13. Oracle 只读表空间 说明
  14. 基于激光投影技术的虚拟键盘
  15. HTML 关于p标签的嵌套问题
  16. 学习笔记Java小游戏学习笔记
  17. 关于技术美术的一些个人理解
  18. apache-Tomcat 8.5.39安装包 安装过程以及启动文件详解
  19. 比较好的开源商城系统
  20. Uniswap 的做市原理

热门文章

  1. 【PMP认证考试之个人总结】第 7 章 项目质量管理
  2. mysql unix_timestamp now() dfdfd f_数据库函数lpad的搜索结果-阿里云开发者社区
  3. 联想适合计算机专业的游戏本,全球最佳游戏笔记本电脑Top 10
  4. 基于MIPI的高性能成像系统
  5. docker 自制XXL_JOB镜像启动
  6. 叶酸修饰靶向性紫杉醇 PGA-TAXOL/羟基靶向修饰透明质酸接枝姜黄素 OH-HA-CUR/羧基靶向修饰透明质酸接枝姜黄素 COOH-HA-CUR
  7. QSS 控件背景渐变色
  8. 【python】No such file or directory的解决方法
  9. EMI/EMC设计经典70问答,拿好不谢
  10. ftp下载怎么操作,使用教程