在机器学习中学习器的实际预测结果与样本的真实输出往往存在误差(error)

学习器在训练集上的误差称为“训练误差”(training error)or “经验误差”(empirical error)

在新样本上的误差称之为“泛化误差”(generalization error)

很显然,我们希望得到一个泛化误差尽可能小的学习器

    如何衡量一个学习器的泛化误差,泛化误差=偏差+方差+噪声,这里我们引入三个概念:偏差、方差和噪声

对于测试样本为样本在数据集上的标记,的真实标记,为训练集D上学得的模型f在样本x上的预测输出。以回归任务为例:

学习算法的期望预测为预测输出的数学期望,即:

方差为预测输出与期望预测之间差值平方的数学期望,即:

噪声为样本在数据集上的标记与真实标记之间差值,即:

 偏差为期望预测与真实标记之间的差别,即:

该算法的期望泛化误差为:

偏差(bias)度量了算法的期望预测与样本真实标记之间的偏离程度,即刻画了算法的拟合能力,偏差越小,算法的拟合能力越强,同时要防止过拟合的出现。方差(var)度量了同样大小的训练集的变动所导致的学习型性能的变化,即刻画了数据扰动所造成的的影响。噪声则表达了当前任务上任何学习算法的期望泛化误差的下界,是系统性的,无法消除的,即刻画了问题本身的难度。

为使泛化误差较小,我们需要使方差和偏差都尽可能的小,既能充分拟合数据,又能使数据扰动产生的影响小。

偏差-方差窘境(bias-variance dilemma)

机器学习中的偏差、方差以及泛化误差相关推荐

  1. 机器学习偏差、方差、泛化误差的完整总结

    综述 机器学习算法的最终目标是最小化期望损失风险(即机器学习模型在任意未知测试样本上的表现),但由于数据的真实分布我们通常是不知道的,我们可用的信息来自于训练数据,因此,机器学习的学习目标往往会转化为 ...

  2. 【机器学习】理解方差、偏差且其泛化误差的关系

    https://blog.csdn.net/ChenVast/article/details/81385018 符号 涵义 测试样本 数据集 在数据集中的标记 的真实标记 训练集  学得的模型 由训练 ...

  3. 机器学习中的偏差和方差是什么?

    机器学习中的偏差和方差是什么? 机器学习全部是关于给定输入数据(X)和给定输出数据(Y),然后去寻找一个最佳映射函数(F),这个映射函数通常也被叫做目标函数. 任何机器学习算法的预测误差可以分解为三部 ...

  4. 在机器学习中为什么只需要正的误差而不用负的误差

    如果我们使用数百万对input->goal_prediction(输入->预测目标)来进行训练,在此基础上,我们仍然希望能够做出准确的预测.因此,我们希望可以将数百万对数据的平均误差降为0 ...

  5. 机器学习中关于偏差、方差和误差的理解

    在模型预测中,模型可能出现的误差来自两个主要来源:   1.因模型无法表示基本数据的复杂度而造成的偏差(bias);   2.因模型对训练它所用的有限数据过度敏感而造成的方差(variance).   ...

  6. 转载:理解机器学习中的偏差与方差

    学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise). 在估计学习算法性能的过程中, ...

  7. 理解机器学习中的偏差与方差

    学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise). 在估计学习算法性能的过程中, ...

  8. 机器学习中的偏差和方差

    1.误差的两大来源 机器学习中有两个主要的误差来源:偏差和方差.理解它们将协助合理安排时间去执行策略来提升性能. 首先了解一下数据集的分类: 训练集(training set) 用于运行你的学习算法. ...

  9. 进化的学习曲线:方差与泛化误差

    在机器学习中,我们用来衡量模型在未知数据上的准确率的指标,叫做泛化误差(Genelization error).一个集成模型(f)在未知数据集(D)上的泛化误差 ,由方差 (var),偏差(bais) ...

最新文章

  1. 移植uboot之修改代码支持NorFlash记录
  2. CV Code|计算机视觉开源周报20200602期~文末送书
  3. Event Handling Guide for iOS——由触摸事件传递想到的
  4. 一步一步写算法(之 算法总结)
  5. 修改功能(Ajax版)
  6. Python写一个服务
  7. makefile中伪目标的理解
  8. 基于js利用经纬度进行两地的距离计算(转)
  9. 周记20180309
  10. 嵌入式课程设计第一篇之OLED与温湿度模块
  11. 浙江中医药大学第十二届大学生程序设计竞赛 Wpremig的AH之战
  12. 6 errors and 0 warnings potentially fixable with the `--fix` option.
  13. 使用Python3采集小说网站
  14. 龙年贺词成语-龙字成语
  15. 最强悍的围棋人机对战程序 MoGo !
  16. 阿哈c语言教程pdf,C++教程-完整版.pdf
  17. Dubbo学习(一)
  18. [BZOJ1132][POI2008]Tro(计算几何)
  19. Mongodb的三种集群方式的搭建
  20. 全国计算机考试一级有必要考吗,计算机一级有必要考吗 有用吗

热门文章

  1. 准独角兽已出现,火爆的隐私计算赛道谁是头部玩家?
  2. docker安装mysql(PXC)集群
  3. 使用LCN框架解决分布式事物
  4. keystone安装与配置
  5. 元器件选型 之 安规电容篇
  6. 使用全局阈值进行灰度图像二值化
  7. Base编码(贝斯家族)
  8. 地图与定位(一)定位服务
  9. Mysterious Bacteria(唯一质因子解+素数筛)
  10. Nomad集群 自身高可用测试