众所周知,对于线性回归,我们把目标方程式写成:

(其中,f(x)是自变量x和因变量y之间的关系方程式,表示由噪音造成的误差项,这个误差是无法消除的)

对y的估计写成:

就是对自变量和因变量之间的关系进行的估计。一般来说,我们无从得之自变量和因变量之间的真实关系f(x)。假设为了模拟的缘故,我们设置了它们之间的关系(这样我们就知道了它们之间的真实关系),但即便如此,由于有这个irreducible error,我们还是无法得之真正的y是多少。当然,这并没有关系。因为我们想要知道的就是自变量和因变量之间的一般性关系,不需要把噪音计算进去。

通常我们使用一组训练数据让某个算法来进行学习,然后得到一个模型,这个模型能使损失函数最小。但是我们想要知道的是模型的泛化能力,也就是说我们需要模型在所有数据上都表现良好,而不仅仅是训练数据。假设我们知道所有的数据,然后把这些数据分成n组,我们把这n组数据在模型上进行测试,得到n个不同的损失函数。如果这些损失函数的平均值最小,也就是说真实数值和估计数值之间的差异平方的期望值最小,那就说明这个模型最理想。

此期望值的公式如下:

其中:

σ2的方差

公式的推导过程如下(为简便起见,f(x)缩写成f,f(x)-hat缩写成f-hat):

翻译成人话就是:

总泛化误差(Total Generalization Error) = 偏差(Bias) + 方差(Variance) + 无法消除的误差项(Irreducible Error)

我们要使总误差最小,就要想办法减少偏差和方差,因为最后一项是无法减少的。

现在让我们来看一下偏差和方差到底是什么。

偏差(bias)是指由于错误的假设导致的误差,比如说我们假设只有一个自变量能影响因变量,但其实有三个;又比如我们假设自变量和因变量之间是线性关系,但其实是非线性关系。其描述的是期望估计值和真实规律之间的差异。

方差(variance)是指通过n组训练数据学习拟合出来的结果之间的差异。其描述的是估计值和平均估计值之间差异平方的期望。

如果看了以上内容还是有点懵,那么看下面这张经典的图便可以理解:

学习n次就相当于投靶n次。如果偏差小,同时方差又小,那就相当于每次都几乎正中靶心。这样的结果当然是最好的。如果偏差大,即使方差再小,那么投靶结果也还是离靶心有一段距离。反之,如果偏差小,但是方差很大,那么投靶结果将散布在靶心四周。

有人也许会说,只要偏差小,就算方差大一点也无所谓啊,只要把多次学习的结果平均一下,还是可以预测准确的;而如果偏差大的话,那就是连基本面都错了。但是这种认为减少偏差比减少方差更重要的想法是错误的,因为通常我们只有一组数据,而不是n组,我们的模型是依据我们已有的那组数据得出来的。因此,偏差和方差同样重要。

那么有没有可能让偏差小的同时又让方差小呢?这样我们不就能得到最好的结果了吗?但通过多次实验表明,事实不如人愿。

图1

图2

红线是真实规律,左图蓝线是多次学习的结果,右图蓝线是平均结果。

图1是使用简单模型多次拟合的结果,可以看到其多次拟合的结果之间相差不大,但是平均结果和真实规律相差较大(也就是方差小,偏差大);图2是使用较复杂的模型多次拟合的结果,可以看到其多次拟合的结果之间相差较大,但是平均结果和真实规律相差不大(也就是方差大,偏差小)。

总结来说就如下图所示,简单的模型偏差大,方差小;复杂的模型则相反,偏差小,方差大。随着模型越来越复杂,偏差逐渐减小,方差逐渐增大。我们发现无法在减少偏差的同时也减少方差。因此,我们需要找到一个折中的方案,即找到总误差最小的地方,这就叫做偏差-方差均衡(Bias-Variance Tradeoff)

偏差-方差均衡这一概念贯穿整个机器学习,你随处都能见到它的身影。因此理解这一概念非常重要。

那么怎样才知道自己的模型是偏差大还是方差大呢?

高偏差:训练集误差大,验证集误差和训练集误差差不多大

高方差:训练集误差小,验证集误差非常大

可以用学习曲线(Learning Curves)来查看模型是高偏差还是高方差。学习曲线会展示误差是如何随着训练集的大小的改变而发生变化的,我们会监控两个误差得分:一个针对训练集,另一个针对验证集。

下图深蓝曲线代表随训练样本数变化而变化的训练误差,浅蓝曲线则代表验证误差。

高偏差:

高方差:

理想曲线:

又是如何解决高偏差或高方差问题呢?

高偏差问题:1,使用更复杂的模型

2,加入更多的特征

高方差问题:1,获取更多的数据

2,减少特征

3,正则化

以下是流程图:

偏差-方差的分解公式只在基于均方误差的回归问题上可以进行推导,但通过实验表明,偏差-方差均衡无论是对回归问题还是分类问题都是适用的。

转载于:https://www.cnblogs.com/HuZihu/p/9692796.html

偏差-方差均衡(Bias-Variance Tradeoff)相关推荐

  1. Bias/variance tradeoff

    Bias/variance tradeoff 线性回归中有欠拟合与过拟合,例如下图: 则会形成欠拟合, 则会形成过拟合. 尽管五次多项式会精确的预测训练集中的样本点,但在预测训练集中没有的数据,则不能 ...

  2. 统计视角下的Bias Variance Tradeoff 和它在KNN模型中的体现

    统计视角下的Bias Variance Tradeoff 和它在KNN模型中的体现 前言 一.Bias Variance Tradeoff 1. 真实数据分布和取样的假设 2. 统计理论中的Bias和 ...

  3. 偏见方差的权衡(Bias Variance Tradeoff)

    统计学习中有一个重要概念叫做residual sum-of-squares RSS看起来是一个非常合理的统计模型优化目标.但是考虑k-NN的例子,在最近邻的情况下(k=1),RSS=0,是不是

  4. 机器学习理论知识部分--偏差方差平衡(bias-variance tradeoff)

    摘要: 1.常见问题 1.1 什么是偏差与方差? 1.2 为什么会产生过拟合,有哪些方法可以预防或克服过拟合? 2.模型选择例子 3.特征选择例子 4.特征工程与数据预处理例子 内容: 1.常见问题 ...

  5. A detailed derivation for the Bias Variance tradeoff Decomposition

    Introduction 在 ESL和 ISLR中,都给出了对于 bias和 variance的讨论,并给出这样的结论: Err(X)=Var(f^(X))+Bias(f^(X))2+Var(ϵ)Er ...

  6. Bias Variance Tradeoff

    统计学习中有一个重要概念叫做residual sum-of-squares RSS看起来是一个非常合理的统计模型优化目标.但是考虑k-NN的例子,在最近邻的情况下(k=1),RSS=0,是不是k-NN ...

  7. 偏差/方差、经验风险最小化、联合界、一致收敛

    本篇与前面不同,主要内容不是算法,而是机器学习的另一部分内容--学习理论.主要包括偏差/方差(Bias/variance).经验风险最小化(Empirical Risk Minization,ERM) ...

  8. DL中的Bias Variance

    Bias Variance Trade-off Prediction Error motivation bias variance comparison derivation Analysis los ...

  9. AI学习笔记——Bias and Variance tradeoff (方差偏差的平衡)

    上一篇文章介绍了机器学习中需要理解的几个重要概念,这些概念在训练模型的过程中至关重要,尤其是Bias 和 Variance 的分析,关系到在机器学习的过程的实际操作中,如何优化训练模型. 1.Bias ...

最新文章

  1. goland/go语言项目--本地包的导入(将项目添加至GOPATH中)(基于macOS)
  2. postconstruct_@PostConstruct注解,你该好好看看
  3. eclipse警告与报错的修复
  4. 工欲善其事必先利其器(一)
  5. sql语句优化之一:尽量使用索引避免全表扫描
  6. UITableView 系列二 :资料的设定方式 (Navigation Controller切换视图) (实例)
  7. 一个解决方案创建多个项目问题解决方案
  8. jquery audio没有声音_Python实用案例编程入门:第十四章 通过声音控制您的计算机
  9. python 类的简单实用和定义
  10. 基于HTML5的WebGL实现的2D3D迷宫小游戏
  11. java 中文路径 读取_Java读取文件时中文路径处理
  12. 关于日志记录的一些感想
  13. 马虎将classname加到了id属性中,造成报错
  14. serve注解是加在哪个类_PHP 8新特性之Attributes(注解)
  15. 雷达通信一体化波形设计综述
  16. mongovue使用简介
  17. 计算机禁止开机自启动,通过禁止开机启动项快速开机,提升电脑流畅度,拒绝自启...
  18. 计算机bios设置翻译,bios设置中文翻译的操作教程
  19. 科技圈的“三座大山”正在崩塌中。。。
  20. 可视化大屏设计尺寸_UI设计中大屏可视化设计尺寸指南

热门文章

  1. 抖音APP逆向资料记录
  2. IC回收,回收电子,回收IC,电子产品回收公司
  3. 35岁的程序员被优化,是市场经济的必然选择吗
  4. 25000 字详解 23 种设计模式(多图 + 代码)
  5. 开始写老虎证券美股策略
  6. 关于H5的知识点(HTML+CSS+JS)
  7. ActiveX数据对象之事务控制在VB和DELPHI中的应用
  8. 手臂疼,竟是它惹的祸?这些征兆你想都想不到
  9. 苹果cms首页文件html,苹果cms安装完不显示首页的解决方法
  10. CUDA GPU 隔离 CUDA_VISIBLE_DEVICES