偏差: 是指一个模型的在不同训练集上的平均性能和最优模型的差异,可以用来衡量一个模型的拟合能力。换句话说,偏差反映的是预测值期望\(E(f(x))\)真实值\(y\)之间偏移了多少;

方差: 是指一个模型在不同训练集上的差异,可以用来衡量一个模型是否容易过拟合。换句话说,方差衡量的是模型自身的稳定性,就是说模型每次输出都会有或大或小的抖动,方差反映的是\(f(x)\)与\(E(f(x))\)之间的差别是否稳定;

噪声: 表达了当前任务上任何学习算法所能达到的期望泛化误差的下界,也就是最小值;

泛化误差: 可以分解为 偏差、方差和噪声之和。

泛化性能是由学习算法的能力、 数据的充分性以及学习任务本身的难度所共同决定的。给定学习任务为了取得较好的泛化性能,则需要偏差较小,即能充分拟合数据,并且使方差较小,即使得数据扰动产生的影响小。


当模型表现不佳时?通常出现两种问题,一种是高偏差问题,另一种是高方差问题。

以下图中给出了机器学习算法的偏差和方差的四种不同组合情况。每个图的中心点为最优模型f∗(x),蓝点为不同训练集D上得到的模型 fD(x) 。

上图所示为偏差和方差的四种组合:

(a)低方差-低偏差:理想情况;

(b)低方差-高偏差:模型泛化能力很好,但拟合能力不足;

(c)高方差-低偏差:模型拟合能力很好,但泛化能力较差;

(d)高方差-高偏差:最差情况。

就像打把一样,偏差描述了射击总体是否偏离目标,而方差描述射击准不准。


方差一般会随着训练样本的增加而减少。当样本足够多时,方差比较少,可以选择能力强的模型来减少偏差。然而在很多机器学习任务上,训练集往往比较有限,最优的偏差和最优的方差就无法兼顾。

随着模型复杂度的增加,模型的拟合能力增强,偏差减小而方差增大,从而导致过拟合。以结构错误最小化为例,可以通过调整正则化系数 \(\lambda\) 来控制模型的复杂度。

当 \(\lambda\) 增大时,模型复杂度降低,方差减小而偏差上升,从而避免过拟合。

当 \(\lambda\) 过大时,总的期望错误反而会上升。

因此,一个好的正则化系数需要在偏差和方差之间取得较好的平衡。如下图1所示,最优模型并不一定是偏差曲线和方差曲线的交点。

图1:《神经网络与深度学习》插图

方差和偏差之间存在此消彼长的关系,方差和偏差是不能同时达到最小的。

此外,在《机器学习》中,有下图2,周志华老师给了以下解释:

(1)当训练不足时,学习器的拟合能力不够强,训练数据的扰动不足以使学习器产生显著变化,此时偏差主导了泛化错误率;

(2)随着训练程度的加深,学习器的拟合能力逐渐增强,训练数据发生的扰动逐渐被学习器学到,方差逐渐主导了泛化错误率;

(3)在训练程度充足后,学习器的拟合能力已经非常强,训练数据的轻微扰动都会导致学习器发生显著变化,若训练数据自身的,非全局的特性被学习器学习到了,则将发生过拟合。

图2:《机器学习》插图


我们训练一个模型的最终目的是为了让这个模型在测试数据上拟合效果好,也就是\(Error(test)\)比较小,但在实际问题中,无法得到测试数据,也就根本不知道测试数据的内在规律(如果知道了,还要机器学习做什么?),所以需要通过一定策略来减小\(Error(test)\),分两步:

(1)让\(Error(train)\)尽可能小;

(2)让\(Error(train)\)尽可能等于\(Error(test)\)

怎么让\(Error(train)\)尽可能小呢?\(\longrightarrow\) 把模型复杂化,参数增多\(\longrightarrow\) low bias

怎么让\(Error(train)\)尽可能等于\(Error(test)\) \(\longrightarrow\) 把模型简单化,参数减少。\(Error(train)\)=\(Error(test)\)代表模型没有偏见,对训练集和测试集一视同仁,也就是模型更具有通用性,对局部数据不敏感,那就是简单的模型\(\longrightarrow\) low variance

对于高偏差问题,我们一般采取:

(1)更加复杂的模型

(2)增加训练时间

对于高方差问题,我们一般采取:

(1)更多的训练数据

(2)正则化

在目前的大数据时代和深度学习算法不断进步的今天,只要我们训练一个更大的神经网络,准备更多的训练数据,就可以解决以上问题。可以做到仅仅较小方差或者偏差,而不对另一方产生过多影响,也就是方差和偏差的相关性减弱了。这也是深度学习中不必太关注偏差-方差权衡的原因。

Reference:

  1. 邱锡鹏老师的《神经网络与深度学习》
  2. 吴恩达老师的《深度学习》课程
  3. 周志华老师的《机器学习》
  4. 什么是偏差-方差权衡
  5. 从机器学习算法合理性的角度解释方差和偏差
  6. 知乎用户修宇亮的答案

转载于:https://www.cnblogs.com/xxxxxxxxx/p/10975281.html

关于偏差-方差的分析相关推荐

  1. 2.5 数据不匹配时,偏差和方差的分析-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 2.4 在不同的划分上进行训练并测试 回到目录 2.6 定位数据不匹配 数据不匹配时,偏差和方差的分析 (Bias and Variance with Mismatched ...

  2. 机器学习之过拟合与欠拟合以及偏差-方差分解

    1.过拟合 所谓过拟合就是:把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样就会导致训练出的模型其泛化能力降低,这就是过拟合. 如何解决? 1)Early stopping Earl ...

  3. 1.2 偏差/方差-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.1 训练/开发/测试集 回到目录 1.3 机器学习基础 偏差/方差 (Bias/Variance) 我注意到,几乎所有机器学习从业人员都期望深刻理解偏差和方差,这两个概念 ...

  4. 机器学习偏差方差_机器学习101 —偏差方差难题

    机器学习偏差方差 Determining the performance of our model is one of the most crucial steps in the machine le ...

  5. 花书+吴恩达深度学习(十九)构建模型策略(训练模型顺序、偏差方差、数据集划分、数据不匹配)

    目录 0. 前言 1. 调试模型顺序 2. 偏差方差的解决方法 3. 数据集的选取划分 4. 数据不匹配问题 5. 评估指标的选取 6. 贝叶斯最佳误差 如果这篇文章对你有一点小小的帮助,请给个关注, ...

  6. 14. 偏差-方差权衡

    2.5 偏差-方差权衡 在根据训练数据拟合出预测函数后,通过分析该函数在测试实例处的损失期望值,可以获得关于预测误差的重要知识.下面基于叠加模型,对回归预测函数进行计算,其结论对分类同样适用. 设某回 ...

  7. 误差、方差、偏差、噪声、训练误差+验证误差、偏差方差窘境、错误率和误差、过拟合与欠拟合

    误差.方差.偏差.噪声.训练误差+验证误差.偏差方差窘境.错误率和误差.过拟合与欠拟合 目录

  8. 独家 | 教你用Python来计算偏差-方差权衡

    作者:Jason Brownlee 翻译:吴振东 校对:车前子 本文约3800字,建议阅读8分钟. 本文为你讲解模型偏差.方差和偏差-方差权衡的定义及联系,并教你用Python来计算. 衡量一个机器学 ...

  9. 误差模型:过拟合,交叉验证,偏差-方差权衡

    from: http://www.voidcn.com/blog/Mark_LQ/article/p-5983585.html Introduction In this post you will g ...

最新文章

  1. android 图片横竖判断_Android横竖屏切换及其对应布局加载问题详解
  2. Verilog设计实例(6)基于Verilog的各种移位寄存器实现
  3. 3.4.1 流量控制与可靠传输机制
  4. 中的挂起是什么意思_数字博物馆是什么意思?数字博物馆用到了哪些技术?
  5. 我去,剑桥硕士重委员会可还行~我颤抖地拿起了ethz的课程描述
  6. 【Spring 5】响应式Web框架实战(下)
  7. (数据科学学习手札30)朴素贝叶斯分类器的原理详解Python与R实现
  8. python随机生成两个一维数组_如何用python随机产生一个一维数组
  9. DirectShow 在 VS2010 中开发环境的设置
  10. python超清壁纸_python爬虫 爬取超清壁纸代码实例
  11. 读高明之《帛書老子校注》
  12. console和nsh的区别
  13. 【001】机器学习基础-凸优化基础
  14. (java)给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。
  15. Python turtle入门:用小海龟画美队盾牌 (内附画五角星的详细代码)
  16. 设计模式--创建型设计模式
  17. 【javaweb简单教程】1.搭建Web环境、初识JSP
  18. 一文看懂:性能监控神器JavaMelody
  19. .net core QuartzUI 执行定时任务
  20. 【Python】matplotlib.pyplot显示图片

热门文章

  1. 蝉知CMS本地迁移到服务器具体步骤
  2. ZigBee 3.0教程-步骤6:物理接口-Light
  3. 打卡3本书10句话-20
  4. LaTex 图文混排 文字环绕
  5. 2021-10-20马丁策略真的能盈利?
  6. 【机器学习】`ConvergenceWarning: Liblinear failed to converge, increase the number of iterations`问题记录
  7. 【工具总结】前端常用辅助工具
  8. 设计一个形状类(接口)Shape,方法:求周长和求面积形状类(接口)的子类(实现类): Rect(矩形) Circle(圆形)Rect类的子类: Square(正方形)不同的子类会有不同的计算周长和面
  9. GPT_MBR与GPT分区扫盲,希捷2T、3T硬盘测评(多图杀猫)。申精!
  10. 灰度重采样的方法分为_重采样 和 重分类