内容导读

最近听机器学习课程时听到这三个概念一开始有点模糊。感觉没理解透,所以自己又查了点资料,消化了一下,然后做了个笔记。Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,其实Bias在股票上也有应用,也可以反映股价在波动过程中与移动平均线偏离程度(乖离率),炒股的朋友应该知道均线的概念。其实通过这个我感觉可以更容易的理解这个概念,我们知道Bias是受算法模型的复杂度决定的,假设下图的红线是我们给出的模型,蓝色的点就是样本,这是一个最简单的线性模型,这个时候Bias就可以通过这些蓝色的点到红线沿Y轴的垂直距离来反映(即真实值与模型输出的误差),距离越大说明Bias越大,也说明拟合度更低。在概率论和统计学中方差是衡量随机变量或一组数据时离散程度的度量。以上就是我对Bias(偏差),Error(误差),和Variance(方差)的一些简单理解,图全是截取自李宏毅的PPT中。

最近听机器学习课程时听到这三个概念一开始有点模糊。感觉没理解透,所以自己又查了点资料,消化了一下,然后做了个笔记。

首先三者之间的联系是 Error = Bias + Variance(这里应该是忽略的噪音)。Error反映的是整个模型的准确度,说白了就是你给出的模型,input一个变量,和理想的output之间吻合程度,吻合度高就是Error低。Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,其实Bias在股票上也有应用,也可以反映股价在波动过程中与移动平均线偏离程度(乖离率),炒股的朋友应该知道均线的概念。其实通过这个我感觉可以更容易的理解这个概念,我们知道Bias是受算法模型的复杂度决定的,假设下图的红线是我们给出的模型,蓝色的点就是样本,这是一个最简单的线性模型,这个时候Bias就可以通过这些蓝色的点到红线沿Y轴的垂直距离来反映(即真实值与模型输出的误差),距离越大说明Bias越大,也说明拟合度更低。

当我们增加模型的复杂度,刚刚是一个线性的模型,现在是一个四次方的模型,可以明显看出点到模型的沿Y轴的垂直距离更少了,即拟合度更高了,所以Bias也更低了。所以这样我们就可以很容易理解Bias和模型复杂度之间的关系了。给出结论:当模型复杂度上升时,Bias减小。当模型复杂度降低时,Bias增加。这里就涉及到了欠拟合(unfitting)和过度拟合(overFitting)的问题了。好了,接下来让我们看看Variance(方差)的定义。

Variance(方差)反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。在概率论和统计学中方差是衡量随机变量或一组数据时离散程度的度量。下图中红线就是每一组样本对应的模型,想象一下真实数据有无限多,我们以10个样本为一组,选取了500个样本组,然后在线性模型下,针对这500个样本组,我们会有500组不同的b和w值组成的线性模型,最后构成左图的样子。当我们的模型升级成5次方的复杂程度时,针对这500个样本组,我们会有右边这张图显示的500组不同的参数构成的模型。可以看出,明显右边的图比左边的图更离散一些,试想一个极端情况,当模型就是一个常数时,这个时候模型复杂度最低,同时Variance也为0。所以我们可以得出结论:当模型复杂度低时,Variance更低,当模型复杂度高时,Variance更高。

到这里我们可以给出两个结论。

一、Bias和模型复杂度的关系:当模型复杂度上升时,Bias减小。当模型复杂度降低时,Bias增加。(反比关系)

二、Variance和模型复杂度的关系:当模型复杂度低时,Variance更低,当模型复杂度高时,Variance更高。(正比关系)

一开始我们就知道Error = Bias + Variance。整个模型的准确度和这两个都有关系,所以这下看似是有些矛盾的。如何才能取到最小的Error呢,看下图,蓝线就是Error的伴随Bias和Variance的变化情况,可以看出横坐标3应该是一个较好的结果。所以我们需要找到一个平衡点取得最优解。

实际情景中我们怎么判断自己的模型是Bias大还是Variance大呢,这个就要看到底是你的模型无法尽量大的拟合你的样本还是你的模型高度拟合你的样本但是用测试数据算时误差右很大。前者就是应该bias大导致的,也就是模型复杂度太低导致的。后者就是因为模型复杂度高导致Variance高导致的。

以上就是我对Bias(偏差),Error(误差),和Variance(方差)的一些简单理解,图全是截取自李宏毅的PPT中。

转载于:https://www.cnblogs.com/andy-0212/p/10117984.html

理解Bias(偏差),Error(误差),和Variance(方差)的区别和联系?相关推荐

  1. 统计学总结之Bias(偏差),Error(误差),和Variance(方差)的区别

    Bias(偏差),Error(误差),和Variance(方差)的区别 1).概念: bias :度量了某种学习算法的平均估计结果所能逼近学习目标的程度:(一个高的偏差意味着一个坏的匹配) varia ...

  2. Bias-Variance Tradeoff -----bias(偏差)和variance(方差),过拟合与欠拟合

    首先说结论: Bias is reduced and variance is increased in relation to model complexity 在下面的图中就是...从右下角到左上角 ...

  3. Bias-Variance Tradeoff(方差、偏差、误差)通俗理解

    直译 Bias:偏见,乖离率,偏重 Variance:方差.分歧.不一致 Tradeoff:权衡.参数折衷:(公平)交易:技术经济研究 准确 准确是两个概念:准.确. 准是bias小,就是偏差小: 确 ...

  4. 机器学习评价指标中:误差、偏差、方差的区别

    在我们看论文的时候,经常会对这几个变量分不清,下面,详细解释一下各自的定义及区别. 文章目录 1.概念定义 2.图形定义 3.数学定义 4.过拟合.欠拟合和恰好 5.结论 1.概念定义 偏差(bias ...

  5. 偏差代替误差进行稳态分析

    定义 误差(输出端定义) = 希望值 - 实际输出 稳态误差(准确度的度量) - 偏差(输入端定义) 由于上述确定关系,一般用偏差代替误差进行分析.

  6. 07 理解浮点数运算的误差

    # 理解浮点数运算的误差def cni(n,i):minNI = min(i, n-i)result = 1for j in range(0, minNI):result = result * (n ...

  7. 均方根误差,均方误差,均方根,均方差,方差的区别

    首先应该了解,"均"代表的意思是"平均Mean","方"代表的意思是"平方Square","根"代表 ...

  8. 从tcp原理角度理解Broken pipe和Connection reset by peer的区别

    从tcp原理角度理解Broken pipe和Connection reset by peer的区别 May 20th, 2014   以前我们经常会碰到Broken pipe或者Connection ...

  9. 【java】深入理解Java JVM虚拟机中init和clinit的区别

    1.概述 转载并且补充:深入理解Java JVM虚拟机中init和clinit的区别 原创 之所以来转载一下,是因为,有个学弟问了这个问题 这个知识点,回顾起来应该是我看 深入理解Java JVM虚拟 ...

最新文章

  1. android读取工程目录下的文件,Android编程实现读取工程中的txt文件功能
  2. 【青少年编程(第29周)】8月份的青少年编程组队学习结营了!
  3. 大陆唯一7nm光刻机被抵押!武汉千亿投资、台积电大牛掌舵的芯片项目官宣停摆...
  4. python【蓝桥杯vip练习题库】 ADV-364 天天向上(DP)
  5. CSS布局 ——从display,position, float属性谈起
  6. 【hdu4281状态压缩+01背包+多旅行商问题】
  7. java中实现十六进制和十进制之间的转换
  8. pbr 多出口_结合BFD基于PBR的多出口流量转发的控制与备份
  9. dataTables分页组合查询 springMVC Hibernate
  10. 【算法竞赛学习】二手车交易价格预测-Task2数据分析
  11. Spring Cloud——Eureka——架构体系
  12. 作者:李冰(1989-),女,中国电子技术标准化研究院工程师。
  13. 冒泡排序提前终止条件_“离职要提前30天通知”这9种误区,你踩过几个?
  14. openoffice转换pdf 异常问题查找处理 errorCode 525
  15. shell for while循环
  16. 配置管理——配置项标识
  17. 电容器选型指南-电子元器件选型指导系列
  18. 数字图像处理与Python实现-边缘检测-Roberts算子边缘检测
  19. 【BIT2021程设】2. 解谜游戏——初见DFS
  20. cold diffusion的个人理解

热门文章

  1. PHP建立和删除目录
  2. Android——本地服务基础(一)
  3. 【Swift学习笔记00】——enumeration枚举类型遵循协议protocol
  4. android jar 加密
  5. 电脑高手常用的5个按钮
  6. route map应用策略路由(下)
  7. 通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析
  8. leetcode: 树
  9. OpenGL整体概念
  10. public ServiceException() { super(); } public ServiceException(String message, Throwable cause,