更新日志:2020-3-10

谢谢@ProQianXiao的指正。偏差-方差的确是在测试集中进行的。

之前的误解是,偏差和方差的计算是同一个模型对不同样本的预测结果的偏差和方差;而实际上是不同模型对同一个样本的预测结果的偏差和方差。

这时候就要祭出网上都有的这张图了

比如中间大红色点的是这个样本的真实标签,小小的蓝色点是不同样本的预测结果。接下来简介一下图:

1.最好的模型就是低偏差低方差,这样所有的模型觉得这个图片所属的标签相同,同时标签是真实标签

2.横排第二张图,所有的模型有不同的观点,导致预测结果方差很大,但是他们的预测结果都在真实标签附近徘徊,可能有点过拟合了

3.第二排的第一列,所有的模型都认为这个样本属于同一个标签,但是这个标签并不是真实标签,这就明显预测错误,有可能是模型刚初始化,所有权重都比较小且接近,也没训练,导致欠拟合。

4.第二排第二列,所有的模型都各抒己见,同时他们判断的结果与真实结果天差地别,这种情况我也不知道怎么称呼,不过训练久了一般不会出现这种情况吧。

综上,我们训练模型,通常会先出现方差小偏差大的情况,随后偏差慢慢减少,方差慢慢增大的情况,如果模型够好,也可能会出现偏差慢慢减少,方差慢慢减少的情况,这是最理想的结果。

——————————————————————————————————————————————

下面是之前的错误想法,是之前误解的偏差和方差是同一个模型在不同数据上的预测结果的偏差和方差。

不知怎么的,想到了这三个名词之间的关系,特地去查了一下,貌似学问还挺大。

以下纯属查阅资料,自己的理解,如有错误,谢谢下方评论纠正^_^

主要参考资料:知乎上关于这三个名词的讨论,以及周志华的《机器学习》这本书第45页,以及一篇英文文档。

偏置-方差是评估模型泛化能力的一个工具。

个人感觉这个评估是在训练的时候中进行的(训练过程用到了训练集和验证集),因为大部分文献说 “bias是期望输出与真实标记的差,如果bias过小会产生过拟合” ;那么如果我们将这个“期望输出”理解为测试集的期望输出,得到 (测试集期望输出)-(实际标记) 的值,而我们的最终目标就是让这个值最小,怎么可能是这个值越小,过拟合会越严重呢?所以只有是 (训练集期望输出)-(实际标记) 的值非常小的时候,才会造成过拟合。也就是我们常说的 “在训练集上的误差很小,但是在测试集上的误差很大,那么得到的模型很可能是产生过拟合的模型”。

再举个栗子,在训练RBM的时候,能量函数或者计算神经元激活概率时都有一个偏置,这个偏置就只是在训练的时候不断更新,怎么可能是在测试的时候更新呢?这里有一个思路,是否可以通过偏置的大小或者平均值来判断RBM是否过拟合了呢~~~这个以后测试一下

说了这么多乱糟糟的,总结一下:

先说三个相关数据标记:①样本的真实标记 ②样本在训练集中的标记(可能含噪声)③样本在训练时每次得到的输出标记

噪声(noise):训练集的标记与真实标记的误差平方的均值,即②-①的平方的均值。

偏置(bias):训练模型的时候,每一次训练得到的训练集预测标签与原始真实标签的偏离程度(即③与①的差),如果此偏离程度过小,则会导致过拟合的发生,因为可能将训练集中的噪声也学习了。所以说偏置刻画了学习算法本身的拟合能力,如果拟合能力不好,偏置较大,出现欠拟合;反之拟合能力过好,偏置较小,容易出现过拟合。在训练的时候可以发现这个bias理论上应该是逐渐变小的,表明我们的模型正在不断学习有用的东西。【当然这是针对只有一个训练集的情况下,如果有多个训练集,就计算出每一个样本在各个训练集下的预测值的均值,然后计算此均值与真实值的误差即为偏差】

方差(variance):同样是针对训练模型时每一次得到的训练集预测标签,但是此时是最终一次训练以后得到的所有标签之间的方差且与真实标签无关(即③本身的方差),即计算这些预测标签的均值,再计算(每一个标签-均值)的平方和。可以想象,刚开始方差肯定是很小的,因为刚开始学习,啥都不会,即使对于有或者无噪声的数据,我们都无法做出精准判断,然而随着学习的进行,有些我们会越学越好,但是会越来越多地受到噪声数据的干扰,方差也会越来越大。

误差(error):预测标记与训练集中标记的误差(③和②的差)。

公式表示如下:

(以下样本均为训练集中的数据,与测试集毫无关系,且只训练了1个模型,用来测试的样本只是一类样本,比如拿一堆1来做分类;我当时有一个疑问就是我拿一个1和一个1000来分类,就算完全预测对,方差也很大。所以用来计算方差和均值的样本必须是同一类样本在模型的输出)

设样本真实标记为R,可能含噪声的训练集中的标记为T,最终训练得到的输出标记为P,符号E代表求平均。注意,R、T、P都是向量,表示有好几个样本。则

误差公式的证明详细请看周志华老师《机器学习》的P45

——————————————————————————————————————————————————————————————

整个理解过程主要碰到的疑问就是:

第一,bias的期望输出P到底来自测试集还是训练集。如果是测试集,怎么去解释bias越小过拟合。过拟合是测试集误差大。

第二,测试用的样本是原始标记是1和1000的时候,标签方差本身就很大,如何去理解这个方差小一点比较好。自己理解的是这个测试样本必须是同类样本,如果是1,那么所有拿来测试的必须全部是1,计算方差的时候,也就是计算标签为1的样本得到的实际输出的方差

误差error,偏置bias,方差variance的见解相关推荐

  1. 偏差bias与方差variance

    目录 1 含义 1.1 偏差 1.2 偏差和方差 2 期望泛化误差公式推导 3 权衡偏差与方差: 4 解决高偏差与高方差 参考 学习算法的预测误差, 或者说泛化误差(generalization er ...

  2. 偏差(bias)、方差(variance)和噪音(noise)

    对于一个预测问题,若真实模型为f(x)f(\boldsymbol{x})f(x). 通常我们通过对特定的数据集D=(x1,y1),(x2,y2),-,(xn,yn)D = {(\boldsymbol{ ...

  3. 吴恩达神经网络和深度学习-学习笔记-6-训练集、验证集和测试集 + 偏差bias和方差variance

    寻找最优超参数是一个迭代过程 在今天,应用深度学习是一个典型的迭代过程. 创建高质量的训练数据集.验证集和测试集,有助于提高循环效率. 训练集.验证集和测试集 数据Data分为三部分: 训练集trai ...

  4. 【图解例说机器学习】模型选择:偏差与方差 (Bias vs. Variance)

    目录 一个例子:多项式回归中的阶数选择 防止过拟合 增加训练数据 正则化 偏差与方差 理论推导 偏差与方差的折中关系 附录 机器学习的过程大致分为三步:1)模型假设,比如我们假设模型是线性回归,还是多 ...

  5. AI学习笔记——Bias and Variance tradeoff (方差偏差的平衡)

    上一篇文章介绍了机器学习中需要理解的几个重要概念,这些概念在训练模型的过程中至关重要,尤其是Bias 和 Variance 的分析,关系到在机器学习的过程的实际操作中,如何优化训练模型. 1.Bias ...

  6. 机器学习中的Bias、Variance

    机器学习中的误差Error可以理解为偏差和方差的和. Error(误差) = Bias(偏差) + Variance(方差) Bias 偏差指的是样本输出与真实值之间的差距,即模型本身的拟合程度. 代 ...

  7. 台大李宏毅Machine Learning 2017Fall学习笔记 (3)Bias and Variance (v2)

    台大李宏毅Machine Learning 2017Fall学习笔记 (3)Bias and Variance (v2) 这节课主要讲解了训练模型的误差来源及相应的解决方案. 模型的误差主要来源于数据 ...

  8. 【李宏毅机器学习】03:误差Error

    李宏毅机器学习03:误差Error 文章目录 李宏毅机器学习03:误差Error 一.Bias & Variance 偏差和方差 1.误差的来源 2.偏差和方差的理解 3.偏差和方差出现的原因 ...

  9. 李宏毅机器学习 Bias and Variance

      其中PPT下载地址为https://download.csdn.net/download/herosunly/15448663. 文章目录 1. Bias and Variance 1.1 偏差和 ...

最新文章

  1. tomcat监控-psi-probe使用
  2. 翻译:创建 Windows8 应用 Part I: Hello, world!
  3. 2016 年 Linux 领域的十大新闻,你有关注吗?
  4. font HTML语言,HTML font 标签
  5. IIS下的FTP使用
  6. 如何利用计算机解决问题,《用计算机解决问题的一般步骤》讲课教案
  7. 如何优雅地辞退互联网企业的老员工?
  8. 米家机扫拖机器人说明书_除菌扫拖一次搞定,科沃斯N8除菌扫拖机器人初体验...
  9. fiddler如何设置过滤https_Google Analytics如何设置含有过滤器的帐户数据视图
  10. navicat连接远程mysql
  11. px2rem-loader(Vue:移动端自适应,px自动转化)
  12. 【Tensor】(张量)的基本概念和操作
  13. 解决VMware虚拟机桥接模式无法上网
  14. 【Unity3D】摇杆
  15. 服务器 sn 作用,命令查看服务器SN号
  16. 王 第潜艇三天 引用类型 继承
  17. 中国大陆开源(Linux)镜像站汇总
  18. Xilinx 的FFT IP核使用方法(配置为FFT 、IFFT两种模式)
  19. Jaeger docker部署实操
  20. 简述相关与回归分析的关系_浅谈相关分析与回归分析的关系

热门文章

  1. php人才招聘系统描述,基于ThinkPHP框架的人才招聘网站系统PHP源码
  2. 图的广度优先搜索(bfs)以及深度优先搜索(dfs)
  3. codeforces 153d(日期转换)特殊题目
  4. mysql 20小时内,mysql中关于date(Y-m-d H:i:s) 入库慢8小时的解决
  5. 上传到服务器gd不支持,安装dedecms出现GD不支持。我的php5.5的。怎么解决?
  6. 通过超链接访问后台方法_超有用的公众号超链接,3分钟学会2种超链接方法,特别实用!...
  7. jpa 自定义sql if_常用SQL语句大全总结
  8. http超文本传输协议
  9. HBuilder、HBuilderX连接夜神模拟器
  10. PL/SQL Developer如何连接64位的Oracle图解