ubuntu之路——day7.1 衡量模型好坏的因素偏差和方差biasvariance 以及在深度学习中的模型优化思路...

Error | 误差

Bias | 偏差 – 衡量准确性

Variance | 方差 – 衡量稳定性

首先我们通常在实际操作中会直接用错误率或者与之对应的准确率来衡量一个模型的好坏，但是更加准确的做法是误差衡量时综合考虑偏差和方差的共同作用。

所谓偏差Bias反映的是模型在样本上的输出与真实值之间的误差，即模型本身的精准度。Variance反映的是模型每一次输出结果与模型输出期望值之间的误差，即模型的稳定性。

举个例子，对于一个二分类问题，比如测试图片是不是猫，是猫的话就是1，不是猫就是2。

现在给定一个初始条件，人眼分类猫图片时的错误是0，也就是说最优误差为0(optimal error = 0)有时也说bayes error = 0，统统是一个意思。

那么对于训练集和训练验证集给定如下结果：

train set error： 1%　　　　15%　　　　15%　　　　0.5%

dev set error： 15%　　　 16%　　　　30%　　　　1%

对于第一种结果我们说：这是high variance的，因为显然地在训练集上过度拟合了数据，所以在验证集上表现很差

对于第二种结果我们说：这是high bias的，在训练集上发生了欠拟合，所以拟合度不够高，错误率较高。

对于第三种结果我们说：这是high bias & high variance的，在训练集上欠拟合的同时，在验证集上的表现更糟糕，这是最糟糕的情况。

对于第四种结果我们说：这是low bias & low variance，这是很优秀的模型。

*.注意我们以上的四种结果的前提都是假设了最优误差为0的情况

那么在deep learning中

首先我们判断模型的bias高不高，如果高的话：

1.如果是自建的数据集或者是清洗过的数据集，评估训练集自身的问题或者是数据清洗时保留特征的问题。

2.使用更大的网络，比如更多的hidden layer，更多的hidden unit，更多的时间等等

3.使用全新的神经网络架构，比如卷积、循环、胶囊等等。甚至可以从别的神经网络中抽取一两个不同的层加入进来。

接下来我们判断模型的variance高不高，如果高的话(也就是过拟合发生的情况下)：

1.增大数据集的规模，在传统ml中这不一定有用，但是在dl中，使用更多的数据往往会提高效果。

2.正则化 regularization

3.同上第三条，使用全新的架构。

最终我们的目标是找到一个low bias & low variance的模型

转载于:https://www.cnblogs.com/NWNU-LHY/p/11187355.html

ubuntu之路——day7.1 衡量模型好坏的因素偏差和方差biasvariance 以及在深度学习中的模型优化思路...相关推荐

AI部署：聊一聊深度学习中的模型权重
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达作者丨Oldpan 来源丨Oldpan博客编辑丨极市平台导读本文简要介绍了模型权重的统计方法,以 ...
【模型蒸馏】从入门到放弃：深度学习中的模型蒸馏技术
点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要17分钟跟随小博主,每天进步一丢丢来自 | 知乎作者 | 小锋子Shawn 地址 | https://zhuanlan.zhihu.c ...
深度学习中的模型修剪
本文讨论了深度学习环境中的修剪技术. 本在本文中,我们将介绍深度学习背景下的模型修剪机制. 模型修剪是一种丢弃那些不代表模型性能的权重的艺术. 精心修剪的网络会使其压缩版本更好,并且它们通常变得适合设 ...
深度学习中关于模型融合问题
模型融合即Ensemble Generation,指的是将多个不同的Base Model组合成一个Ensemble Model的方法.它可以同时降低最终模型的bias和Variance.从而在提高分数 ...
【深度学习】扩散模型（Diffusion Model）详解
[深度学习]扩散模型(Diffusion Model)详解文章目录 [深度学习]扩散模型(Diffusion Model)详解 1. 介绍 2. 具体方法 2.1 扩散过程 2.2 逆扩散过程 2. ...
CCAI 2017 | 香港科技大学计算机系主任杨强：论深度学习的迁移模型
CCAI 2017 | 香港科技大学计算机系主任杨强:论深度学习的迁移模型原2017.07.22AI科技大本营作者 | 贾维娣 7月23日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁 ...
【深度学习】深度学习中模型计算量(FLOPs)和参数量(Params)等的理解以及四种在python应用的计算方法总结
接下来要分别概述以下内容: 1 首先什么是参数量,什么是计算量 2 如何计算参数量,如何统计计算量 3 换算参数量,把他换算成我们常用的单位,比如:mb 4 对于各个经典网络,论述他们是计算量大还 ...
香港科技大学计算机系主任杨强：论深度学习的迁移模型
一.迁移学习的三大优点为什么我们做迁移学习?我总结了三条原因: 小数据.我们生活当中大量遇见的是小数据而不是大数据,当数据很稀疏,看到不同的类别我们还是能在当中做出很靠谱的模型.这并不是空穴来风,而 ...
＜计算机视觉六＞深度学习目标检测模型的评估标准
鼠标点击下载项目源代码免费下载地址 <计算机视觉一> 使用标定工具标定自己的目标检测 <计算机视觉二> labelme标定的数据转换成yolo训练格式 <计算机 ...
【深度学习中模型评价指标汇总（混淆矩阵、recall、precision、F1、AUC面积、ROC曲线、ErrorRate）】
深度学习中模型好坏的所有评价指标汇总(混淆矩阵.recall.precision.F1score.AUC面积.ROC曲线.ErrorRate) 导航 0.混淆矩阵 1.AUC面积 2.ROC曲线 3. ...

ubuntu之路——day7.1 衡量模型好坏的因素偏差和方差biasvariance 以及在深度学习中的模型优化思路...

ubuntu之路——day7.1 衡量模型好坏的因素偏差和方差biasvariance 以及在深度学习中的模型优化思路...相关推荐

最新文章

热门文章