Error | 误差

Bias | 偏差 – 衡量准确性

Variance | 方差 – 衡量稳定性

首先我们通常在实际操作中会直接用错误率或者与之对应的准确率来衡量一个模型的好坏,但是更加准确的做法是误差衡量时综合考虑偏差和方差的共同作用。

所谓偏差Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度。Variance反映的是模型每一次输出结果与模型输出期望值之间的误差,即模型的稳定性。

举个例子,对于一个二分类问题,比如测试图片是不是猫,是猫的话就是1,不是猫就是2。

现在给定一个初始条件,人眼分类猫图片时的错误是0,也就是说最优误差为0(optimal error = 0)有时也说bayes error = 0,统统是一个意思。

那么对于训练集和训练验证集给定如下结果:

train set error: 1%    15%    15%    0.5%

dev set error: 15%     16%    30%    1%

对于第一种结果我们说:这是high variance的,因为显然地在训练集上过度拟合了数据,所以在验证集上表现很差

对于第二种结果我们说:这是high bias的,在训练集上发生了欠拟合,所以拟合度不够高,错误率较高。

对于第三种结果我们说:这是high bias & high variance的,在训练集上欠拟合的同时,在验证集上的表现更糟糕,这是最糟糕的情况。

对于第四种结果我们说:这是low bias & low variance,这是很优秀的模型。

*.注意我们以上的四种结果的前提都是假设了最优误差为0的情况

那么在deep learning中

首先我们判断模型的bias高不高,如果高的话:

1.如果是自建的数据集或者是清洗过的数据集,评估训练集自身的问题或者是数据清洗时保留特征的问题。

2.使用更大的网络,比如更多的hidden layer,更多的hidden unit,更多的时间等等

3.使用全新的神经网络架构,比如卷积、循环、胶囊等等。甚至可以从别的神经网络中抽取一两个不同的层加入进来。

接下来我们判断模型的variance高不高,如果高的话(也就是过拟合发生的情况下):

1.增大数据集的规模,在传统ml中这不一定有用,但是在dl中,使用更多的数据往往会提高效果。

2.正则化 regularization

3.同上第三条,使用全新的架构。

最终我们的目标是找到一个low bias & low variance的模型

转载于:https://www.cnblogs.com/NWNU-LHY/p/11187355.html

ubuntu之路——day7.1 衡量模型好坏的因素偏差和方差biasvariance 以及在深度学习中的模型优化思路...相关推荐

  1. AI部署:聊一聊深度学习中的模型权重

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Oldpan 来源丨Oldpan博客 编辑丨极市平台 导读 本文简要介绍了模型权重的统计方法,以 ...

  2. 【模型蒸馏】从入门到放弃:深度学习中的模型蒸馏技术

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要17分钟 跟随小博主,每天进步一丢丢 来自 | 知乎   作者 | 小锋子Shawn 地址 | https://zhuanlan.zhihu.c ...

  3. 深度学习中的模型修剪

    本文讨论了深度学习环境中的修剪技术. 本在本文中,我们将介绍深度学习背景下的模型修剪机制. 模型修剪是一种丢弃那些不代表模型性能的权重的艺术. 精心修剪的网络会使其压缩版本更好,并且它们通常变得适合设 ...

  4. 深度学习中关于模型融合问题

    模型融合即Ensemble Generation,指的是将多个不同的Base Model组合成一个Ensemble Model的方法.它可以同时降低最终模型的bias和Variance.从而在提高分数 ...

  5. 【深度学习】扩散模型(Diffusion Model)详解

    [深度学习]扩散模型(Diffusion Model)详解 文章目录 [深度学习]扩散模型(Diffusion Model)详解 1. 介绍 2. 具体方法 2.1 扩散过程 2.2 逆扩散过程 2. ...

  6. CCAI 2017 | 香港科技大学计算机系主任杨强:论深度学习的迁移模型

     CCAI 2017 | 香港科技大学计算机系主任杨强:论深度学习的迁移模型 原2017.07.22AI科技大本营 作者 | 贾维娣 7月23日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁 ...

  7. 【深度学习】深度学习中模型计算量(FLOPs)和参数量(Params)等的理解以及四种在python应用的计算方法总结

    接下来要分别概述以下内容: 1 首先什么是参数量,什么是计算量 2 如何计算 参数量,如何统计 计算量 3 换算参数量,把他换算成我们常用的单位,比如:mb 4 对于各个经典网络,论述他们是计算量大还 ...

  8. 香港科技大学计算机系主任杨强:论深度学习的迁移模型

    一.迁移学习的三大优点 为什么我们做迁移学习?我总结了三条原因: 小数据.我们生活当中大量遇见的是小数据而不是大数据,当数据很稀疏,看到不同的类别我们还是能在当中做出很靠谱的模型.这并不是空穴来风,而 ...

  9. <计算机视觉 六> 深度学习目标检测模型的评估标准

    鼠标点击下载     项目源代码免费下载地址 <计算机视觉一> 使用标定工具标定自己的目标检测 <计算机视觉二> labelme标定的数据转换成yolo训练格式 <计算机 ...

  10. 【深度学习中模型评价指标汇总(混淆矩阵、recall、precision、F1、AUC面积、ROC曲线、ErrorRate)】

    深度学习中模型好坏的所有评价指标汇总(混淆矩阵.recall.precision.F1score.AUC面积.ROC曲线.ErrorRate) 导航 0.混淆矩阵 1.AUC面积 2.ROC曲线 3. ...

最新文章

  1. SAP QM中阶之动态修改规则创建
  2. Android 动画(三)--属性动画
  3. python爬虫找工作要掌握什么_python爬虫实战:判断招聘信息的存在
  4. Pytorch开发环境安装(Windows版本)
  5. 年入10亿,“山寨”耳机芯片凶猛
  6. 预防SQL注入攻击之我见 转
  7. 【免费毕设】ASP.NET猜数游戏的设计与开发(源代码+lunwen)
  8. 在 RHEL 和 CentOS 上检查或列出已安装的安全更新的两种方法
  9. 图像的仿射变换原理、Homography、alpha通道以及python实现
  10. Mysql 省市县乡 地址分割
  11. wordpress最佳架构_生活教练的22个最佳WordPress主题
  12. 【SPFA】腾讯大战360
  13. linux清空文件夹的命令_Linux 学习
  14. 二十一世纪大学英语读写基础教程学习笔记(原文)——3 - Mothers(母亲)
  15. Perl-LWP文档
  16. 微信 Android 视频编码爬过的那些坑
  17. 使用eNSP配置防火墙USG6000v双机热备(VGMP+HRP+OSPF+NAT)
  18. Vue之jwt(跨域身份验证,令牌)
  19. 一款由c++开发的计时器
  20. 【Vue】qq浏览器打开空白

热门文章

  1. 图解think php,图解ThinkPHP5框架(三):配置类Config.php源码解读
  2. poi 读取word标题_【转载】poi读取word文档
  3. wpf listbox绑定不跟新_苦逼的程序员,Python又有新版本3.9,跟还是不跟?
  4. ubunt之一些问题解决办法
  5. nyoj 628 小媛在努力= =(水)
  6. java 应用编程接口_java 应用程序接口(api)是什么
  7. asp.net 安装element ui_vue结合element-ui开发项目 一学就会
  8. win10有源信号分辨率怎么调_示波器高灵敏度小信号测量的注意事项
  9. python @符号_注意!大佬提醒你python初学者这几个很难绕过的坑,附教程资料
  10. 牛客网OI题:序列划分