文章目录

  • 2.5-偏差与方差
    • 对象
    • 内容

2.5-偏差与方差

对象

“偏差-方差分解”是解释学习算法的泛化性能的一种重要工具,即算法**“为什么”具有这样的性能**。

内容

偏差-方差分解对学习算法的期望泛化错误率进行拆解。

对测试样本 x x x,有:

变量 含义
y D y_D yD​ x x x在数据集上的标记。
y y y x x x的真实标记。
f ( x ; D ) f(x;D) f(x;D) 训练集D上学得模型f在 x x x上的预测输出
含义 公式 影响
算法的期望预测 f ‾ ( x ) = E D [ f ( x ; D ) ] ( 2.5 − 1 ) \overline f(x)=E_{D}[f(x;D)] \qquad (2.5-1) f​(x)=ED​[f(x;D)](2.5−1)
样本数相同的不同训练集产生的方差 v a r ( x ) = E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] ( 2.5 − 2 ) var(x) =E_{D}[{(f(x;D)-\overline f(x))}^2] \qquad (2.5-2) var(x)=ED​[(f(x;D)−f​(x))2](2.5−2) 度量同样大小的训练集的变动所导致的学习性能的变化,即数据扰动所造成的影响。
噪声(如输出为错误的样本) ε 2 = E D [ ( y D − y ) 2 ] ( 2.5 − 3 ) {\varepsilon }^2 =E_{D}[{(y_D-y)}^2] \qquad (2.5-3) ε2=ED​[(yD​−y)2](2.5−3) 表达当前任务上任何算法所能达到的期望泛化误差的下界,即学习问题本身的难度
偏差 b i a s 2 ( x ) = ( f ‾ ( x ) − y ) 2 ( 2.5 − 4 ) {bias}^2(x) ={(\overline f(x)-y)}^2 \qquad (2.5-4) bias2(x)=(f​(x)−y)2(2.5−4) 度量算法的期望预测与真实结果的偏离程度,即算法本身的拟合能力。
  • 案例

以回归任务为例:

假设噪声期望=0,则通过多项式展开合并,得到算法的期望泛化误差为:
E ( f ; D ) = b i a s 2 ( x ) + v a r ( x ) + ε 2 ( 2.5 − 5 ) E(f;D)={bias}^2(x)+var(x)+\varepsilon ^2\qquad (2.5-5) E(f;D)=bias2(x)+var(x)+ε2(2.5−5)
泛化误差可分解为偏差、方差、噪声之和

偏差-方差分解说明了泛化性能是由学习算法的能力数据的充分性学习任务本身的难度共同决定的。因此欲提高泛化性能,则需要使得偏差较小,即能充分拟合数据,并且使方差较小,即使得数据扰动产生的影响小。

而偏差、方差存在冲突,即“偏差-方差窘境”,如给定学习任务,假定控制学习算法的训练程度(决策树控制层数,神经网络控制训练轮数,集成学习方法控制基学习器个数),则训练不足时,学习器拟合能力不够强,训练数据的扰动不足以使学习器产生显著变化,此时偏差主导了泛化错误率;随着训练程度加深,学习器拟合能力增强,训练数据发生的扰动可被学习器学到,方差开始主导泛化错误率;训练程度充分即学习器拟合能力足够,训练数据的轻微扰动都会导致学习器发生显著变化,若训练数据自身的、非全局的特性被学习器学到,则将导致过拟合

西瓜书-2.5偏差与方差相关推荐

  1. 西瓜书+实战+吴恩达机器学习(二)机器学习基础(偏差、方差、调试模型技巧)

    文章目录 0. 前言 1. 偏差方差的解决方法 2. 高偏差高方差的学习曲线 3. 调试模型技巧 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 泛化误差可分解为 ...

  2. 【机器学习-西瓜书】二、偏差-方差分解;泛化误差

    2.5偏差与方差 关键词:偏差-方差分解:泛化误差 . 偏差-方差分解是解释算法泛化性能的一种重要工具.偏差-方差分解试图对学习算法的期望泛化错误率进行拆解. 泛化误差可分解为:偏差,方差与噪声之和. ...

  3. 推荐:周志华《机器学习》西瓜书精炼版笔记来了!

    西瓜书<机器学习>无疑是机器学习的必读书籍.本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面. 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用 ...

  4. 【机器学习百科全书目录】PRML ESL MLAPP 西瓜书 花书 RLAI 统计学习方法 蒲公英书

    文章目录 机器学习百科全书目录 Pattern Recognition and Machine Learning The Elements of Statistical Learning (Secon ...

  5. 西瓜书学习笔记第2章(模型评估与选择)

    西瓜书学习笔记第2章(模型评估与选择) 2.1经验误差与过拟合 2.2评估方法 2.2.1留出法(hold-out) 2.2.2交叉验证法(cross validation) 2.2.3自助法(boo ...

  6. 周志华机器学习(西瓜书)学习笔记(持续更新)

    <周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...

  7. 机器学习学习笔记-西瓜书

    #西瓜书笔记 文章目录 模型评估和选择 线性模型 决策树 神经网络 支持向量机 贝叶斯分类 集成学习 聚类 性能度量与距离计算 原型聚类 密度聚类 层次聚类 降维与度量学习 特征选择与稀疏学习 计算学 ...

  8. 《西瓜书》笔记-第0章-引言

    本人为某985学生,想在CSDN上发表一些自己的阅读笔记.阅读体会,一方面是为了整理自己所学知识,达到重新梳理,复习的作用,一方面是可能在一定程度上能够帮助网友们,非常希望志同道合的朋友们能发表一些意 ...

  9. 西瓜书第二章阅读笔记

    西瓜书第二章阅读笔记 第二章 模型评估与选择 1.经验误差与过拟合 2.模型评估方法 2.1 留出法 hold out 2.2 交叉验证法 cross valildation 2.3 自助法 boot ...

最新文章

  1. linux 服务器FTP服务安装教程
  2. 彩色图像到灰度转换 常见方法汇总与对比
  3. python一行没写完用什么隔离_在CherryPy中请求隔离是如何工作的。我不明白基本的想法...
  4. 18、Java并发性和多线程-饥饿与公平
  5. python enumerate函数_Python中enumerate函数用法详解
  6. fastexcel读取excel追加写入sheet页_python笔记52:python操作excel
  7. [读书笔记] 代码整洁之道
  8. 计算机硬件专业知识西瓜视频,2019年中电脑硬件榜单,空调西瓜+电脑助你当个快乐肥宅...
  9. python安装找不到.log的文件_python – logger找不到文件
  10. vegas怎么添加淡水墨效果?
  11. oracle 11g ocp 笔记(9)-- 使用sql 检索、过滤和排序数据
  12. 关于5G使用的新型技术小结
  13. Linux系统下安装Chrome浏览器
  14. 12.28 笔记 (集合) --- 耐得住寂寞
  15. Linux中cp(拷贝)命令
  16. java角谷_java实现递归设计——数鸭子和角谷定理
  17. 标定学习笔记(九)-- 利用空间正交约束的相机自标定和三维重建
  18. 网络安全风险感知和发掘习题及答案
  19. PCB线路板阻焊油墨脱落的原因
  20. SAS中生成哑变量的一段宏代码

热门文章

  1. c语言射击类打飞机小游戏感悟
  2. 如何在WPS、Word里插入高亮代码块
  3. 计算机应用基础评分标准及评分细则,《计算机应用基础》评分标准(范文).doc
  4. 功能:编写函数long fun ( char *p),将一个数字字符串转换为一个整数(不得调用C语言提供的将字符串转换为整数的函数)。
  5. C# ComboBox:组合框控件
  6. 关于mac上如何U盘
  7. 【移动光猫H2-2的完全破解心路历程及配置】
  8. 以后有什么需要的可以到淘宝店铺也可以到微店!
  9. java毕业设计学生考勤系统Mybatis+系统+数据库+调试部署
  10. Google基础设施架构的安全设计