西瓜书-2.5偏差与方差
文章目录
- 2.5-偏差与方差
- 对象
- 内容
2.5-偏差与方差
对象
“偏差-方差分解”是解释学习算法的泛化性能的一种重要工具,即算法**“为什么”具有这样的性能**。
内容
偏差-方差分解对学习算法的期望泛化错误率进行拆解。
对测试样本 x x x,有:
变量 | 含义 |
---|---|
y D y_D yD | x x x在数据集上的标记。 |
y y y | x x x的真实标记。 |
f ( x ; D ) f(x;D) f(x;D) | 训练集D上学得模型f在 x x x上的预测输出。 |
含义 | 公式 | 影响 |
---|---|---|
算法的期望预测 | f ‾ ( x ) = E D [ f ( x ; D ) ] ( 2.5 − 1 ) \overline f(x)=E_{D}[f(x;D)] \qquad (2.5-1) f(x)=ED[f(x;D)](2.5−1) | |
样本数相同的不同训练集产生的方差 | v a r ( x ) = E D [ ( f ( x ; D ) − f ‾ ( x ) ) 2 ] ( 2.5 − 2 ) var(x) =E_{D}[{(f(x;D)-\overline f(x))}^2] \qquad (2.5-2) var(x)=ED[(f(x;D)−f(x))2](2.5−2) | 度量同样大小的训练集的变动所导致的学习性能的变化,即数据扰动所造成的影响。 |
噪声(如输出为错误的样本) | ε 2 = E D [ ( y D − y ) 2 ] ( 2.5 − 3 ) {\varepsilon }^2 =E_{D}[{(y_D-y)}^2] \qquad (2.5-3) ε2=ED[(yD−y)2](2.5−3) | 表达当前任务上任何算法所能达到的期望泛化误差的下界,即学习问题本身的难度。 |
偏差 | b i a s 2 ( x ) = ( f ‾ ( x ) − y ) 2 ( 2.5 − 4 ) {bias}^2(x) ={(\overline f(x)-y)}^2 \qquad (2.5-4) bias2(x)=(f(x)−y)2(2.5−4) | 度量算法的期望预测与真实结果的偏离程度,即算法本身的拟合能力。 |
- 案例
以回归任务为例:
假设噪声期望=0,则通过多项式展开合并,得到算法的期望泛化误差为:
E ( f ; D ) = b i a s 2 ( x ) + v a r ( x ) + ε 2 ( 2.5 − 5 ) E(f;D)={bias}^2(x)+var(x)+\varepsilon ^2\qquad (2.5-5) E(f;D)=bias2(x)+var(x)+ε2(2.5−5)
即泛化误差可分解为偏差、方差、噪声之和。
偏差-方差分解说明了泛化性能是由学习算法的能力、数据的充分性、学习任务本身的难度共同决定的。因此欲提高泛化性能,则需要使得偏差较小,即能充分拟合数据,并且使方差较小,即使得数据扰动产生的影响小。
而偏差、方差存在冲突,即“偏差-方差窘境”,如给定学习任务,假定控制学习算法的训练程度(决策树控制层数,神经网络控制训练轮数,集成学习方法控制基学习器个数),则训练不足时,学习器拟合能力不够强,训练数据的扰动不足以使学习器产生显著变化,此时偏差主导了泛化错误率;随着训练程度加深,学习器拟合能力增强,训练数据发生的扰动可被学习器学到,方差开始主导泛化错误率;训练程度充分即学习器拟合能力足够,训练数据的轻微扰动都会导致学习器发生显著变化,若训练数据自身的、非全局的特性被学习器学到,则将导致过拟合。
西瓜书-2.5偏差与方差相关推荐
- 西瓜书+实战+吴恩达机器学习(二)机器学习基础(偏差、方差、调试模型技巧)
文章目录 0. 前言 1. 偏差方差的解决方法 2. 高偏差高方差的学习曲线 3. 调试模型技巧 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言 泛化误差可分解为 ...
- 【机器学习-西瓜书】二、偏差-方差分解;泛化误差
2.5偏差与方差 关键词:偏差-方差分解:泛化误差 . 偏差-方差分解是解释算法泛化性能的一种重要工具.偏差-方差分解试图对学习算法的期望泛化错误率进行拆解. 泛化误差可分解为:偏差,方差与噪声之和. ...
- 推荐:周志华《机器学习》西瓜书精炼版笔记来了!
西瓜书<机器学习>无疑是机器学习的必读书籍.本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面. 为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用 ...
- 【机器学习百科全书目录】PRML ESL MLAPP 西瓜书 花书 RLAI 统计学习方法 蒲公英书
文章目录 机器学习百科全书目录 Pattern Recognition and Machine Learning The Elements of Statistical Learning (Secon ...
- 西瓜书学习笔记第2章(模型评估与选择)
西瓜书学习笔记第2章(模型评估与选择) 2.1经验误差与过拟合 2.2评估方法 2.2.1留出法(hold-out) 2.2.2交叉验证法(cross validation) 2.2.3自助法(boo ...
- 周志华机器学习(西瓜书)学习笔记(持续更新)
<周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...
- 机器学习学习笔记-西瓜书
#西瓜书笔记 文章目录 模型评估和选择 线性模型 决策树 神经网络 支持向量机 贝叶斯分类 集成学习 聚类 性能度量与距离计算 原型聚类 密度聚类 层次聚类 降维与度量学习 特征选择与稀疏学习 计算学 ...
- 《西瓜书》笔记-第0章-引言
本人为某985学生,想在CSDN上发表一些自己的阅读笔记.阅读体会,一方面是为了整理自己所学知识,达到重新梳理,复习的作用,一方面是可能在一定程度上能够帮助网友们,非常希望志同道合的朋友们能发表一些意 ...
- 西瓜书第二章阅读笔记
西瓜书第二章阅读笔记 第二章 模型评估与选择 1.经验误差与过拟合 2.模型评估方法 2.1 留出法 hold out 2.2 交叉验证法 cross valildation 2.3 自助法 boot ...
最新文章
- linux 服务器FTP服务安装教程
- 彩色图像到灰度转换 常见方法汇总与对比
- python一行没写完用什么隔离_在CherryPy中请求隔离是如何工作的。我不明白基本的想法...
- 18、Java并发性和多线程-饥饿与公平
- python enumerate函数_Python中enumerate函数用法详解
- fastexcel读取excel追加写入sheet页_python笔记52:python操作excel
- [读书笔记] 代码整洁之道
- 计算机硬件专业知识西瓜视频,2019年中电脑硬件榜单,空调西瓜+电脑助你当个快乐肥宅...
- python安装找不到.log的文件_python – logger找不到文件
- vegas怎么添加淡水墨效果?
- oracle 11g ocp 笔记(9)-- 使用sql 检索、过滤和排序数据
- 关于5G使用的新型技术小结
- Linux系统下安装Chrome浏览器
- 12.28 笔记 (集合) --- 耐得住寂寞
- Linux中cp(拷贝)命令
- java角谷_java实现递归设计——数鸭子和角谷定理
- 标定学习笔记(九)-- 利用空间正交约束的相机自标定和三维重建
- 网络安全风险感知和发掘习题及答案
- PCB线路板阻焊油墨脱落的原因
- SAS中生成哑变量的一段宏代码
热门文章
- c语言射击类打飞机小游戏感悟
- 如何在WPS、Word里插入高亮代码块
- 计算机应用基础评分标准及评分细则,《计算机应用基础》评分标准(范文).doc
- 功能:编写函数long fun ( char *p),将一个数字字符串转换为一个整数(不得调用C语言提供的将字符串转换为整数的函数)。
- C# ComboBox:组合框控件
- 关于mac上如何U盘
- 【移动光猫H2-2的完全破解心路历程及配置】
- 以后有什么需要的可以到淘宝店铺也可以到微店!
- java毕业设计学生考勤系统Mybatis+系统+数据库+调试部署
- Google基础设施架构的安全设计