Bagging 和 Boosting理解、区别与联系
Bagging 和 Boosting都属于集成学习(ensemble learning)方法,即通过构建并结合多个学习器来完成学习任务。例如对于分类问题,我们可以学习多个弱分类器,然后根据一定的规则对各个弱分类器的结果进行整合,得到最终的分类结果。
1. Bagging
Bagging是指采用Bootstrap(有放回的均匀抽样)的方式从训练数据中抽取部分数据训练多个分类器,每个分类器的权重是一致的,然后通过投票的方式取票数最高的分类结果最为最终结果。
Bagging同样可以处理回归(regression)问题,只需将投票的方式改为求均值,即将各个弱分类器的结果的平均值作为最终结果。
2.Boosting
Boosting是一族可将弱学习器提升为强学习器的算法。其工作机制为:先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直至基学习器数目达到事先指定的值T,最终将这T个基学习器进行加权结合。
3.Bagging 与 Boosting的区别
(1)训练样本
Bagging:通过Booststrap sampling(有放回的均匀抽样)的方式从训练集中出去数据训练各个弱分类器。
注:Bootstrap sampling方法:每当选中一个元组,这个元组同样也可能再次被选中并再次添加到训练集中。
Boosting:各个弱分类器的训练集不是独立的,每一个弱分类器的训练集都是其上一个弱分类器的学习结果,根据错误率进行取样(给予训练样本不同的权值)。
(2)分类器
Bagging:每个分类器都赋予相同的权重。
Boosting:每个分类器的权重是不同的,分类误差小的分类器将获得更大的权重。
(3)分类器的获取方式
Bagging:每个分类器可以并行生成。
Boosting:每个分类器只能依赖其上一个分类器的结果顺序生成。
(4)方差-偏差
从方差-偏差分解的角度看,Boosting 和 Bagging的主要区别如下
Bagging 主要关注降低方差,因此它在不剪枝决策树、神经网络等易受样本扰动的学习器上效用更为明显。
Boosting 主要关注降低偏差,因此Boosting能在基于泛化性能相当弱的学习器上构建出很强的集成。
参考:《机器学习》周志华
《機器學習: Ensemble learning之Bagging、Boosting和AdaBoost》Tommy huang
Bagging 和 Boosting理解、区别与联系相关推荐
- 机器学习中Bagging和Boosting的区别
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 Bagging和Boosting都是将已有的分类或回归算法通过一定 ...
- 集成模型Bagging和Boosting的区别
Bagging和Boosting的主要区别 Bagging(套袋法) Boosting(提升法) Bagging,Boosting二者的区别 总结 基本概念--偏差.方差 为什么说bagging是减少 ...
- Bagging和Boosting的区别(面试准备)
Baggging 和Boosting都是模型融合的方法,可以将弱分类器融合之后形成一个强分类器,而且融合之后的效果会比最好的弱分类器更好. Bagging: 先介绍Bagging方法: Bagging ...
- 【机器学习】Bagging和Boosting的区别(面试准备)
Baggging 和Boosting都是模型融合的方法,可以将弱分类器融合之后形成一个强分类器,而且融合之后的效果会比最好的弱分类器更好. Bagging: 先介绍Bagging方法: Bagging ...
- Bagging和Boosting的区别
Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法.即将弱分类器组装成强分类器的方法. 首先介绍Boot ...
- bagging与boosting的区别
bagging 把数据集通过有放回的抽样方式,划分为多个数据集,分别训练多个模型.针对分类问题,按照少数服从多数原则进行投票,针对回归问题,求多个测试结果的平均值 boosting 与Bagging一 ...
- Bagging和Boosting 概念及区别
Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法.即将弱分类器组装成强分类器的方法. 首先介绍Boot ...
- Bagging和Boosting 策略及其区别
转自:Bagging和Boosting 概念及区别:http://www.cnblogs.com/liuwu265/p/4690486.html (仅作为笔记,如有侵权请告知) Bagging和Boo ...
- Jackknife,Bootstrap, Bagging, Boosting, AdaBoost, RandomForest 和 Gradient Boosting的区别
Bootstraping: 名字来自成语"pull up by your own bootstraps",意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法,它是非参数统 ...
- Jackknife,Bootstraping, bagging, boosting, AdaBoosting, Rand forest 和 gradient boosting的区别
这些术语,我经常搞混淆,现在把它们放在一起,以示区别.(部分文字来自网络,由于是之前记的笔记,忘记来源了,特此向作者抱歉) Bootstraping: 名字来自成语"pull up by y ...
最新文章
- matlab噪声倍频带声压级,近海风电场水下打桩噪声传播特性
- VS2010 调用RFC 时注意(.net4.0) 使用nco
- android第一次作业
- Android-Universal-Image-Loader 的使用说明
- 使用WSO2 ESB进行邮件内容过滤
- 电文的编码和译码c语言实现,电文的编码及译码.doc
- 广东中山一楼盘在平台直播卖房 4小时售出600套
- rms | 如何绘制模型带置信区间的预测曲线
- TP5整合的阿里云短信接口
- 【log4cpp_学习】1_log4cpp的安装
- dcp9020cdn硒鼓!错误_显示硒鼓错误的解决办法
- numpy安装与调试
- 时域采样与频域采样实验【matlab】
- Excel数据导入___你hold住么(一)
- php死循浏览器卡死,Win10 Edge浏览器假死解决方案
- 简易特效制作ByUnityParticleSystem
- DFS hdu1181(变形课)
- fcm基本原理_光谱FCM工作原理
- Unity3d UnityEditor编辑器定制和开发插件
- android接入原生第三方登录(微信登录、QQ登录、新浪微博登录)