Ensemble Learning大致可以分为两大类:

1、个体学习器之间存在强依赖关系、串行生成的序列化方法(Sequential Ensemble),代表是Boosting。

2、个体学习器之间不存在强依赖关系、可同时生成的并行方法(Independent Ensemble),代表是Bagging。

Boosting是一种将弱学习器转换为强学习器的算法,周志华的西瓜书描述它的机制:先从初始训练集训练出一个基学习器,然后根据基学习器的表现对训练样本进行调整,使得先前基学习器做错的训练样本在后续受到更多的关注,然后基于调整后的样本分布来训练下一个基学习器。 Boosting 的代表是Adam Boosting。

Bagging是Bootstrap Aggregating的缩写。它通过自助采样的方法(boostrap sampling),每次从数据集中随机选择一个subset,然后放回初始数据集,下次取时,该样本仍然有一定概率取到。然后根据对每个subset训练出一个基学习器,然后将这些基学习器进行结合。对于分类任务可以通过vote来输出结果,回归任务可以求平均值。

从Bias-Variance Trade-off的角度来看,Boosting主要关注降低Bias,因而容易造成Overfit。而Bagging则侧重于降低Variance,所以容易陷入Underfit。原因是Boosting通过一次次的迭代,最小化loss function,所以降低Bias很好理解;由于受数据中的noise和anamoly的影响,Boosting会对受这些数据的影响,而Bagging则通过选取subset可以在一定程度上减少异常数据的影响,使得数据的分布更加均匀,从而降低Variance。

Ensemble Learning中的Bagging和Boosting相关推荐

  1. Ensemble Learning(集成学习--AdaBoost,GBDT,Xgboost等)

    集成学习: 所谓兼听则明,偏信则暗. 集成学习本身并不是一个单纯的新算法,它的目的是通过结合多个其他的机器学习模型来完成某个一个任务以提升最终结果的准确率,即三个臭皮匠赛过诸葛亮.从该思想出发自然可以 ...

  2. Ensemble Learning常见方法总结(Bagging、Boosting、Stacking、Blending)

    看到过一个问题:Random Forest.Adaboost.GBDT.XGBoost的区别是什么?这个问题基本上覆盖了关于Ensemble Learning中常见的几种方法,以及Ensemble L ...

  3. Decision stump、Bootstraping、bagging、boosting、Random Forest、Gradient Boosting

    1)首先来看看 Decision stump https://en.wikipedia.org/wiki/Decision_stump A decision stump is a machine le ...

  4. 机器学习-集成学习(ensemble learning)

    集成学习ensemble learning:本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务. 可以用两句话形容: 1."三个臭皮匠顶个诸葛亮":一堆 ...

  5. 集成学习(Ensemble Learning),Bagging、Boosting、Stacking

    1 集成学习概述 1.1 概述 在一些数据挖掘竞赛中,后期我们需要对多个模型进行融合以提高效果时,常常会用Bagging,Boosting,Stacking等这几个框架算法,他们不是一种算法,而是一种 ...

  6. 笔记︱集成学习Ensemble Learning与树模型、Bagging 和 Boosting、模型融合

    基本内容与分类见上述思维导图. 文章目录 一.模型融合方法 . 概述 1.Voting 2.Averaging 3.Bagging 4.Boosting 5. Stacking (1)nfolds 次 ...

  7. 读懂Ensemble,Bagging,Boosting以及Stacking

    集成学习 Bagging 基于Bagging的Random Forest Boosting 基于Boosting的AdaBGoost Gradient Boosting Machines(GBM)梯度 ...

  8. 集成学习(ensemble learning)干货系列(3)——Boosting方法详解

    集成学习(ensemble learning)干货系列(1)--集成学习概述 集成学习(ensemble learning)干货系列(2)--随机森林(Bagging) Boosting基本原理 提升 ...

  9. 机器学习中Bagging和Boosting的区别

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 Bagging和Boosting都是将已有的分类或回归算法通过一定 ...

最新文章

  1. pandas使用query函数删除dataframe中某一列数值小于某一特定值的行(remove dataframe rows baed on column value)
  2. PHP默认识别的数据类型是application/x-www.form-urlencoded标准的数据类型
  3. jQuery-点击按钮实现回到顶部的两种方式
  4. 全球及中国企业旅游保险行业发展价值评估及投资方向建议报告2021-2027年版
  5. Jquery 【select 通过value来寻找对应的项name】
  6. Maven引入外部jar的几种方法
  7. phpexcel.php linux,phpexcel在linux系统报错如何解决
  8. 迁移性好、多用途,港中文提出特征分离的无监督人类三维姿态表征
  9. 实时音频混音技术在视频直播中的实践应用
  10. python自定义规律绘制_ForMaiR - 自定义规则的邮件自动转发工具
  11. linux ppsspp速度,PPSSPP模拟器详细使用技巧
  12. 网易教程python_麻瓜编程Python Web 开发工程师微专业基础教程 - 网易云课堂
  13. Cannot mix different versions of joi schemas解决方案
  14. win10的WLAN/Wifi不见了、网络适配器黄色感叹号、网络中心的更改适配器选项没有连接
  15. 数显之家快讯:【SHIO世硕心语】2021年中国10大最赚钱的机会!
  16. 全新版大学英语综合教程第二册学习笔记(原文及全文翻译)——5A - True Height(真正的高度)
  17. 2-SAT问题,一个神奇的东西
  18. linux多点触摸屏驱动程序,Linux系统实现支持多点触控操作[视频]
  19. java基础 面试题
  20. Word去除目录主页页码

热门文章

  1. python的元组是否能重复_python – 在带有元组的列表列表中查找重复项
  2. 搭建类京东网站服务器
  3. 计算机网络基础 试题 doc,计算机网络基础知识试题.doc
  4. 常用图片格式JPG\PNG\SVG该如何选择?
  5. bcc服务器搭建网站,如何用云服务器bcc建站
  6. 微信小程序开发入门篇(二)
  7. TI深度学习(TIDL)--2
  8. Zemax-偏振、膜层和散射
  9. 微信底部白条解决办法 授权白条
  10. Linux的下Ip计算器