1、常用的集成学习方式

目前来看,常用的集成学习可以分为三类:Bagging、Boosting、Stacking。其中:

Bagging使用相同的数据集和相同类型的基决策器。不同的基决策器,并行地通过自举采样,分别训练一个决策器,然后对分类结果进行投票,从而获得最终结果。以RF为代表。

Boosting使用相同的数据集和相同类型的基决策器。不同的集决策器,串行地相同的数据集上训练。后一个决策器的权重依赖于前一个决策器的数据,后面的决策器不断地优化之前决策器的决策效果。以AdaBoost和GBDT为代表。

Stacking可以使用不同的数据集合不同类型的基决策器。后面的决策器的输入依赖于前一个决策器的输出。以GBDT+LR为代表。

2、集成学习效果分析

Bagging类型的集成学习,通过多个决策器投票,平均了某些单决策器可能出现的过拟合问题,降低了Varience;Boosting类型的集成学期,通过不断优化错误决策的结果,降低了训练集合上的误差,降低了模型的整体Bias。这两种方式都提升了模型的泛化性能。

Tips:Bagging方法,基分类器选分类Varience小的分类器好吗?(这个问题来源于HULU公众号)

答:不好。因为Bagging是降低Varience的,用varience小的分类器,bagging没有收益,甚至可能适得其反。

Stacking类型的决策器,则主要是各取不同基分类器的优点,从而优化效果。比如GDBT可以方便地处理低维连续数值特征,可以表征数据的泛化性质;LR则可以处理高维稀疏特征,表征数据的个性。GBDT和LR融合,可以更充分利用不同类型的信息。

转载于:https://www.cnblogs.com/ai1024/p/6158567.html

模型集成01-Bagging/Boosting/Stacking相关推荐

  1. 机器学习--集成学习--Bagging,Boosting,Stacking

    在一些数据挖掘竞赛中,后期我们需要对多个模型进行融合以提高效果时,常常会用到Bagging,Boosting,Stacking等这几个框架算法.下面就来分别详细讲述这三个框架算法.这里我们只做原理上的 ...

  2. 集成学习bagging, boosting, stacking

    集成学习能够通过训练数据集产生多个学习模型,然后通过一定的结合策略生成强学习模型. bagging 可以并行执行 每一棵树权重是一样的 随机森林 Bagging是bootstrap aggregati ...

  3. 集成学习(bagging/boosting/stacking)BERT,Adaboost

    文章目录 集成学习(ensemble learning) 1.bagging(装袋法) 2.boosting(提升法) 3.stacking(堆叠法) 集成学习(ensemble learning) ...

  4. 机器学习模型的集成方法总结:Bagging, Boosting, Stacking, Voting, Blending

    机器学习是人工智能的一个分支领域,致力于构建自动学习和自适应的系统,它利用统计模型来可视化.分析和预测数据.一个通用的机器学习模型包括一个数据集(用于训练模型)和一个算法(从数据学习).但是有些模型的 ...

  5. 机器学习 | 集成算法 | Bagging | Boosting | 概念向

  6. 树模型系列之集成学习(Bagging、Boosting、Stacking)

    文章目录 树模型系列之集成学习(Bagging.Boosting.Stacking) bagging Boosting Stacking 偏差与方差 集成学习的偏差与方差 Bagging 的偏差与方差 ...

  7. 集成学习——Bagging、Boosting、Stacking

    目录 偏差与方差 投票法 集成学习 Bagging Bootstraps Bagging Boosting 基本概念 Adaboost 前向分步算法 梯度提升树(GBDT) XGBoost Light ...

  8. 机器学习集成方法Bagging、Boosting和Stacking

    一. 概述 集成学习是一种训练多个弱学习器从而得到更好预测结果的方法.一般情况来说,集合弱学习器可以得到更准确更强力的模型. 1. 弱学习器 弱学习器,弱学习器常指泛化性能略优于随机猜测的学习器,例如 ...

  9. 机器学习(4):集成算法(Bagging、Boosting、Stacking)

    目录 一.Bagging模型:随机森林 1.1 bagging的原理 1.2 随机森林算法 Random Forest 1.3 随机森林的推广:极限随机数 extra trees 二.Boosting ...

  10. 【李宏毅2020 ML/DL】补充:Ensemble: Bagging, Boosting, Adaboost, Gradient Boosting, Stacking

    我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本次笔记补充视频 BV1JE411g7XF 的缺失部分.在另一个UP主上传的2017课程BV13x411v7U ...

最新文章

  1. c#属性中的get和set属性
  2. Android开发环境搭建及常见问题解决方法
  3. python interactive 清空内存_Python 内存回收问题
  4. 网络抓包工具wireshark and tcpdump 及其实现基于的libpcap
  5. 【WebRTC---入门篇】(九)WebRTC网络基础:P2P/STUN/TURN/ICE
  6. 抽奖送福利|8大福利任性送,快来抽它
  7. Cracking the Coding Interview Q1.2
  8. hdoj1242(bfs+priority_queue)
  9. PHP.ini文件 服务器将用户可操作的文件限制在某目录下
  10. js常用正则 验证数字正则
  11. 霏霏暮雨 eclipse+HBASE开发环境搭建(已实践
  12. Flutter系列之Navigator组件使用
  13. VMware连接U盘后无法显示U盘
  14. 监控视频中的主码流和子码流是什么意思?
  15. MLX90640开发笔记(六)红外图像伪彩色编码
  16. 武林外传挂机宝宝 v1.0 怎么用
  17. android win10 投屏,安卓手机投影win10不成功,版本升级前可以
  18. Power Query 系列 (11) - 函数基础
  19. 如何在jsp里面写java代码
  20. buaa oo-unit3

热门文章

  1. ​给前端开发者的 14 个 JavaScript 代码优化建议
  2. sql server 多条记录数据合并为一条_面试必备sql知识点——MySQL基础
  3. 固定ip_1分钟学会查看跨境卫士费用和选择固定IP
  4. linux http 访问限制,51CTO博客-专业IT技术博客创作平台-技术成就梦想
  5. python 读取日志文件_如何在Python中跟踪日志文件?
  6. python下载文件传到服务器_python实现FTP文件传输(服务器端和客户端)
  7. 佳能c3020维修模式 白电平调整_真·迷你微单 佳能EOS M200简评
  8. JAVA设置流中当前位置_java文件流的问题!急
  9. jquery 手型 鼠标穿过时_三模无线搭配对称手型设计,游戏致胜利器,ROG烈刃2无线鼠标...
  10. c++ opencv编程实现暗通道图像去雾算法_OpenCV图像处理专栏十三 | 利用多尺度融合提升图像细节...