模型集成01-Bagging/Boosting/Stacking
1、常用的集成学习方式
目前来看,常用的集成学习可以分为三类:Bagging、Boosting、Stacking。其中:
Bagging使用相同的数据集和相同类型的基决策器。不同的基决策器,并行地通过自举采样,分别训练一个决策器,然后对分类结果进行投票,从而获得最终结果。以RF为代表。
Boosting使用相同的数据集和相同类型的基决策器。不同的集决策器,串行地相同的数据集上训练。后一个决策器的权重依赖于前一个决策器的数据,后面的决策器不断地优化之前决策器的决策效果。以AdaBoost和GBDT为代表。
Stacking可以使用不同的数据集合不同类型的基决策器。后面的决策器的输入依赖于前一个决策器的输出。以GBDT+LR为代表。
2、集成学习效果分析
Bagging类型的集成学习,通过多个决策器投票,平均了某些单决策器可能出现的过拟合问题,降低了Varience;Boosting类型的集成学期,通过不断优化错误决策的结果,降低了训练集合上的误差,降低了模型的整体Bias。这两种方式都提升了模型的泛化性能。
Tips:Bagging方法,基分类器选分类Varience小的分类器好吗?(这个问题来源于HULU公众号)
答:不好。因为Bagging是降低Varience的,用varience小的分类器,bagging没有收益,甚至可能适得其反。
Stacking类型的决策器,则主要是各取不同基分类器的优点,从而优化效果。比如GDBT可以方便地处理低维连续数值特征,可以表征数据的泛化性质;LR则可以处理高维稀疏特征,表征数据的个性。GBDT和LR融合,可以更充分利用不同类型的信息。
转载于:https://www.cnblogs.com/ai1024/p/6158567.html
模型集成01-Bagging/Boosting/Stacking相关推荐
- 机器学习--集成学习--Bagging,Boosting,Stacking
在一些数据挖掘竞赛中,后期我们需要对多个模型进行融合以提高效果时,常常会用到Bagging,Boosting,Stacking等这几个框架算法.下面就来分别详细讲述这三个框架算法.这里我们只做原理上的 ...
- 集成学习bagging, boosting, stacking
集成学习能够通过训练数据集产生多个学习模型,然后通过一定的结合策略生成强学习模型. bagging 可以并行执行 每一棵树权重是一样的 随机森林 Bagging是bootstrap aggregati ...
- 集成学习(bagging/boosting/stacking)BERT,Adaboost
文章目录 集成学习(ensemble learning) 1.bagging(装袋法) 2.boosting(提升法) 3.stacking(堆叠法) 集成学习(ensemble learning) ...
- 机器学习模型的集成方法总结:Bagging, Boosting, Stacking, Voting, Blending
机器学习是人工智能的一个分支领域,致力于构建自动学习和自适应的系统,它利用统计模型来可视化.分析和预测数据.一个通用的机器学习模型包括一个数据集(用于训练模型)和一个算法(从数据学习).但是有些模型的 ...
- 机器学习 | 集成算法 | Bagging | Boosting | 概念向
- 树模型系列之集成学习(Bagging、Boosting、Stacking)
文章目录 树模型系列之集成学习(Bagging.Boosting.Stacking) bagging Boosting Stacking 偏差与方差 集成学习的偏差与方差 Bagging 的偏差与方差 ...
- 集成学习——Bagging、Boosting、Stacking
目录 偏差与方差 投票法 集成学习 Bagging Bootstraps Bagging Boosting 基本概念 Adaboost 前向分步算法 梯度提升树(GBDT) XGBoost Light ...
- 机器学习集成方法Bagging、Boosting和Stacking
一. 概述 集成学习是一种训练多个弱学习器从而得到更好预测结果的方法.一般情况来说,集合弱学习器可以得到更准确更强力的模型. 1. 弱学习器 弱学习器,弱学习器常指泛化性能略优于随机猜测的学习器,例如 ...
- 机器学习(4):集成算法(Bagging、Boosting、Stacking)
目录 一.Bagging模型:随机森林 1.1 bagging的原理 1.2 随机森林算法 Random Forest 1.3 随机森林的推广:极限随机数 extra trees 二.Boosting ...
- 【李宏毅2020 ML/DL】补充:Ensemble: Bagging, Boosting, Adaboost, Gradient Boosting, Stacking
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的.自己不知道的东西. 本次笔记补充视频 BV1JE411g7XF 的缺失部分.在另一个UP主上传的2017课程BV13x411v7U ...
最新文章
- c#属性中的get和set属性
- Android开发环境搭建及常见问题解决方法
- python interactive 清空内存_Python 内存回收问题
- 网络抓包工具wireshark and tcpdump 及其实现基于的libpcap
- 【WebRTC---入门篇】(九)WebRTC网络基础:P2P/STUN/TURN/ICE
- 抽奖送福利|8大福利任性送,快来抽它
- Cracking the Coding Interview Q1.2
- hdoj1242(bfs+priority_queue)
- PHP.ini文件 服务器将用户可操作的文件限制在某目录下
- js常用正则 验证数字正则
- 霏霏暮雨 eclipse+HBASE开发环境搭建(已实践
- Flutter系列之Navigator组件使用
- VMware连接U盘后无法显示U盘
- 监控视频中的主码流和子码流是什么意思?
- MLX90640开发笔记(六)红外图像伪彩色编码
- 武林外传挂机宝宝 v1.0 怎么用
- android win10 投屏,安卓手机投影win10不成功,版本升级前可以
- Power Query 系列 (11) - 函数基础
- 如何在jsp里面写java代码
- buaa oo-unit3
热门文章
- ​给前端开发者的 14 个 JavaScript 代码优化建议
- sql server 多条记录数据合并为一条_面试必备sql知识点——MySQL基础
- 固定ip_1分钟学会查看跨境卫士费用和选择固定IP
- linux http 访问限制,51CTO博客-专业IT技术博客创作平台-技术成就梦想
- python 读取日志文件_如何在Python中跟踪日志文件?
- python下载文件传到服务器_python实现FTP文件传输(服务器端和客户端)
- 佳能c3020维修模式 白电平调整_真·迷你微单 佳能EOS M200简评
- JAVA设置流中当前位置_java文件流的问题!急
- jquery 手型 鼠标穿过时_三模无线搭配对称手型设计,游戏致胜利器,ROG烈刃2无线鼠标...
- c++ opencv编程实现暗通道图像去雾算法_OpenCV图像处理专栏十三 | 利用多尺度融合提升图像细节...