sklearn.ensemble 模块包括了集成算法

集成算法的目的是用某个指定的学习算法将几个基学习器base estimator(一个模型称为一个基学习器)的预测结果结合起来,共同构建一个泛化性或鲁棒性比单一预测器更好的模型。
集成方法通常分为:
- 均值法Average methods:对几个相互独立的学习器的预测结果取平均(并联)。如,Bagging、随机森林
- 袋装法Boosting methods:几个基学习器构成层次结构,后一个基学习器在前一个集学习器的基础上进行学习。如,AdaBoost,Gradient Tree Boosting……

1. Bagging meta-estimator

sklearn.ensemble.BaggingClassifier
sklearn.ensemble.BaggingRegressor
在集成算法中,袋装法在原始训练集的子集上建立一些黑盒般的基学习器,然后将这些基学习器各自的预测结果结合起来,得到一个最终的预测结果。

根据选择训练数据的方法,可以把袋装法分为一下几类:

  1. Pasting:无放回随机选择样本的子集,。
  2. Bagging:从样本中有放回地选取的某一部分样本,基学习器的训练数据中可能有重复样本。
  3. Random Subspaces:随机选择特征的子集。
  4. Random Patches:样本特征都是原始训练集的子集。

在sklearn中通过限制max_samplesmax_featuresbootstrapbootstrap_featrues可以达到使用上述不同袋装法的目的。前两者控制子集的大小,后两者控制样本和特征的选择是否有放回(如果有放回,即bootstrap=True时,单个基学习器的训练样本中可能有重复样本)

2.随机森林

sklearn.ensemble.RandomForestClassifier
sklearn.ensemble.RandomForestRegressor

1.11 集成算法|模型融合Ensemble methods相关推荐

  1. 【算法】决策树模型 集成算法模型GBDT

    一.决策树模型 决策树算法是一种归纳分类算法,它通过对训练集的学习,挖掘有用的规则,对新数据集进行预测.它属于有监督.非参数学习算法,对每个输入使用该分类区域的训练数据得到对应的局部模型.决策树模型的 ...

  2. 集成学习-模型融合学习笔记(附Python代码)

    1 集成学习概述 集成学习(Ensemble Learning)是一种能在各种的机器学习任务上提高准确率的强有力技术,其通过组合多个基分类器(base classifier)来完成学习任务.基分类器一 ...

  3. 数据挖掘实践(金融风控-贷款违约预测)(五):模型融合

    数据挖掘实践(金融风控-贷款违约预测)(五):模型融合 目录 数据挖掘实践(金融风控-贷款违约预测)(五):模型融合 1.引言 2.模型融合的方式 2.1 Voting/Averaging 2.2 B ...

  4. 机器学习之模型融合(详解Stacking,Blending)

    模型融合 Ensemble Generation 常见模型融合的方法 boosting bagging Stacking blending 各种模型融合的区别 Bagging,Boosting二者之间 ...

  5. 集成算法-随机森林与案例实战-泰坦尼克获救预测

    集成算法-随机森林 Ensemble learning 目的:让机器学习效果更好,单个不行,群殴走起 Bagging:训练多个分类器取平均 f ( x ) = 1 / M ∑ m = 1 M f m ...

  6. 笔记︱集成学习Ensemble Learning与树模型、Bagging 和 Boosting、模型融合

    基本内容与分类见上述思维导图. 文章目录 一.模型融合方法 . 概述 1.Voting 2.Averaging 3.Bagging 4.Boosting 5. Stacking (1)nfolds 次 ...

  7. 【算法竞赛学习】二手车交易价格预测-Task5模型融合

    二手车交易价格预测-Task5 模型融合 五.模型融合 Tip:此部分为零基础入门数据挖掘的 Task5 模型融合 部分,带你来了解各种模型结果的融合方式,在比赛的攻坚时刻冲刺Top,欢迎大家后续多多 ...

  8. 模型优化之模型融合|集成学习

    目录 模型融合 Bagging 随机森林RF Boosting Adaboost GBDT Xgboost Stacking Blending 结合策略 平均法 投票法 学习法 在机器学习训练完模型之 ...

  9. 模型集成 | 14款常规机器学习 + 加权平均模型融合

    模型融合的方法很多,Voting.Averaging.Bagging .Boosting. Stacking,那么一些kaggle比赛中选手会选用各种方法进行融合,其中岭回归就是一类轻巧且非常有效的方 ...

最新文章

  1. Android之在BaseAdapter源码中了解观察者模式
  2. 关于main函数中argc和argv的简单介绍
  3. sql必知必会(第四版) 学习笔记一
  4. Linux学习系列之Mount
  5. 机器学习-降维之奇异值分解SVD算法原理及实战
  6. 11月4日,上海开源基础设施峰会,不见不散!
  7. 智能感知与万物互联学术讲座
  8. 周鸿祎重申360不依靠弹窗广告盈利 增值服务是主要模式
  9. 我的电脑已经禁ping,应该如何启用该功能?
  10. 开发小技巧: 如何在jQuery中禁用或者启用滚动事件.scroll
  11. Linux进程间通信-消息队列
  12. OpenGL ES 2 0 (iOS)[05 1]:进入 3D 世界,从正方体开始
  13. 开源项目——小Q聊天机器人V1.4
  14. C语言:0, '0', '\0', NULL 区别
  15. 安卓学习专栏——安卓报错Version 28 (intended for Android Pie and below) is the last version of the legacy suppor
  16. 软件测试报告【样本】
  17. 风控建模十二:数据淘金——如何从APP数据中挖掘出有效变量
  18. 印度人教小孩学的数学(乘法口诀表背到19*19)
  19. Bellman算法和SPFA算法
  20. 离散余弦变换 DCT

热门文章

  1. linux php和java环境变量配置_Linux设置PHP环境变量
  2. 服务器跑网站用nigx还是apache,Apache和IIS及nginx三大web服务器,新手站长该如何选择?...
  3. URAL 1181 Cutting a Painted Polygon【递归+分治】
  4. 棋逢对手 — XPS 15 2020 横评 MacBook Pro 16
  5. C语言输出循环类内的指定的数值和变量前感叹号!的使用
  6. 计算机考试前的心情作文,考试前的心情作文
  7. Homework20191113
  8. Java 随机生成 “纯数字“、“纯字母“ 、“数字字母混合“ ID 并保持全局唯一
  9. android eclipse 真机调试设置,android+eclipse 真机调试
  10. 小米粥煮多久才好吃 小米粥怎么煮才有营养