Bagging算法

特点:

  1. Bagging是一种框架算法,以随机森林(RDF)算法为代表。
  2. 采用的是随机有放回的选择训练数据然后构造分类器,最后组合。
  3. 从原始样本集中使用Bootstraping方法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集。(k个训练集之间相互独立,元素可以有重复)
  4. 对于k个训练集,我们训练k个模型(这k个模型可以根据具体问题而定,比如决策树,knn等)
  5. 对于分类问题:由投票表决产生分类结果;对于回归问题:由k个模型预测结果的均值作为最后预测结果。(所有模型的重要性相同)

图示


随机森林算法(Random Forests)

算法的优缺点

随机森林的主要优点是:

  1. 具有极高的准确率
  2. 随机性的引入,使得随机森林不容易过拟合
  3. 随机性的引入,使得随机森林有很好的抗噪声能力
  4. 能处理很高维度的数据,并且不用做特征选择
  5. 既能处理离散型数据,也能处理连续型数据,数据集无需规范化
  6. 训练速度快,可以得到变量重要性排序
  7. 容易实现并行化

随机森林的主要缺点是:

  1. 当随机森林中的决策树个数很多时,训练时需要的空间和时间会较大
  2. 随机森林模型还有许多不好解释的地方,有点算个黑盒模型

算法过程

  1. 从原始训练集中使用Bootstraping方法随机有放回采样选出m个样本,共进行n_tree次采样,生成n_tree个训练集
  2. 对于n_tree个训练集,我们分别训练n_tree个决策树模型
  3. 对于单个决策树模型,假设训练样本特征的个数为n,那么每次分裂时根据信息增益/信息增益比/基尼指数选择最好的特征进行分裂
  4. 每棵树都一直这样分裂下去,直到该节点的所有训练样例都属于同一类。在决策树的分裂过程中不需要剪枝
  5. 将生成的多棵决策树组成随机森林。对于分类问题,按多棵树分类器投票决定最终分类结果;对于回归问题,由多棵树预测值的均值决定最终预测结果

图示

机器学习 —— Bagging算法相关推荐

  1. 机器学习 - [集成学习]Bagging算法的编程实现

    机器学习 - [集成学习] Bagging算法的编程实现 李俊才 的 CSDN 博客:https://blog.csdn.net/qq_28550263?spm=1001.2101.3001.5343 ...

  2. 机器学习之集成学习(Boosting算法、Bagging算法、Stacking算法)总结

    1.集成学习概述 机器学习分为有监督学习算法和无监督学习算法.在有监督学习中,我们的目标是学习一个稳定的且各方面都表现较好的模型.但是,实际情况往往不理想,有时我们只能得到多个在某些方面表现比较好的& ...

  3. Bagging算法最全解析-机器学习

    Bagging算法报告 目录 基本概念以及算法流程 1 1.1基本概念 1 1.2 算法流程 1 基本性质及其物理意义 3 2.1. 自举汇聚法 3 2.2. OOB 错误 4 类似算法分析比较 5 ...

  4. 机器学习与算法面试太难?

    机器学习与算法面试太难? 来源: https://mp.weixin.qq.com/s/GrkCvU2Ia_mEaQmiffLotQ 作者:石晓文 八月参加了一些提前批的面试,包括阿里.百度.头条.贝 ...

  5. 机器学习常见算法及优缺点!

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 ? Index 决策树算法 分类算法 聚类算法 集成算法(AdaBoost算法) 人工 ...

  6. 机器学习Top10算法,教你选择最合适的那一个!

    本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处 本文共3800字,建议阅读6分钟. 选什么算法?本文为你梳理TOP10机器学习算法特点. 在机器学习领域里,不存在一种万能 ...

  7. 来!一起捋一捋机器学习分类算法

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:算法与数学之美 可是,你能够如数家珍地说出所有常用的分类算法,以及他们的特征.优 ...

  8. 【机器学习】机器学习Top10算法,教你选择最合适的那一个!一文读懂ML中的解析解与数值解...

    在机器学习领域里,不存在一种万能的算法可以完美解决所有问题,尤其是像预测建模的监督学习里. 比方说,神经网络不见得比决策树好,同样反过来也不成立. 最后的结果是有很多因素在起作用的,比方说数据集的大小 ...

  9. 人工智能之机器学习常见算法

    https://blog.csdn.net/BaiHuaXiu123/article/details/51475384 摘要 之前一直对机器学习很感兴趣,一直没时间去研究,今天刚好是周末,有时间去各大 ...

最新文章

  1. Redis史上最强【集群】入门实践教程
  2. redis和mysql内存数据库性能_Redis高性能内存数据库
  3. mvp架构 java_GitHub - AnthonyCoder/MvpForJava: 一个可直接快速引入的 Java 版本的模块化 MVP 框架...
  4. struts2 的struts.properties配置详解
  5. 虚拟机在Hyper-V和Citrix Xenserver上的区别
  6. java如何保证redis设置过期时间的原子性_分布式锁用 Redis 还是 Zookeeper
  7. maxwell监控mysql_利用Maxwell组件实时监听Mysql的binlog日志
  8. 性能测试之JMeter配置元件【HTTP信息头管理器】
  9. 分享一个stm32的OLED驱动,实现图像平移滚动滑动,esp8266-wifi物联网远程开关天气,开源代码电路原理图
  10. hibernate 插入 效率_美信半导体:打开工厂边缘智能化新思路,助力工厂效率提升...
  11. vue项目中打包的相关配置问题
  12. Linux实现黑客帝国炫酷效果
  13. BZOJ 4199: [Noi2015]品酒大会/UOJ #131. 【NOI2015】品酒大会 后缀自动机 树形dp / 后缀数组 单调栈
  14. Unity ProjectTiny用纯ECS写个跃动的小球
  15. 提供一个中国身份证号码判断的类
  16. uniapp 开发小程序使用iconfont彩色图标
  17. 最全面的gtest的TEST宏源码解析及自动调度机制
  18. 前后台订单入库调用流程
  19. Slidev 一种快速制作PPT的奇淫技巧
  20. ubuntu物理机用virtualbox安装win7进行单片机实验

热门文章

  1. Windows10 桌面不停的闪烁问题
  2. 膜拜!京东大牛彻底讲透Java多线程面试题,看完直怼阿里面试官,堪称吾辈楷模!
  3. 搭建直播平台什么样的服务器最合适?
  4. ReentrantReadWriteLock、StampedLock
  5. cad绘制正八边形_CAD怎么画正八边形 看完你学会了么
  6. centos7安装bcc和简单测试
  7. 方舟手游服务器设置文件翻译,方舟生存进化手游界面中文翻译 语言不通不发愁...
  8. JDK 17:Java 17 中的新特性
  9. Tableau联动之工作表联动
  10. C语言口求整除x与y的余数,取余或取模运算小结