关于随机森林改进的理解
随机森林作为一种集成学习方法,它是由一系列基学习器构成的,构成及学习器的方法就是通过随机化采样的方法,来构成不同泛化边界的基学习器,然后在通过简单的投票法来结合出最后的集成模型。
这种简单的模型,在UCI糖尿病数据集的实践中,性能的提高有限,于是,希望在已有模型的基础上做改进来改善模型,以下是改善模型的几点想法
- 首先通过随机化方法来引入误差,构成的基学习器,在训练集上的性能参差不齐,我们通过AUC的指标值来选取性能较优的基学习器。但是如果这些基学习器是一些相同的相近的学习器,就不能通过集成来提高性能,实际上由于引入了随机化误差,就算AUC的值相近,基学习器依然有很大的相异性,在实践中,对模型性能有提高。
- 其次,增加基学习器之间的多样性,我们希望找到一定的量化指标,来表明这些多样性。现有的两个多样性的方向,有行为多样性即在训练集上两个基学习器上的表现,这个表现在一定程度上表征出基学习器的泛化边界,但是训练集依旧是小样本,无法完全表征泛化边界。还有就是结构多样性,同样这个指标也是用来表征泛化边界的。
- 对于,通过泛化性能表现,来选择基学习器,来改善模型,还没有在自己的实践中通过验证。
参考论文:
- How to compare and interpret two learnt Decision Trees from the same Domain?
Petra Perner
Institute of Computer Vision and Applied Computer Sciences, IBaI
Postbox 30 11 14, 04251 Leipzig - Structural Diversity for Decision Tree Ensemble Learning
Tao SUN, Zhi-Hua ZHOU
National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210023, China - 王日升,谢红薇,安建成.基于分类精度和相关性的随机森林算法改进[J].科学技术与工程,2017,17(20):67-72.
关于随机森林改进的理解相关推荐
- 对于随机森林的通俗理解
原文:http://blog.csdn.net/mao_xiao_feng/article/details/52728164 对于随机森林的通俗理解 一.决策树 决策树是机器学习最基本的模型,在不考虑 ...
- 集成学习—随机森林原理(理解与论文研读)
如果只想大致理解下随机森林的原理请看第一部分,第二部分是对原论文的研读(灰色引用标记的为证明或自己的理解),这部分可能需要花的时间比较长,不需要的可以忽略. 此外,文末列出来的参考视频,如果读论文还是 ...
- 决策树、装袋、提升和随机森林的对比理解
决策树 决策树是一种简单.常用的基础模型.之所以说它简单,不仅因为它的思想原理简单具体.贴近实际,它并不需要像线性回归模型一样用一个数学公式来表征,而是由规则来抽象.说它基础,是因为它是一系列复杂强大 ...
- 关于随机森林的一些理解
目录 随机森林简介 优缺点 优点 缺点 sklearn中随机森林参数 简单实现 小节 随机森林简介 随机森林是一种只关注决策树的集成学习方法,由Leo Breiman和 Adele Cutler提出, ...
- Kaggle实战:随机森林预测泰坦尼克生存率
一.项目背景和分析需求的提出 泰坦尼克号出事后,收集了乘客的各项数据,包括: PassengerId.Survived.Pclass.Name.Sex.Age.SibSp.Parch.Ticket.F ...
- 比较全面的随机森林算法总结
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 上节介绍了集成学习方法包括bagging法和boosting ...
- Python机器学习09——随机森林
本系列所有的代码和数据都可以从陈强老师的个人主页上下载:Python数据程序 参考书目:陈强.机器学习及Python应用. 北京:高等教育出版社, 2021. 本系列基本不讲数学原理,只从代码角度去让 ...
- 机器学习——动手从决策树实现随机森林
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习专题的第26篇文章,我们一起聊聊另外一个集成学习模型,它就是大名鼎鼎的随机森林. 随机森林在业内名气和使用范围都很广,曾经在许 ...
- 随机森林算法参数解释及调优 转胡卫雄 RF模型可以理解成决策树模型嵌入到bagging框架,因此,我们首先对外层的bagging框架进行参数择优,然后再对内层的决策树模型进行参数择优
RF参数择优思想:RF模型可以理解成决策树模型嵌入到bagging框架,因此,我们首先对外层的bagging框架进行参数择优,然后再对内层的决策树模型进行参数择优.在优化某一参数时,需要把其他参数设置 ...
最新文章
- tf卡量产工具万能版_新物1TB TF卡正式开卖!容量大得惊人,售价也同样不菲
- |Vijos|图论最短路|P1046 观光旅游
- A flight (to Boston) to Denver - 基于转移的顺滑技术研究 | 论文访谈间 #22
- 2021暑假实习-SSM超市积分管理系统-day08笔记
- @CachePut(与@Cacheable的差异)@CacheEvict
- Oracle数据库管理与开发pdf
- Redis高可用:主从复制及哨兵模式
- 适用于高级Java开发人员的十大书籍
- mybatis一对一联表查询的两种常见方式
- CMake PROJECT_BINARY_DIR和PROJECT_SOURCE_DIR区别
- Mybatis解决jdbc编程的问题以及mybatis与hibernate的不同
- JavaScript基本类型和引用类型
- CentosRedhat下bcm43142博通无线网卡linux驱动之二
- 127.0.0.1 zxt.php_windows 10 下docker布置nginx+php环境,用宿主WEB目录负载均衡
- cad插件_CAD插件迷你建筑工具箱4.0
- 软件测试自学教程——书籍教程篇
- python实现论文查重系统_python 手把手教你基于搜索引擎实现文章查重
- android pppd流程,pppd调试心得.md
- Java2.28~2.29学习笔记
- 做一个平台需要什么条件?
热门文章
- 拥抱开源,需要跨越那些鸿沟? ————《Open Life —— 有关开源的哲学》读后感...
- cmd中如何切换到别的盘符
- Arduino - 热敏电阻MF58-104F3950K
- OpenGL矩阵学习
- python 多项式求系数_在Python中用于计算“多项式系数”的numpy / scipy函数
- VUE基于sass换肤
- python实现学生成绩聚类分析_python 聚类分析
- OFDM Introduction
- 【多重分形谱】基于MATLAB的图像多重分形谱分析仿真
- 2022年_蓝桥杯_省赛_4月23日真题_第十三届_python_第六题_小蓝对角线找奖品