分析

随机森林(Random Forest)

随机森林(RF)是Bagging算法族中的一种,RF是以决策树为基分类器构建Bagging集成的基础上,进一步在决策树的训练过程中引入随机属性选择。

具体来说:传统决策树在选择划分属性时是在当前结点的属性集合(假设有d个属性)中选择一个最优属性;而在RF中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分。

即RF中的基学习器的多样性不进来自样本扰动,还来自属性扰动

方差-偏差

从方差-偏差角度来说,Bagging算法主要是降低方差,即RF测试结果的方差比每一个基学习器的方差要小!!

解答

Bagging所采用的基分类器,最好是对样本分布比较敏感(即就是 不稳定的分类器)。

线性分类器或者K-NN都是比较稳定的算法,对异常点不敏感,并且本身方差就不大,所以用它们做基分类器使用Bagging并不能在原有基础上获得好的结果,甚至,因为Bagging的采样,而导致它们在训练中难以收敛,从而增大了集成分类的偏差!!!

随机森林的基分类器可否由决策树替换为线性分类器或者K-NN?相关推荐

  1. 机器学习——集成学习算法(Adaboost、随机森林)

    集成算法简述 什么是集成学习 如何得到多个个体学习器 集成学习常用算法 Bagging 自助采样 学习器结合 包外估计 随机森林 Adaboost Boosting Adaboost算法原理 注意 什 ...

  2. sklearn实现随机森林(分类算法)

    阿喽哈~小伙伴们,今天我们来唠一唠随机森林 ♣ ♣ ♣ 随机森林应该是很多小伙伴们在学机器学习算法时最先接触到的集成算法,我们先简单介绍一下集成学习的大家族吧: Bagging:个体评估器之间不存在强 ...

  3. 【机器学习】随机森林 – Random forest

    文章目录 一.随机森林是什么? 1. 随机森林是一种集成学习算法 2. 随机森林的基学习器是决策树 二.随机森林 – Random Forest | RF 三.构造随机森林的 4 个步骤 四.随机森林 ...

  4. sklearn分类器算法:决策树与随机森林及案例分析

    分类算法之决策树 决策树是一种基本的分类方法,当然也可以用于回归.我们一般只讨论用于分类的决策树.决策树模型呈树形结构.在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的 ...

  5. 【机器学习基础】(五):通俗易懂决策树与随机森林及代码实践

    与SVM一样,决策树是通用的机器学习算法.随机森林,顾名思义,将决策树分类器集成到一起就形成了更强大的机器学习算法.它们都是很基础但很强大的机器学习工具,虽然我们现在有更先进的算法工具来训练模型,但决 ...

  6. 2.1.决策树和随机森林

    2.1.决策树和随机森林 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用 ...

  7. 12_信息熵,信息熵公式,信息增益,决策树、常见决策树使用的算法、决策树的流程、决策树API、决策树案例、随机森林、随机森林的构建过程、随机森林API、随机森林的优缺点、随机森林案例

    1 信息熵 以下来自:https://www.zhihu.com/question/22178202/answer/161732605 1.2 信息熵的公式 先抛出信息熵公式如下: 1.2 信息熵 信 ...

  8. 机器学习的几种方法(knn,逻辑回归,SVM,决策树,随机森林,极限随机树,集成学习,Adaboost,GBDT)

     一.判别模式与生成模型基础知识 举例:要确定一个瓜是好瓜还是坏瓜,用判别模型的方法是从历史数据中学习到模型,然后通过提取这个瓜的特征来预测出这只瓜是好瓜的概率,是坏瓜的概率. 举例:利用生成模型是根 ...

  9. 机器学习利器——决策树和随机森林

    更多深度文章,请关注:https://yq.aliyun.com/cloud 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率, ...

  10. R语言︱决策树族——随机森林算法

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:有一篇<有监督学习选择深度学习 ...

最新文章

  1. CTFshow 命令执行 web32
  2. RS-232串口线与以太网的八芯双绞线的对比,为什么不使用串口线来连接电脑和路由器?
  3. 笔记-高项案例题-2016年上-范围管理+沟通管理+进度管理+风险管理
  4. 转,数组遍历的三种方式
  5. opengl三维图形图形颜色_【图形学基础】基本概念
  6. For循环(十分重要)
  7. 机器学习实战10-Artificial Neural Networks人工神经网络简介(mnist数据集)
  8. reg51.h和reg52.h头文件
  9. 定时备份为Sharepoint做网站备份,并删除指定日期的备份
  10. 阿里技术副总裁贾扬清、微软 CTO 韦青重磅出席 AI 开发者大会!
  11. 【java基础】Eclipse Java注释模板设置详解以及版权声明
  12. 无人驾驶综述:国外国内发展历程
  13. matlab列主元消去法求逆矩阵,Gauss-Jordan列主元消元法求逆矩阵
  14. 【Codeforces 364D】Ghd
  15. 【台大郭彦甫】Matlab入门教程超详细学习笔记二:基本操作与矩阵运算(附PPT链接)
  16. python爬取电子书_python爬取计算机电子书(源码移步github)
  17. 回调函数举例ajax,通过回调函数的理解来进一步理解ajax及其注意的用法
  18. php代码审计课程笔记
  19. UCGUI中的实现透明窗体的原理
  20. 计算机无法识别3.0u盘启动,USB3.0的U盘在usb3.0的接口为什么不能启动WINPE

热门文章

  1. 什么是基金转换?转换费用如何收取?
  2. 90 亿美元的“Java 第一版权案”终落幕:谷歌胜!
  3. 疫期免费 “零接触”云迁移~工具替代人力! 人不聚,活儿继续!
  4. 彭亚雄:7月24日阿里云上海峰会企业存储大神
  5. ZStack实践汇 | 制造业企业IT经理的虚拟化方案选型经历
  6. 【图像处理】基于matlab GUI图像形态学处理【含Matlab源码 1287期】
  7. 【机械仿真】基于matlab水下机器人机械手系统仿真【含Matlab源码 1264期】
  8. 【图像分割】基于matlab GUI FCMKFCM MRI图像分割【含Matlab源码 582期】
  9. 【预测模型】基于matlab RLS算法预测【含Matlab源码 222期】
  10. 【优化求解】基于matalb改进的遗传算法求解IGA城市交通信号优化问题【含Matlab源码 215期】