总结两条关于random forest的实用经验。给定数据和问题,对于算法选择有参考价值。

  1. 小样本劣势,大样本优势

小样本情况下(1k~100k): RF相对与经典算法(SVM or Boosting)没优势,一般来说效果更差
大样本情况下(1M+): 这时候其他算法基本上跑不动了。RF凭借着快速的 training 和 testing,成为唯一能够实际操作的算法。 这也从一个侧面证明了工业界的哲学:数据第一,算法第二
如何针对不同问题,设计使用RF的方法,从而能够产生海量数据,是一门艺术
2. RF 与 KNN有相似的效果

RF 和 KNN 都可以看成对空间劈分的算法。RF 对空间的劈分是预计算的(在training过程中确定);而 KNN则是根据 testing sample adaptively劈分空间的。可以将RF视为KNN的一种快速算法。
KNN做不好的问题,RF也做不好

转自于
https://www.douban.com/note/212245564/

关于Knn和Random Forests的感觉
http://kkx.github.io/

Random Forest 实用经验(转)相关推荐

  1. 多元随机森林回归(Multivariate Random Forest Regreesor)经验总结

    多元随机森林回归(Multivariate Random Forest Regreesor)经验总结 随机森林 多元回归问题 是否需要分析自变量相关性 最近在使用随机森林解决多元回归问题,本文涉及一些 ...

  2. 系列 《使用sklearn进行集成学习——理论》 《使用sklearn进行集成学习——实践》 目录 1 Random Forest和Gradient Tree Boosting参数详解 2 如何调参?

    系列 <使用sklearn进行集成学习--理论> <使用sklearn进行集成学习--实践> 目录 1 Random Forest和Gradient Tree Boosting ...

  3. [Machine Learning] Random Forest 随机森林

    阅读目录 1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率(oob error) 6 随机森林工作原理解释的一个简单例子 7 随机森林的Pyth ...

  4. 【机器学习】 随机森林(Random Forest)

    1 什么是随机森林? 作为新兴起的.高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来 ...

  5. 机器学习 - 随机森林 Random Forest

    先修知识: 决策树.可以看我之前写的文章https://blog.csdn.net/weixin_41332009/article/details/112276531 集成学习.也可以看之前写的文章h ...

  6. Random Forest(随机森林)在软件缺陷预测领域的应用及其特点

    这篇博客也就简单总结一些基础知识.从我个人的经验和别人的论文来看,Random Forest是最适用于软件缺陷预测的机器学习算法.例如这篇文章: Osman, Haidar, Mohammad Gha ...

  7. Random Forest和Gradient Tree Boosting模型如何调参

    作者:城东 链接:https://www.zhihu.com/question/34470160/answer/114305935 来源:知乎 著作权归作者所有,转载请联系作者获得授权. 我来讲一讲R ...

  8. Random Forest和Gradient Tree Boosting如何调参

    作者:城东 链接:https://www.zhihu.com/question/34470160/answer/114305935 来源:知乎 著作权归作者所有,转载请联系作者获得授权. 使用skle ...

  9. 随机森林(Random Forest )

    上一篇:决策树(Decision Tree) 随机森林是一个具有高度灵活的机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,在当前的很多数据集上,相对其他算法有着很大的 ...

最新文章

  1. android 固定底部,如何将view固定在屏幕底部?
  2. 程序界面把程序员这条路走下去
  3. winform combobox第12345行的数据_Python学习第109课--ndarray的创建和切分操作
  4. git-commit编辑器nano改vim
  5. spring核心:bean工厂的装配 1
  6. 更改UISearchBar button属性
  7. $Poj1952\ $洛谷$1687\ Buy\ Low,Buy\ Lower$ 线性$DP+$方案计数
  8. 解决方案架构师我需要懂代码吗_“请问需要加汤吗?”火锅店背后隐藏的商业暗示,你都看懂了吗?...
  9. d778: NOIP2009 2.Hankson的趣味题
  10. ubuntu 12.04下gedit查看txt中文乱码解决办法
  11. 使用MCT6.0工具和fontconver制作MTK字库文件
  12. linux dhcpv6 客户端,Linux(RedHat6.4)下配置radvd和dhcpv6
  13. RDO方式安装Openstack Allinone问题记录
  14. 【转载】vue项目部署到阿里云上详解
  15. SVN更新报the working copy needs to be upgraded解决办法
  16. 为什么 你会如此痛苦……?
  17. python查找元素在列表中位置
  18. Android关于透明度对应表
  19. 【Xshell免费版,不用去找破解(ftp也一样)】
  20. DBA Scripts

热门文章

  1. 不允许使用java方式启动_细品 Java 中启动线程的正确和错误方式
  2. php 定义函数和访问,PHP-预定义函数访问数据库
  3. B. Bogosort codeforces(思维)
  4. 1054. 距离相等的条形码
  5. 服务器位置缩写,服务器地区缩写
  6. 几个简单的排序方式1
  7. mysql 5.5 slave 配置_mysql5.5 master-slave(Replication)配置方法
  8. c++语言get:_用C++给R语言加速:Rcpp简单用法
  9. azdb文件怎么打开_AZDBMappingSvcs.dll
  10. 大话“用户注册激活,忘记密码”发送邮件功能