这篇博客也就简单总结一些基础知识。从我个人的经验和别人的论文来看,Random Forest是最适用于软件缺陷预测的机器学习算法。例如这篇文章:

Osman, Haidar, Mohammad Ghafari, Oscar Nierstrasz, and Mircea Lungu. "An extensive analysis of efficient bug prediction configurations." In Proceedings of the 13th International Conference on Predictive Models and Data Analytics in Software Engineering, pp. 107-116. ACM, 2017.

里介绍,他们经过Extensive的分析,认为:“Random Forest results is the best machine learning model, followed by Support Vector Machines.”

另外,Random Forest还有两个比较好的特性:

1.不需要做特征归一化处理,通常来讲,由于各维特征的维度不同,需要进行归一化处理,但是如这里介绍的:“对于决策树和随机森林以及XGboost算法而言,特征缩放对于它们没有什么影响。”

2.不需要做特征选择,并不是说特征选择不重要,如上面这篇论文中所说:“We do not apply feature selection for RF because it performs feature selection internally.”

有这两点,就使Random Forest使用起来很方便。想想看RF是2001年提出的方法了(Breiman, Leo. "Random forests." Machine learning 45, no. 1 (2001): 5-32.),都这么多年了,竟然也没有什么好的替代算法,真是让人捉急啊。

Random Forest(随机森林)在软件缺陷预测领域的应用及其特点相关推荐

  1. [Machine Learning] Random Forest 随机森林

    阅读目录 1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率(oob error) 6 随机森林工作原理解释的一个简单例子 7 随机森林的Pyth ...

  2. Random Forest随机森林算法

    Random Forest是加州大学伯克利分校的Breiman Leo和Adele Cutler于2001年发表的论文中提到的新的机器学习算法,可以用来做分类,聚类,回归,这里只简单介绍该算法在分类上 ...

  3. random forest(随机森林)

    转载自:http://lincccc.com/?p=47 Random Forest(s),随机森林,又叫Random Trees[2][3],是一种由多棵决策树组合而成的联合预测模型,天然可以作为快 ...

  4. Random Forest随机森林概述

    引言 在机器学习中,随机森林由许多的决策树组成,因为这些决策树的形成采用了随机的方法,因此也叫做随机决策树.随机森林中的树之间是没有关联的.当测试数据进入随机森林时,其实就是让每一颗决策树进行分类,最 ...

  5. Random Forest随机森林

    随机:随机从数据集中采样以训练模型中的每颗决策树. 森林:模型中包含很多决策树. 在集成学习中,主要分为bagging算法和boosting算法. Bagging的基本思想为对训练集有放回地抽取训练样 ...

  6. 随机森林 html5,利用随机森林回归算法预测总有机碳含量

    受美国"页岩气革命"的影响,页岩气勘探受到了大量的关注( 现有利用测井曲线预测TOC的方法有4类:①利用单曲线或多曲线建立回归关系的预测方法,如利用密度曲线(DEN)预测TOC.利 ...

  7. 为葡萄酒数据集构造SVM分类器和使用随机森林回归模型预测葡萄酒质量

    目录 前言 一.实验目的 二.实验环境 三.实验内容与结果 1.SVM(support vector Machine)是什么? 2.SVM能干什么? 3.SVM如何实现? 4.独热编码:独热编码(On ...

  8. 【python3】基于随机森林的气温预测

    前言 这个项目实战系列主要是跟着网络上的教程来做的,主要参考<跟着迪哥学习机器学习>中的思路和具体实现代码,但是书中使用到的应该是python2的版本,有一些代码也有问题,有的是省略了一些 ...

  9. python基于随机森林模型的预测概率和标签信息可视化ROC曲线

    python基于随机森林模型的预测概率和标签信息可视化ROC曲线 目录 python基于随机森林模型的预测概率和标签信息可视化ROC曲线

最新文章

  1. eclipse中安装使用Gradle构建工具
  2. 我的世界服务器反作弊不起作用,我的世界服务器反作弊怎么搞 | 手游网游页游攻略大全...
  3. 机器学习之kNN算法(纯python实现)
  4. 使用gnuplot绘制直方图
  5. Visual Studio 2019 首个预览版本抢先看,有啥新功能?
  6. YBTOJ洛谷P3195:玩具装箱(斜率优化dp)
  7. SQL转换函数(CAST 和 CONVERT)
  8. 扩展bash_Bash中的参数扩展简介
  9. c语言 调用父类方法,关于C++:如何从派生类函数调用父类函数?
  10. 分母为0一定会抛异常吗?
  11. [软件应用]常用软件名录
  12. php发微信模板消息,PHP超简单发送微信模板消息
  13. VC中CDockablePane使用心得
  14. 编译疑问: Warning: Backslash and Newline separated by space
  15. html5时钟在图片上画指针,HTML5使用canvas元素绘制指针式动画时钟_网页代码站(www.webdm.cn)...
  16. 一个屌丝程序员的青春(二四一)
  17. halcon例程学习笔记(11) 一维码、二维码识别
  18. julia常用矩阵函数_Julia 多维数组
  19. 为什么你做数据分析没思路?
  20. 5步完成编写Mysql的shell脚本

热门文章

  1. yolov5通过ncnn在安卓平台部署
  2. 武汉大学图书馆随书光盘管理系统
  3. python决策树原理_Python机器学习决策树算法 | kTWO-个人博客
  4. 冠科生物宣布加快获得用于大规模筛查检测板的ATCC和NIH优质细胞系
  5. death coming一直连接服务器,Death Coming死活进不去怎么解决
  6. Vue项目 音乐播放器 学习笔记 列表数据 Ⅱ
  7. 固有值问题的Sturm-Liouville定理(广义Fourie展开) | 分离变量法(四)| 偏微分方程(十六)
  8. 德国品牌超大功率大扭力无抖动断刀技术雕刻机主轴
  9. anki用HTML代码批量,使用 JavaScript 操作 HTML 批量制作 Anki 卡片
  10. 云上实训大数据查资料一些技巧