随机森林也被称为随机决策森林,是一种集合学习方法,既可以用于分类,也可以用于回归。
随机森林把不同的几棵决策树打包到一块,每棵树的参数都不相同,然后把每棵树预测的结果取平均值,这样既保留决策树们的工作成效,又可以降低过拟合的风险。
集合学习算法:把多个机器学习算法综合在一起,制造出一个更大的模型。应用广泛的包括随机森林、梯度上升决策树。

优点

(1)不需要对数据进行预处理
(2)支持并行处理

缺点

(1)高维数据集、稀疏数据集表现没有线性模型好
(2)消耗内存,速度比线性模型慢
Python代码实现

forest = RandomForestClassifier(n_estimators=25,random_state=3)
forest.fit(X_train, y_train)
#定义图像中分区的颜色和散点的颜色
cmap_light = ListedColormap(['#FFAAAA', '#AAFFAA', '#AAAAFF'])
cmap_bold = ListedColormap(['#FF0000', '#00FF00', '#0000FF'])#分别用样本的两个特征值创建图像和横轴和纵轴
x_min, x_max = X_train[:, 0].min() - 1, X_train[:, 0].max() + 1
y_min, y_max = X_train[:, 1].min() - 1, X_train[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .02),np.arange(y_min, y_max, .02))
Z = forest.predict(np.c_[xx.ravel(), yy.ravel()])#给每个分类中的样本分配不同的颜色
Z = Z.reshape(xx.shape)
plt.figure()
plt.pcolormesh(xx, yy, Z, cmap=cmap_light)#用散点把样本表示出来
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=cmap_bold, edgecolor='k', s=20)
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier:RandomForest")plt.show()

输出结果如下图

 想要完整代码的朋友,可toutiao号搜索“编程研究坊”关注后私信我,回复“算法笔记9“免费获取

算法笔记(9)-随机森林算法及Python代码实现相关推荐

  1. 随机森林分类算法python代码_Python机器学习笔记:随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  2. 【算法实现】随机森林算法的房屋价格预测模型

    @转载[项目实战]基于随机森林算法的房屋价格预测模型 [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/s ...

  3. 算法笔记(15)特征提取及Python代码实现

    特征提取从初始的一组测量数据开始,并建立旨在提供信息和非冗余的派生值(特征),从而促进后续的学习和泛化步骤,并且在某些情况下带来更好的可解释性.本节主要讲述2种特征提取方法:PCA主成分分析法用于特征 ...

  4. 基于python的随机森林回归实现_随机森林理论与python代码实现

    1,初品随机森林 随机森林,森林就是很多决策树放在一起一起叫森林,而随机体现在数据集的随机采样中和特征的随机选取中,具体下面再讲.通俗的说随机森林就是建立多颗决策树(CART),来做分类(回归),以多 ...

  5. gbdt 算法比随机森林容易_用Python实现随机森林算法

    CDA数据分析师 出品 拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.bagging(bootstrap aggregating 的缩写)算法从训练数据 ...

  6. 随机森林python实例_用Python实现随机森林算法的示例

    这篇文章主要介绍了用Python实现随机森林算法,小编觉得挺不错的,现在分享给大家,也给大家做个参考. 拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.b ...

  7. python与GIS数据处理——随机森林算法插值

    背景 这个是我系列插值文章的第三篇,使用机器学习插值(使用随机森林算法插值). 代码链接 代码我已经放在Github上面了,免费分享使用,https://github.com/yuanzhoulvpi ...

  8. 动手实操丨基于随机森林算法进行硬盘故障预测

    摘要:业界期望使用机器学习技术来构建硬盘故障预测的模型,更准确地提前感知硬盘故障,降低运维成本,提升业务体验.本案例将使用随机森林算法来训练一个硬盘故障预测模型. 本文分享自华为云社区<基于随机 ...

  9. 随机森林算法深入浅出

    文章目录 一 随机森林算法的基本原理 二 随机森林算法的优点 1. 随机森林算法具有很高的准确性和鲁棒性 2. 随机森林算法可以有效地避免过拟合问题 3. 随机森林算法可以处理高维度数据 4. 随机森 ...

  10. 基于随机森林算法进行硬盘故障预测

    摘要:本案例将带大家使用一份开源的S.M.A.R.T.数据集和机器学习中的随机森林算法,来训练一个硬盘故障预测模型,并测试效果. 本文分享自华为云社区<基于随机森林算法进行硬盘故障预测>, ...

最新文章

  1. 【Live555】live555源码详解(九):ServerMediaSession、ServerMediaSubsession、live555MediaServer
  2. 周志华 机器学习 笔记
  3. ccf-csp #201909-1 小明种苹果
  4. 基于webpack搭建前端工程解决方案探索
  5. 复现HITB PHP lover代码审计
  6. html css移动form表单位置,表单form的研究
  7. 去除面部黑色素小妙招_去除暗黄皮肤的小妙招 7招让你白皙动人
  8. 多线程往文件里写数据
  9. 基于WDF的驱动开发
  10. 软件测试面试宝典【测试流程、数据库、Linux、测试工具、自动化、性能测试】
  11. Java 下数据业务逻辑开发技术 JOOQ 和 SPL
  12. 对口升学考试计算机专业好考吗,2017届对口升学考试计算机专业月考三试题
  13. 互联网创业的五大定律
  14. VS2017中配置QT5.12开发环境
  15. 量化策略——准备2 量化技能树量化术语
  16. SAP 常用BAPI
  17. 使用react 写一个 仿淘宝 图片放大镜效果
  18. sqlite的count
  19. 《微机原理与接口技术》期末考试题型总结 + 试卷超详解
  20. 12、弱电工程综合布线各种设备材料图解,必学

热门文章

  1. python编写脚本暴力破解6位纯数字密码
  2. Win10系统怎么注销微软账户
  3. LSUN数据集读取和解压,mdb格式转换为jpg格式(保姆教程)
  4. 华为digix算法大赛2020机器学习赛道-搜索相关性初赛A/B榜rank1
  5. 2021中国华录杯·算法大赛直通车!
  6. Android 在系统启动时设置声卡权限,[RK3288][Android7.1]强制使用默认声卡播放声音...
  7. 弗雷歇距离 matlab,离散Fréchet(弗雷歇) 距离评价曲线相似度
  8. 基于stm32的GPS解析数据
  9. 获取B站SESSDATA及解决403
  10. Springboot 406错误