算法笔记(9)-随机森林算法及Python代码实现
随机森林也被称为随机决策森林,是一种集合学习方法,既可以用于分类,也可以用于回归。
随机森林把不同的几棵决策树打包到一块,每棵树的参数都不相同,然后把每棵树预测的结果取平均值,这样既保留决策树们的工作成效,又可以降低过拟合的风险。
集合学习算法:把多个机器学习算法综合在一起,制造出一个更大的模型。应用广泛的包括随机森林、梯度上升决策树。
优点
(1)不需要对数据进行预处理
(2)支持并行处理
缺点
(1)高维数据集、稀疏数据集表现没有线性模型好
(2)消耗内存,速度比线性模型慢
Python代码实现
forest = RandomForestClassifier(n_estimators=25,random_state=3)
forest.fit(X_train, y_train)
#定义图像中分区的颜色和散点的颜色
cmap_light = ListedColormap(['#FFAAAA', '#AAFFAA', '#AAAAFF'])
cmap_bold = ListedColormap(['#FF0000', '#00FF00', '#0000FF'])#分别用样本的两个特征值创建图像和横轴和纵轴
x_min, x_max = X_train[:, 0].min() - 1, X_train[:, 0].max() + 1
y_min, y_max = X_train[:, 1].min() - 1, X_train[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, .02),np.arange(y_min, y_max, .02))
Z = forest.predict(np.c_[xx.ravel(), yy.ravel()])#给每个分类中的样本分配不同的颜色
Z = Z.reshape(xx.shape)
plt.figure()
plt.pcolormesh(xx, yy, Z, cmap=cmap_light)#用散点把样本表示出来
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=cmap_bold, edgecolor='k', s=20)
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.title("Classifier:RandomForest")plt.show()
输出结果如下图
想要完整代码的朋友,可toutiao号搜索“编程研究坊”关注后私信我,回复“算法笔记9“免费获取
算法笔记(9)-随机森林算法及Python代码实现相关推荐
- 随机森林分类算法python代码_Python机器学习笔记:随机森林算法
随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...
- 【算法实现】随机森林算法的房屋价格预测模型
@转载[项目实战]基于随机森林算法的房屋价格预测模型 [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/s ...
- 算法笔记(15)特征提取及Python代码实现
特征提取从初始的一组测量数据开始,并建立旨在提供信息和非冗余的派生值(特征),从而促进后续的学习和泛化步骤,并且在某些情况下带来更好的可解释性.本节主要讲述2种特征提取方法:PCA主成分分析法用于特征 ...
- 基于python的随机森林回归实现_随机森林理论与python代码实现
1,初品随机森林 随机森林,森林就是很多决策树放在一起一起叫森林,而随机体现在数据集的随机采样中和特征的随机选取中,具体下面再讲.通俗的说随机森林就是建立多颗决策树(CART),来做分类(回归),以多 ...
- gbdt 算法比随机森林容易_用Python实现随机森林算法
CDA数据分析师 出品 拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.bagging(bootstrap aggregating 的缩写)算法从训练数据 ...
- 随机森林python实例_用Python实现随机森林算法的示例
这篇文章主要介绍了用Python实现随机森林算法,小编觉得挺不错的,现在分享给大家,也给大家做个参考. 拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.b ...
- python与GIS数据处理——随机森林算法插值
背景 这个是我系列插值文章的第三篇,使用机器学习插值(使用随机森林算法插值). 代码链接 代码我已经放在Github上面了,免费分享使用,https://github.com/yuanzhoulvpi ...
- 动手实操丨基于随机森林算法进行硬盘故障预测
摘要:业界期望使用机器学习技术来构建硬盘故障预测的模型,更准确地提前感知硬盘故障,降低运维成本,提升业务体验.本案例将使用随机森林算法来训练一个硬盘故障预测模型. 本文分享自华为云社区<基于随机 ...
- 随机森林算法深入浅出
文章目录 一 随机森林算法的基本原理 二 随机森林算法的优点 1. 随机森林算法具有很高的准确性和鲁棒性 2. 随机森林算法可以有效地避免过拟合问题 3. 随机森林算法可以处理高维度数据 4. 随机森 ...
- 基于随机森林算法进行硬盘故障预测
摘要:本案例将带大家使用一份开源的S.M.A.R.T.数据集和机器学习中的随机森林算法,来训练一个硬盘故障预测模型,并测试效果. 本文分享自华为云社区<基于随机森林算法进行硬盘故障预测>, ...
最新文章
- 【Live555】live555源码详解(九):ServerMediaSession、ServerMediaSubsession、live555MediaServer
- 周志华 机器学习 笔记
- ccf-csp #201909-1 小明种苹果
- 基于webpack搭建前端工程解决方案探索
- 复现HITB PHP lover代码审计
- html css移动form表单位置,表单form的研究
- 去除面部黑色素小妙招_去除暗黄皮肤的小妙招 7招让你白皙动人
- 多线程往文件里写数据
- 基于WDF的驱动开发
- 软件测试面试宝典【测试流程、数据库、Linux、测试工具、自动化、性能测试】
- Java 下数据业务逻辑开发技术 JOOQ 和 SPL
- 对口升学考试计算机专业好考吗,2017届对口升学考试计算机专业月考三试题
- 互联网创业的五大定律
- VS2017中配置QT5.12开发环境
- 量化策略——准备2 量化技能树量化术语
- SAP 常用BAPI
- 使用react 写一个 仿淘宝 图片放大镜效果
- sqlite的count
- 《微机原理与接口技术》期末考试题型总结 + 试卷超详解
- 12、弱电工程综合布线各种设备材料图解,必学
热门文章
- python编写脚本暴力破解6位纯数字密码
- Win10系统怎么注销微软账户
- LSUN数据集读取和解压,mdb格式转换为jpg格式(保姆教程)
- 华为digix算法大赛2020机器学习赛道-搜索相关性初赛A/B榜rank1
- 2021中国华录杯·算法大赛直通车!
- Android 在系统启动时设置声卡权限,[RK3288][Android7.1]强制使用默认声卡播放声音...
- 弗雷歇距离 matlab,离散Fréchet(弗雷歇) 距离评价曲线相似度
- 基于stm32的GPS解析数据
- 获取B站SESSDATA及解决403
- Springboot 406错误