python随机森林库_随机森林库:R和Python中的不同结果
下面的代码用R和python训练一个随机森林模型。正如您所注意到的,R(1-0.27=0.73)中的精度要比Python中的(0.69)好。此外,特性在R和Python中的重要性是不同的。在
[EDIT]是否有任何方法可以在python中复制R结果,或者有些事情是无法控制的?两个库中的某些可调参数不同,因此很难进行匹配。
有没有其他人从pyton和R的随机森林中得到不同的结果?有什么区别?在
R代码:library(randomForest)
mydata=read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
mydata$admit=factor(mydata$admit)
rf = randomForest(admit~gre+gpa+rank, mydata, ntree=1000,
importance=TRUE, replace=TRUE)
print(rf)
print(rf$importance)
输出:
^{pr2}$
Python代码from sklearn.ensemble import RandomForestClassifier
import pandas as pd
import numpy as np
from sklearn.metrics import confusion_matrix
mydata=pd.read_csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
train_data = mydata[ ["gre","gpa","rank"]]
train_label = mydata.admit
rfs = RandomForestClassifier(n_estimators=1000,oob_score=True,bootstrap=True)
rfs.fit(train_data,train_label)
print(rfs.oob_score_)
pred=np.round(rfs.oob_decision_function_[:,1])
real=train_label
confusion_matrix(real, pred)
rfs.feature_importances_
输出:RandomForestClassifier(bootstrap=True,
class_weight=None, criterion='gini',
max_depth=None, max_features='auto', max_leaf_nodes=None,
min_impurity_decrease=0.0, min_impurity_split=None,
min_samples_leaf=1, min_samples_split=2,
min_weight_fraction_leaf=0.0, n_estimators=1000, n_jobs=1,
oob_score=True, random_state=None, verbose=0,
warm_start=False)
0.6925
>>> >>> >>> array([[229, 44],
[ 79, 48]])
array([ 0.34573918, 0.53783772, 0.11642309])
python随机森林库_随机森林库:R和Python中的不同结果相关推荐
- python求excel方差_使用Excel、R、Python求统计量
四个统计量的概念 Ø平均数(mean)也成为均值,它是一组数据相加后出医院数据的个数得得到的结果,样本均值用表示,总体均值用. Ø中位数(median)是一组数据排序后处于中间位置上的数值,用表示. ...
- python随机森林库_随机森林算法入门(python)
目录 1 什么是随机森林 1.1 集成学习 1.2 随机决策树 1.3 随机森林 1.4 投票 2 为什么要用它 3 使用方法 3.1 变量选择 3.2 分类 3.3 回归 4 一个简单的Python ...
- gbdt 算法比随机森林容易_机器学习军火库 | 浪漫算法 随机森林
一.基本原理 顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的.在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行 ...
- matlab 随机森林算法_(六)如何利用Python从头开始实现随机森林算法
博客地址:https://blog.csdn.net/CoderPai/article/details/96499505 点击阅读原文,更好的阅读体验 CoderPai 是一个专注于人工智能在量化交易 ...
- python dash库_让你事半功倍的小众 Python 库
WGET 提取数据,特别是从网络中提取数据是数据科学家的重要任务之一.Wget 是一个免费的工具,用于以非交互式方式从 Web 上下载文件.它支持 HTTP.HTTPS 和 FTP 协议,通过 HTT ...
- python 快速删除程序_如何快速一次性卸载所有python包(第三方库)呢
很多时候我们都会有一个麻烦事,就是打开pycharm或者VScode等的时候,都有可能因为自己电脑上面安装的第三方模块过多,导致电脑很卡,风扇转速不停地增加,这时候我们就会想去卸载一些不太用得着的第三 ...
- aws python库_适用于Alexa的新AWS Python SDK入门指南
aws python库 by Ralu Bolovan 由Ralu Bolovan 适用于Alexa的新AWS Python SDK入门指南 (A Beginner's guide to the ne ...
- python爬虫好友图片_用itchat库爬取你所有微信好友的头像,并合成一张大图
几年前,我们给爸妈手机上下载了一款神奇的软件,他的名字叫微信.几年后,爸妈就开始吐槽我们的微信头像了. 爸妈对我们微信头像的关注程度远胜过我们的衣食住行,我在新浪微博上看到了这张统计图. 图片来源:新 ...
- python动态图表变化_用 Matplotlib 库生成动画图表
更多文章请关注微信公众号:硬核智能 动画是一种展示现象的有趣方式.相对于静态图表,人类总是容易被动画和交互式图表所吸引.在描述多年来的股票价格.过去十年的气候变化.季节性和趋势等时间序列数据时,动画更 ...
最新文章
- 收藏 | 一文遍览CNN网络结构的发展
- Linux中perl脚本监控
- Docker 大势已去,Podman 万岁
- pandas 分组统计的三个函数 pivot table crosstab groupby
- Spring5源码 - 09 循环依赖解读
- iftop 监控linux服务器网卡流量
- 千岛湖救人工程师再次暖心,“感动阿里奖”奖金都捐公益
- Scala可变集合:Queue增加和移除元素
- 什么是Java多态?如何实现Java多态?
- Ubuntu下超实用的命令
- Delphi7 动态数组
- a4如何打印双面小册子_a4如何排版打印双面小册子?
- 软件无线电 多核服务器,软件无线电 SDR LTE平台简介
- 消灭非稳态噪音的利器 - AI 降噪
- 高通apq8098平台sd卡总结
- python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)
- 【深度学习技巧】数据扩充--常规手法
- matlab隐形眼镜类型预测,决策树预测隐形眼镜类型
- 电机专题1:电机原理
- 京东快报轮播公告的实现
热门文章
- 高斯滤波详解 python实现高斯滤波
- hdu1247 Hat’s Words
- [笔记] 最大权闭合子图最大流最小割相关笔记
- 三十五 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy分布式爬虫要点
- leetcode ---双指针+滑动窗体
- java第一次作业0
- [原创] Ubuntu 安装vim与中文帮助文档
- Delphi学习之函数 ⑨汉字拼音功能函数
- [转载] Python水平自测!100道经典练习题.pdf(附答案)
- [转载] opencv学习笔记7:图像加法与图像融合