下面的代码用R和python训练一个随机森林模型。正如您所注意到的,R(1-0.27=0.73)中的精度要比Python中的(0.69)好。此外,特性在R和Python中的重要性是不同的。在

[EDIT]是否有任何方法可以在python中复制R结果,或者有些事情是无法控制的?两个库中的某些可调参数不同,因此很难进行匹配。

有没有其他人从pyton和R的随机森林中得到不同的结果?有什么区别?在

R代码:library(randomForest)

mydata=read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")

mydata$admit=factor(mydata$admit)

rf = randomForest(admit~gre+gpa+rank, mydata, ntree=1000,

importance=TRUE, replace=TRUE)

print(rf)

print(rf$importance)

输出:

^{pr2}$

Python代码from sklearn.ensemble import RandomForestClassifier

import pandas as pd

import numpy as np

from sklearn.metrics import confusion_matrix

mydata=pd.read_csv("https://stats.idre.ucla.edu/stat/data/binary.csv")

train_data = mydata[ ["gre","gpa","rank"]]

train_label = mydata.admit

rfs = RandomForestClassifier(n_estimators=1000,oob_score=True,bootstrap=True)

rfs.fit(train_data,train_label)

print(rfs.oob_score_)

pred=np.round(rfs.oob_decision_function_[:,1])

real=train_label

confusion_matrix(real, pred)

rfs.feature_importances_

输出:RandomForestClassifier(bootstrap=True,

class_weight=None, criterion='gini',

max_depth=None, max_features='auto', max_leaf_nodes=None,

min_impurity_decrease=0.0, min_impurity_split=None,

min_samples_leaf=1, min_samples_split=2,

min_weight_fraction_leaf=0.0, n_estimators=1000, n_jobs=1,

oob_score=True, random_state=None, verbose=0,

warm_start=False)

0.6925

>>> >>> >>> array([[229, 44],

[ 79, 48]])

array([ 0.34573918, 0.53783772, 0.11642309])

python随机森林库_随机森林库:R和Python中的不同结果相关推荐

  1. python求excel方差_使用Excel、R、Python求统计量

    四个统计量的概念 Ø平均数(mean)也成为均值,它是一组数据相加后出医院数据的个数得得到的结果,样本均值用表示,总体均值用. Ø中位数(median)是一组数据排序后处于中间位置上的数值,用表示. ...

  2. python随机森林库_随机森林算法入门(python)

    目录 1 什么是随机森林 1.1 集成学习 1.2 随机决策树 1.3 随机森林 1.4 投票 2 为什么要用它 3 使用方法 3.1 变量选择 3.2 分类 3.3 回归 4 一个简单的Python ...

  3. gbdt 算法比随机森林容易_机器学习军火库 | 浪漫算法 随机森林

    一.基本原理 顾名思义,是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的.在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行 ...

  4. matlab 随机森林算法_(六)如何利用Python从头开始实现随机森林算法

    博客地址:https://blog.csdn.net/CoderPai/article/details/96499505 点击阅读原文,更好的阅读体验 CoderPai 是一个专注于人工智能在量化交易 ...

  5. python dash库_让你事半功倍的小众 Python 库

    WGET 提取数据,特别是从网络中提取数据是数据科学家的重要任务之一.Wget 是一个免费的工具,用于以非交互式方式从 Web 上下载文件.它支持 HTTP.HTTPS 和 FTP 协议,通过 HTT ...

  6. python 快速删除程序_如何快速一次性卸载所有python包(第三方库)呢

    很多时候我们都会有一个麻烦事,就是打开pycharm或者VScode等的时候,都有可能因为自己电脑上面安装的第三方模块过多,导致电脑很卡,风扇转速不停地增加,这时候我们就会想去卸载一些不太用得着的第三 ...

  7. aws python库_适用于Alexa的新AWS Python SDK入门指南

    aws python库 by Ralu Bolovan 由Ralu Bolovan 适用于Alexa的新AWS Python SDK入门指南 (A Beginner's guide to the ne ...

  8. python爬虫好友图片_用itchat库爬取你所有微信好友的头像,并合成一张大图

    几年前,我们给爸妈手机上下载了一款神奇的软件,他的名字叫微信.几年后,爸妈就开始吐槽我们的微信头像了. 爸妈对我们微信头像的关注程度远胜过我们的衣食住行,我在新浪微博上看到了这张统计图. 图片来源:新 ...

  9. python动态图表变化_用 Matplotlib 库生成动画图表

    更多文章请关注微信公众号:硬核智能 动画是一种展示现象的有趣方式.相对于静态图表,人类总是容易被动画和交互式图表所吸引.在描述多年来的股票价格.过去十年的气候变化.季节性和趋势等时间序列数据时,动画更 ...

最新文章

  1. 收藏 | 一文遍览CNN网络结构的发展
  2. Linux中perl脚本监控
  3. Docker 大势已去,Podman 万岁
  4. pandas 分组统计的三个函数 pivot table crosstab groupby
  5. Spring5源码 - 09 循环依赖解读
  6. iftop 监控linux服务器网卡流量
  7. 千岛湖救人工程师再次暖心,“感动阿里奖”奖金都捐公益
  8. Scala可变集合:Queue增加和移除元素
  9. 什么是Java多态?如何实现Java多态?
  10. Ubuntu下超实用的命令
  11. Delphi7 动态数组
  12. a4如何打印双面小册子_a4如何排版打印双面小册子?
  13. 软件无线电 多核服务器,软件无线电 SDR LTE平台简介
  14. 消灭非稳态噪音的利器 - AI 降噪
  15. 高通apq8098平台sd卡总结
  16. python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)
  17. 【深度学习技巧】数据扩充--常规手法
  18. matlab隐形眼镜类型预测,决策树预测隐形眼镜类型
  19. 电机专题1:电机原理
  20. 京东快报轮播公告的实现

热门文章

  1. 高斯滤波详解 python实现高斯滤波
  2. hdu1247 Hat’s Words
  3. [笔记] 最大权闭合子图最大流最小割相关笔记
  4. 三十五 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy分布式爬虫要点
  5. leetcode ---双指针+滑动窗体
  6. java第一次作业0
  7. [原创] Ubuntu 安装vim与中文帮助文档
  8. Delphi学习之函数 ⑨汉字拼音功能函数
  9. [转载] Python水平自测!100道经典练习题.pdf(附答案)
  10. [转载] opencv学习笔记7:图像加法与图像融合