#In the next recipe, we'll look at how to tune the random forest classifier.
#Let's start by importing datasets:from sklearn import datasets
X, y = datasets.make_classification(1000)# X(1000,20)
#y(1000) 取值范围【0,1】from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.n_jobs=-1rf.fit(X, y)
print ("Accuracy:\t", (y == rf.predict(X)).mean())
print ("Total Correct:\t", (y == rf.predict(X)).sum())#每个例子属于哪个类的概率
probs = rf.predict_proba(X)
import pandas as pd
probs_df = pd.DataFrame(probs, columns=['0', '1'])
probs_df['was_correct'] = rf.predict(X) == y
import matplotlib.pyplot as plt
f, ax = plt.subplots(figsize=(7, 5))
probs_df.groupby('0').was_correct.mean().plot(kind='bar', ax=ax)
ax.set_title("Accuracy at 0 class probability")
ax.set_ylabel("% Correct")
ax.set_xlabel("% trees for 0")
f.show()#检测重要特征
rf = RandomForestClassifier()
rf.fit(X, y)
f, ax = plt.subplots(figsize=(7, 5))
ax.bar(range(len(rf.feature_importances_)),rf.feature_importances_)
ax.set_title("Feature Importances")
f.show()

转载于:https://www.cnblogs.com/qqhfeng/p/5341840.html

RandomForestClassifier(随机森林检测每个特征的重要性及每个样例属于哪个类的概率)...相关推荐

  1. python随机森林筛选变量_一种基于随机森林的改进特征筛选算法

    刘云翔 陈斌 周子宜 摘  要: 肝癌是一种我国高发的消化系统恶性肿瘤,患者死亡率高,威胁极大.而其预后情况通常只能通过医生的专业知识和经验积累来粗略判断,准确率较差.因此文中在分析随机森林算法的基本 ...

  2. python随机森林变量重要性_随机森林如何评估特征重要性【机器学习面试题详解】...

    今天爱分享给大家带来随机森林如何评估特征重要性[机器学习面试题详解],希望能够帮助到大家. 解析: 衡量变量重要性的方法有两种,Decrease GINI 和 Decrease Accuracy: 1 ...

  3. Spark 和 Python.sklearn:使用随机森林计算 feature_importance 特征重要性

    前言 在使用GBDT.RF.Xgboost等树类模型建模时,往往可以通过feature_importance 来返回特征重要性,本文以随机森林为例介绍其原理与实现.[ 链接:机器学习的特征重要性究竟是 ...

  4. 随机森林计算特征重要性_随机森林中计算特征重要性的3种方法

    随机森林计算特征重要性 The feature importance describes which features are relevant. It can help with a better ...

  5. 随机森林如何评估特征重要性

    序 集成学习模型的一大特点是可以输出特征重要性,特征重要性能够在一定程度上辅助我们对特征进行筛选,从而使得模型的鲁棒性更好. 随机森林中进行特征重要性的评估思想为: 判断每个特征在随机森林中的每颗树上 ...

  6. R语言随机森林模型:计算随机森林模型的特征重要度(feature importance)并可视化特征重要度、使用少数重要特征拟合随机森林模型(比较所有特征模型和重要特征模型在测试集上的表现差异)

    R语言随机森林模型:计算随机森林模型的特征重要度(feature importance)并可视化特征重要度.使用少数重要特征拟合随机森林模型(比较所有特征模型和重要特征模型在测试集上的表现差异) 目录

  7. 随机森林,随机森林中进行特征重要性

    随机森林(RF)简介 只要了解决策树的算法,那么随机森林是相当容易理解的.随机森林的算法可以用如下几个步骤概括: 用有抽样放回的方法(bootstrap)从样本集中选取n个样本作为一个训练集 用抽样得 ...

  8. sklearn随机森林展示各个特征权重

    核心代码 使用 feature_importances_可以提取随机森林的特征排序 rf_model.feature_importances_ 案例 创建数据: import pandas as pd ...

  9. 随机森林(独立思考的重要性)

    最典型的Bagging算法: "随机"是其核心,"森林"意在说明它是通过组合多棵决策树来构建模型. 主要特点: 对样本进行有放回抽样 对特征进行随机抽样 应用场 ...

最新文章

  1. lr:lr中错误解决方法19种
  2. rowid会变化么_升级后的饿了么,将成为阿里引领数字化的先锋
  3. 缺氧游戏黑科技计算机,《缺氧》游戏内参数修改图文详解
  4. leetcode343. 整数拆分(动态规划)
  5. spring数据字典_Redis为什么默认16个数据库?
  6. Python中正则匹配使用findall时的注意事项
  7. 计算机建模报告,计算机三维建模及分析实验报告单.doc
  8. cad隐藏图层命令快捷键_cad与天正局部隐藏对象大法
  9. antv | G2Plot 数据可视化图表库-案例
  10. 如何使用google code(转)
  11. php 生成圆形 图片,php 图片处理 - 将图片变成圆形
  12. 使用Spring Boot开发财务系统视频
  13. DELL笔记本E5400刷BIOS激活win7
  14. 设置自动清理mysql binlog日志_自动清理MySQL binlog日志
  15. 科研用matlab还是python_科的解释|科的意思|汉典“科”字的基本解释
  16. 诺基亚C2-03 - 简单才是首要的诺基亚C2-03
  17. Mac电脑没有声音但是重启后恢复
  18. python统计列表中元素个数_python中计算一个列表中连续相同的元素个数方法
  19. word2vec 词向量
  20. 【陈工笔记】# Latex中,bib格式转换为bbl格式文件 #

热门文章

  1. java arraylist排序_最全Java集合笔记
  2. 中南大学在线考试答案计算机基础,中南大学《计算机基础》在线考试题库(267题)(有答案).doc...
  3. 创建css的时候选择器有哪几类,CSS3-CSS的选择器共有几类?
  4. php socketconnect连接失败_PHP设计模式之模板方法模式
  5. groovy怎样从sql语句中截取表名_Mysql和SQL
  6. 抓localhost包 - rawcap
  7. as_hash ruby_Ruby中带有示例的Hash.delete_if方法
  8. ffmepg 命令提取音视频数据
  9. php的静态变量static在函数内部
  10. python 导入自己写的类_python中自己的类不能被导入