ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序

目录

基于mpg数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序

# 1、定义数据集

# 2、数据集预处理

# 3、模型建立和训练

# 3.1、数据集切分

# 4、对模型进行PFI可视化

# T1、基于模型本身的解释—如随机森林树模型,但模型可能会存在偏差

# T2、基于模型度量的解释—PFI置换特征重要性并可视化


相关文章
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序实现

基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序

# 1、定义数据集

mpg cylinders displacement horsepower weight acceleration model_year origin name
18 8 307 130 3504 12 70 usa chevrolet chevelle malibu
15 8 350 165 3693 11.5 70 usa buick skylark 320
18 8 318 150 3436 11 70 usa plymouth satellite
16 8 304 150 3433 12 70 usa amc rebel sst
17 8 302 140 3449 10.5 70 usa ford torino

# 2、数据集预处理

before (398, 9)mpg  cylinders  displacement  ...  model_year  origin                       name
0  18.0          8         307.0  ...          70     usa  chevrolet chevelle malibu
1  15.0          8         350.0  ...          70     usa          buick skylark 320
2  18.0          8         318.0  ...          70     usa         plymouth satellite
3  16.0          8         304.0  ...          70     usa              amc rebel sst
4  17.0          8         302.0  ...          70     usa                ford torino[5 rows x 9 columns]
after dropna and drop (392, 8)mpg  cylinders  displacement  ...  acceleration  model_year  origin
0  18.0          8         307.0  ...          12.0          70     usa
1  15.0          8         350.0  ...          11.5          70     usa
2  18.0          8         318.0  ...          11.0          70     usa
3  16.0          8         304.0  ...          12.0          70     usa
4  17.0          8         302.0  ...          10.5          70     usa

# 3、模型建立和训练

# 3.1、数据集切分

X_feature_ns: ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model_year']

# 4、对模型进行PFI可视化

# T1、基于模型本身的解释—如随机森林树模型,但模型可能会存在偏差

    <style>table.eli5-weights tr:hover {filter: brightness(85%);}
</style><table class="eli5-weights eli5-feature-importances" style="border-collapse: collapse; border: none; margin-top: 0em; table-layout: auto;"><thead><tr style="border: none;"><th style="padding: 0 1em 0 0.5em; text-align: right; border: none;">Weight</th><th style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">Feature</th></tr></thead><tbody><tr style="background-color: hsl(120, 100.00%, 80.00%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.2846&plusmn; 0.2878</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">displacement</td></tr><tr style="background-color: hsl(120, 100.00%, 85.66%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1770&plusmn; 0.2423</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">weight</td></tr><tr style="background-color: hsl(120, 100.00%, 86.61%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1604&plusmn; 0.1535</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">horsepower</td></tr><tr style="background-color: hsl(120, 100.00%, 87.85%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1397&plusmn; 0.1684</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">mpg</td></tr><tr style="background-color: hsl(120, 100.00%, 89.82%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1085&plusmn; 0.0800</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">acceleration</td></tr><tr style="background-color: hsl(120, 100.00%, 92.40%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.0715&plusmn; 0.0545</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">model_year</td></tr><tr style="background-color: hsl(120, 100.00%, 93.41%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.0583&plusmn; 0.1736</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">cylinders</td></tr></tbody>
</table>

# T2、基于模型度量的解释—PFI置换特征重要性并可视化

ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序相关推荐

  1. ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略

    ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之详细 ...

  2. Dataset之mpg:mpg汽车油耗数据集的简介、下载、使用方法之详细攻略

    Dataset之mpg:mpg汽车油耗数据集的简介.下载.使用方法之详细攻略 目录 mpg汽车油耗数据集的简介 1.origin产地详解 mpg汽车油耗数据集的下载 mpg汽车油耗数据集的使用方法 m ...

  3. ML之NB:基于news新闻文本数据集利用纯统计法、kNN、朴素贝叶斯(高斯/多元伯努利/多项式)、线性判别分析LDA、感知器等算法实现文本分类预测

    ML之NB:基于news新闻文本数据集利用纯统计法.kNN.朴素贝叶斯(高斯/多元伯努利/多项式).线性判别分析LDA.感知器等算法实现文本分类预测 目录 基于news新闻文本数据集利用纯统计法.kN ...

  4. ML之CatboostC:基于titanic泰坦尼克数据集利用catboost算法实现二分类

    ML之CatboostC:基于titanic泰坦尼克数据集利用catboost算法实现二分类 目录 基于titanic泰坦尼克数据集利用catboost算法实现二分类 设计思路 输出结果 核心代码 相 ...

  5. ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例

    ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例 目录 基于MovieLens电影评分数据集利用基于 ...

  6. ML之RL:基于MovieLens电影评分数据集利用强化学习算法(多臂老虎机+EpsilonGreedy策略)实现对用户进行Top电影推荐案例

    ML之RL:基于MovieLens电影评分数据集利用强化学习算法(多臂老虎机+EpsilonGreedy策略)实现对用户进行Top电影推荐案例 目录 基于MovieLens电影评分数据集利用强化学习算 ...

  7. ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略

    ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻 ...

  8. ML之catboost:基于自带Pool数据集实现二分类预测

    ML之catboost:基于自带Pool数据集实现二分类预测 基于自带Pool数据集实现二分类预测 输出结果 Learning rate set to 0.5 0: learn: 0.9886498 ...

  9. ML之kNNC:基于iris莺尾花数据集(PCA处理+三维散点图可视化)利用kNN算法实现分类预测daiding

    ML之kNNC:基于iris莺尾花数据集(PCA处理+三维散点图可视化)利用kNN算法实现分类预测 目录 基于iris莺尾花数据集(PCA处理+三维散点图可视化)利用kNN算法实现分类预测 设计思路 ...

最新文章

  1. VGG16迁移学习实现
  2. C++知识点21——使用C++标准库(再谈string——string的搜索和数值转化)
  3. 一分钟搞定Java环境变量配置
  4. js生日计算年龄_生男生女计算公式超准
  5. js获取当前时间格式YYYY/MM/DD
  6. 使用 bind 搭建DNS 服务器
  7. python 进程 线程 协程
  8. 【贪心】牛客网:把数组排成最小的数
  9. 数据库改名系列(数据库名,逻辑名,物理文件名)
  10. 在 Mac上手动清除应用程序/用户缓存教程
  11. 3 前端面试,js(上)
  12. JavaWeb项目开发案例精粹-第3章在线考试系统-003Dao层
  13. android studio主moudle无法调用依赖moudle里的jar包
  14. Vue使用二维码生成微信支付
  15. 互联网让中国零售业弯道超车:近创新比黑科技重要
  16. Python学习笔记(纯代码)
  17. oracle 19c 由于MGA产生的文件扩展不足导致的ORA-04030
  18. win10计算机ip如何更改,Win10本地连接ip怎么更改_Win10怎么更改ip地址?-192路由网...
  19. Gitlab回滚到上次提交
  20. 基于智能化环境下低压电力客户远程集中自动抄表系统的实现

热门文章

  1. WSN 数据链路层协议 SMAC,TMAC…TRAMA...BMAC ,XMAC, ZMAC
  2. C++通过字符串指针打印字符串
  3. 申请电子面单号API接口文档
  4. 【机器学习】发展至今的机器学习到底对我们的就业和社会产生了哪些影响?
  5. 神经网络现状综述,神经网络现状分析
  6. 微信小程序cover-view 标签 中的字被截掉
  7. 2020秋招 上海汉得java开发一面面经
  8. 数学公式 —— 向量
  9. Toad 使用快速入门(转贴)
  10. cropperjs图片裁剪器及七牛上传文件