ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
目录
基于mpg数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
# 1、定义数据集
# 2、数据集预处理
# 3、模型建立和训练
# 3.1、数据集切分
# 4、对模型进行PFI可视化
# T1、基于模型本身的解释—如随机森林树模型,但模型可能会存在偏差
# T2、基于模型度量的解释—PFI置换特征重要性并可视化
相关文章
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序实现
基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序
# 1、定义数据集
mpg | cylinders | displacement | horsepower | weight | acceleration | model_year | origin | name |
18 | 8 | 307 | 130 | 3504 | 12 | 70 | usa | chevrolet chevelle malibu |
15 | 8 | 350 | 165 | 3693 | 11.5 | 70 | usa | buick skylark 320 |
18 | 8 | 318 | 150 | 3436 | 11 | 70 | usa | plymouth satellite |
16 | 8 | 304 | 150 | 3433 | 12 | 70 | usa | amc rebel sst |
17 | 8 | 302 | 140 | 3449 | 10.5 | 70 | usa | ford torino |
# 2、数据集预处理
before (398, 9)mpg cylinders displacement ... model_year origin name
0 18.0 8 307.0 ... 70 usa chevrolet chevelle malibu
1 15.0 8 350.0 ... 70 usa buick skylark 320
2 18.0 8 318.0 ... 70 usa plymouth satellite
3 16.0 8 304.0 ... 70 usa amc rebel sst
4 17.0 8 302.0 ... 70 usa ford torino[5 rows x 9 columns]
after dropna and drop (392, 8)mpg cylinders displacement ... acceleration model_year origin
0 18.0 8 307.0 ... 12.0 70 usa
1 15.0 8 350.0 ... 11.5 70 usa
2 18.0 8 318.0 ... 11.0 70 usa
3 16.0 8 304.0 ... 12.0 70 usa
4 17.0 8 302.0 ... 10.5 70 usa
# 3、模型建立和训练
# 3.1、数据集切分
X_feature_ns: ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model_year']
# 4、对模型进行PFI可视化
# T1、基于模型本身的解释—如随机森林树模型,但模型可能会存在偏差
<style>table.eli5-weights tr:hover {filter: brightness(85%);}
</style><table class="eli5-weights eli5-feature-importances" style="border-collapse: collapse; border: none; margin-top: 0em; table-layout: auto;"><thead><tr style="border: none;"><th style="padding: 0 1em 0 0.5em; text-align: right; border: none;">Weight</th><th style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">Feature</th></tr></thead><tbody><tr style="background-color: hsl(120, 100.00%, 80.00%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.2846± 0.2878</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">displacement</td></tr><tr style="background-color: hsl(120, 100.00%, 85.66%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1770± 0.2423</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">weight</td></tr><tr style="background-color: hsl(120, 100.00%, 86.61%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1604± 0.1535</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">horsepower</td></tr><tr style="background-color: hsl(120, 100.00%, 87.85%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1397± 0.1684</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">mpg</td></tr><tr style="background-color: hsl(120, 100.00%, 89.82%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.1085± 0.0800</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">acceleration</td></tr><tr style="background-color: hsl(120, 100.00%, 92.40%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.0715± 0.0545</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">model_year</td></tr><tr style="background-color: hsl(120, 100.00%, 93.41%); border: none;"><td style="padding: 0 1em 0 0.5em; text-align: right; border: none;">0.0583± 0.1736</td><td style="padding: 0 0.5em 0 0.5em; text-align: left; border: none;">cylinders</td></tr></tbody>
</table>
# T2、基于模型度量的解释—PFI置换特征重要性并可视化
ML之PFI(eli5):基于mpg汽车油耗数据集利用RF随机森林算法和PFI置换特征重要性算法实现模型特征可解释性排序相关推荐
- ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略
ML之shap:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之详细 ...
- Dataset之mpg:mpg汽车油耗数据集的简介、下载、使用方法之详细攻略
Dataset之mpg:mpg汽车油耗数据集的简介.下载.使用方法之详细攻略 目录 mpg汽车油耗数据集的简介 1.origin产地详解 mpg汽车油耗数据集的下载 mpg汽车油耗数据集的使用方法 m ...
- ML之NB:基于news新闻文本数据集利用纯统计法、kNN、朴素贝叶斯(高斯/多元伯努利/多项式)、线性判别分析LDA、感知器等算法实现文本分类预测
ML之NB:基于news新闻文本数据集利用纯统计法.kNN.朴素贝叶斯(高斯/多元伯努利/多项式).线性判别分析LDA.感知器等算法实现文本分类预测 目录 基于news新闻文本数据集利用纯统计法.kN ...
- ML之CatboostC:基于titanic泰坦尼克数据集利用catboost算法实现二分类
ML之CatboostC:基于titanic泰坦尼克数据集利用catboost算法实现二分类 目录 基于titanic泰坦尼克数据集利用catboost算法实现二分类 设计思路 输出结果 核心代码 相 ...
- ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例 目录 基于MovieLens电影评分数据集利用基于 ...
- ML之RL:基于MovieLens电影评分数据集利用强化学习算法(多臂老虎机+EpsilonGreedy策略)实现对用户进行Top电影推荐案例
ML之RL:基于MovieLens电影评分数据集利用强化学习算法(多臂老虎机+EpsilonGreedy策略)实现对用户进行Top电影推荐案例 目录 基于MovieLens电影评分数据集利用强化学习算 ...
- ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA 2018 Statistics(2018年俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻 ...
- ML之catboost:基于自带Pool数据集实现二分类预测
ML之catboost:基于自带Pool数据集实现二分类预测 基于自带Pool数据集实现二分类预测 输出结果 Learning rate set to 0.5 0: learn: 0.9886498 ...
- ML之kNNC:基于iris莺尾花数据集(PCA处理+三维散点图可视化)利用kNN算法实现分类预测daiding
ML之kNNC:基于iris莺尾花数据集(PCA处理+三维散点图可视化)利用kNN算法实现分类预测 目录 基于iris莺尾花数据集(PCA处理+三维散点图可视化)利用kNN算法实现分类预测 设计思路 ...
最新文章
- VGG16迁移学习实现
- C++知识点21——使用C++标准库(再谈string——string的搜索和数值转化)
- 一分钟搞定Java环境变量配置
- js生日计算年龄_生男生女计算公式超准
- js获取当前时间格式YYYY/MM/DD
- 使用 bind 搭建DNS 服务器
- python 进程 线程 协程
- 【贪心】牛客网:把数组排成最小的数
- 数据库改名系列(数据库名,逻辑名,物理文件名)
- 在 Mac上手动清除应用程序/用户缓存教程
- 3 前端面试,js(上)
- JavaWeb项目开发案例精粹-第3章在线考试系统-003Dao层
- android studio主moudle无法调用依赖moudle里的jar包
- Vue使用二维码生成微信支付
- 互联网让中国零售业弯道超车:近创新比黑科技重要
- Python学习笔记(纯代码)
- oracle 19c 由于MGA产生的文件扩展不足导致的ORA-04030
- win10计算机ip如何更改,Win10本地连接ip怎么更改_Win10怎么更改ip地址?-192路由网...
- Gitlab回滚到上次提交
- 基于智能化环境下低压电力客户远程集中自动抄表系统的实现