目录

  • 1.使用均值或0填充缺失值
  • 2.使用随机森林填补缺失值

1.使用均值或0填充缺失值

2.使用随机森林填补缺失值

对于一个有n个特征的数据来说,其中特征T有缺失值,我们就把特征T当作标签,其他的n-1个特征和原本的标签组成新的特征矩阵。那对于T来说,它没有缺失的部分,就是我们的Y_train,这部分数据既有标签也有特征,而它缺失的部分,只有特征没有标签,就是我们需要预测的部分。
特征T不缺失的值对应的其他n-1个特征+本来的标签:x_train特征T不缺失的值: Y_train
特征T缺失的值对应的其他n-1个特征+本来的标签:x_test特征T缺失的值:未知,我们需要预测的Y_test
这种做法,对于某一个特征大量缺失,其他特征却很完整的情况,非常适用。

那如果数据中除了特征T之外,其他特征也有缺失值怎么办?

答案是遍历所有的特征,从缺失最少的开始进行填补〈因为填补缺失最少的特征所需要的准确信息最少)。
填补一个特征时,先将其他特征的缺失值用O代替,每完成一次回归预测,就将预测值放到原本的特征矩阵中,再继续填
补下一个特征。每一次填补完毕,有缺失值的特征会减少一个,所以每次循环后,需要用0来填补的特征就越来越少。当进行到最后一个特征时(这个特征应该是所有特征中缺失值最多的),已经没有任何的其他特征需要用0来进行填补了,
而我们已经使用回归为其他特征填补了大量有效信息,可以用来填补缺失最多的特征。



画图

SKLEARN实例:【用随机森林回归填补缺失值】相关推荐

  1. 【skLearn 练习】随机森林回归填补缺失值

    文章目录 随机森林回归填补缺失值 ♦导入需要的库 ♦导入数据集 ♦构建缺失值 ♦缺失值填补 ① 均值mean填补 ② 使用0值填补 ③ 使用随机森林回归填补 ⑴ 缺失值数目排序索引 ⑵ 遍历索引填补空 ...

  2. 五、实例:在波士顿房价数据集上用随机森林回归填补缺失值

    在波士顿房价数据集上用随机森林回归填补缺失值 点击标题即可获取源代码和笔记 一.引入 我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值.面对缺失值,很多人选择的方式是直接将含有缺失 ...

  3. sklearn机器学习:随机森林回归器RandomForestRegressor

    sklearn随机森林回归器类的格式 sklearn.ensemble.RandomForestRegressor (n_estimators='warn', criterion='mse', max ...

  4. 案例2:随机森林来填补缺失值

    使用随机森林回归来填补缺失值 1.导包 先导入一些需要的包 import numpy as np import pandas as pd import matplotlib.pyplot as plt ...

  5. sklearn实战之随机森林

    sklearn实战系列: (1) sklearn实战之决策树 (2) sklearn实战之随机森林 (3) sklearn实战之数据预处理与特征工程 (4) sklearn实战之降维算法PCA与SVD ...

  6. 万能  随机森林回归 补缺函数

    #####todo 只对一列数据含有缺失,另外的数据都不含缺失值的数据有效def fill_missing_rf(X, Y, to_fill):"""使用随机森林填补一个 ...

  7. 机器学习系列(10)_决策树与随机森林回归

    注:本篇文章接上一篇文章>>机器学习系列(9)_决策树详解01 文章目录 一.决策树优缺点 二.泰坦尼克号幸存者案例 三.随机森林介绍 1.随机森林的分类 2.重要参数 [1]n_esti ...

  8. 随机森林回归算法讲解

    随机森林(Random Forest)是一种基于集成学习的机器学习算法,被广泛用于回归问题.它通过使用多个决策树对数据进行建模,并将它们的预测结果进行集成,从而提高了模型的性能和稳定性.在本教程中,我 ...

  9. sklearn的系统学习——随机森林分类器与随机森林回归器(含有python完整代码及案例)

    目录 集成算法 sklearn中的随机森林 随机森林分类器 随机性参数 属性 案例代码 随机森林回归器 案例代码 在前面的内容中,已经对决策树解决分类回归问题分别做了阐述,今天走进随机森林的世界. 什 ...

  10. 《菜菜的机器学习sklearn课堂》随机森林应用泛化误差调参实例

    随机森林 随机森林 - 概述 集成算法概述 sklearn中的集成算法 随机森林分类器 RandomForestClassifier 重要参数 控制基评估器的参数 n_estimators:基评估器的 ...

最新文章

  1. leetcode每日一题系列——797. 所有可能的路径
  2. [脑海成像]科学家利用动态电极绕过眼睛直接刺激大脑,在盲人脑海画出字母
  3. 【Android 逆向】IDA 工具使用 ( 同步指定的 IDA View 视图 | Hex View 数据格式 | 过滤设置 )
  4. 简谈高通Trustzone的实现
  5. 机房运维很枯燥?来看看中国银行数据中心基础设施可视化运维管理
  6. html中css路径和xpath路径,6.1 HTML的简单介绍和快速获取XPath和CSS路径
  7. Xshell的安装和连接
  8. 大话数据结构11:队列 链表结构
  9. 电商领域中SKU和SPU区别比较
  10. Python《爬虫收集》
  11. 2015-12-01 SQL查询语句基础
  12. Java-Arrays数组操作
  13. FB新应用可借助人工智能回答照片内容提问
  14. 转 纯真IP数据库格式详解
  15. 彻底理解样本方差为何除以n-1
  16. 关于购买二手macbook的建议,看这一篇文章就够了!
  17. js:为窗口盒子添加拖拽事件
  18. android脚本实现自动捉妖,一起来捉妖自动捉妖脚本使用教程ios00
  19. 孩子小学总喜欢用计算机做数学,数学到底该怎样学?真实用!
  20. linux常用压缩和解压缩命令整理

热门文章

  1. 使用playsound播放音频(python)
  2. java jwt 单点登录_jwt技术实现系统间的单点登录
  3. 苹果手机屏幕镜像搜索不到电视_康佳电视投屏不了,3个办法解决!
  4. PayPal WebHook事件异步通知
  5. xps13 linux 硬盘,在xps13上安装ubuntu16.04教程
  6. android 卡片消息,安卓QNotified 支持xml卡片QQ消息 - 陌路人博客
  7. 8、Ndk开发小记一
  8. 微信模拟地理位置_微信电脑版伪装地理位置的方法
  9. https的包该怎么抓?
  10. CAD中插入外部参照字体会变繁体_CAD缺字体时为什么有些字体无法替换?大字体什么意思?什么是形文件?...