#####todo  只对一列数据含有缺失,另外的数据都不含缺失值的数据有效def fill_missing_rf(X, Y, to_fill):"""使用随机森林填补一个特征的缺失值的函数:param X: 要填补的特征矩阵:param Y: 完整的,没有缺失值的标签:param to_fill: 字符串,要填补的那一列的名称:return:"""# 构建我们的新的特征矩阵和标签df = X.copy()fill = df.loc[:, to_fill]df = pd.concat([df.loc[:,df.columns != to_fill], pd.DataFrame(Y)], axis=1)# 找出训练集和测试集Ytrain = fill[fill.notnull()]Ytest = fill[fill.isnull()]Xtrain = df.iloc[Ytrain.index, :]Xtest = df.iloc[Ytest.index, :]# 用随机森林回归填补缺失值from sklearn.ensemble import RandomForestRegressor as rfcrfc = rfc(n_estimators=100).fit(Xtrain, Ytrain)Ypredict = rfc.predict(Xtest)return Ypredict
X = data.iloc[:, 1:]  # 原数据的原特征
Y = data['SeriousDlqin2yrs'] # 原数据的原标签
# print(X.shape)
y_pred = fill_missing_rf(X, Y, "MonthlyIncome") # 参数: 特征,标签,含有缺失值的列名# 确认我们的结果合理之后,我们就可以将数据覆盖了
data.loc[data.loc[:, "MonthlyIncome"].isnull(), "MonthlyIncome"] = y_pred  #补缺覆盖原数据
# print(y_pred)
# print(data.info())

万能  随机森林回归 补缺函数相关推荐

  1. predict函数 R_R包randomForest的随机森林回归模型以及对重要变量的选择

    R包randomForest的随机森林回归模型以及对重要变量的选择关于随机森林(random forest),前文"随机森林分类以及对重要变量的选择"中已经对其基本原理作了简单概括 ...

  2. 五、实例:在波士顿房价数据集上用随机森林回归填补缺失值

    在波士顿房价数据集上用随机森林回归填补缺失值 点击标题即可获取源代码和笔记 一.引入 我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值.面对缺失值,很多人选择的方式是直接将含有缺失 ...

  3. Python数据分析案例-利用多元线性回归与随机森林回归算法预测笔记本新品价格

    1.前言 目的: 本文通过多元线性回归与随机森林算法预测笔记本新品的发售价 工具: 语言:Python 3.8 软件:Jupyter Notebook 库:pandas.numpy.matplotli ...

  4. sklearn线性回归,支持向量机SVR回归,随机森林回归,神经网络回归参数解释及示例

    1.sklearn线性回归 线性回归,其中目标值 y 是输入变量 x 的线性组合. 在数学概念中,如果  是预测值. 在整个模块中,我们定义向量  作为 coef_ ,定义  作为 intercept ...

  5. MATLAB随机森林回归模型

    MATLAB随机森林回归模型: 调用matlab自带的TreeBagger.m T=textread('E:\datasets-orreview\discretized-regression\10bi ...

  6. 随机森林 html5,利用随机森林回归算法预测总有机碳含量

    受美国"页岩气革命"的影响,页岩气勘探受到了大量的关注( 现有利用测井曲线预测TOC的方法有4类:①利用单曲线或多曲线建立回归关系的预测方法,如利用密度曲线(DEN)预测TOC.利 ...

  7. 基于蜣螂算法改进的随机森林回归算法 - 附代码

    基于蜣螂算法改进的随机森林回归算法 - 附代码 文章目录 基于蜣螂算法改进的随机森林回归算法 - 附代码 1.数据集 2.RF模型 3.基于蜣螂算法优化的RF 4.测试结果 5.Matlab代码 6. ...

  8. sklearn机器学习:随机森林回归器RandomForestRegressor

    sklearn随机森林回归器类的格式 sklearn.ensemble.RandomForestRegressor (n_estimators='warn', criterion='mse', max ...

  9. Lesson 9.2 随机森林回归器的参数

    文章目录 一.弱分类器的结构 1. 分枝标准与特征重要性 2. 调节树结构来控制过拟合 二.弱分类器的数量 三.弱分类器训练的数据 1. 样本的随机抽样 2. 特征的随机抽样 3. 随机抽样的模式 四 ...

最新文章

  1. 跨国婚姻登记指南是怎样的一个流程呢??
  2. spring boot实现导出数据到excel
  3. 批量调整word表格根据窗口调整内容
  4. static 二次理解
  5. 程序员必备的10大健康装备!——我们要工作更要健康!
  6. java——获取一个应用程序运行的次数,如果超过5次,给出使用次数已到请注册的提示,并不要再运行程序
  7. python 系统时间24小时制_Python 日期和时间
  8. php pdo批量操作,PDO使用二维数组批量操作MYSQL数据库
  9. ios 替换数组中元素_leetcode169 数组中的主要元素
  10. 怎么在cmd中安装python库_cmd中安装python库时出现的错误
  11. Maven插件介绍:spring-boot-maven-plugin
  12. 专利电子申请那些事儿 |入股不亏 |专利代理 |CPC客户端
  13. Java类的三大特性
  14. excel向下填充公式快捷键
  15. Java 生成二维码名片(Springboot)
  16. 华三防火墙web端口_设置H3C SecPath F100 系列防火墙的web访问
  17. @程序员,你哄女朋友要是有写代码那么 6,你早就脱单了
  18. 第十一届蓝桥杯省赛B组(C/C++组)(第一场)
  19. nodejs 安装模块失败 解决方法
  20. 微信小程序之打开其他小程序(两个小程序必须在同一公众号下关联)wx.navigateToMiniProgram

热门文章

  1. 计算机组成原理——数据通路实例
  2. Oracle数据库Timestamp数据差值计算Sql语句
  3. MATLAB积分方法
  4. 综述:轻量级CNN架构设计
  5. sed命令详解及运用
  6. 电力系统仿真软件python_PySpice: 使用ngspice进行电路仿真分析-1:安装
  7. Python入门三:安装Pyqt5
  8. Android TV开发(—)开始电视应用
  9. 大型语言模型综述(二)
  10. ES6,ES7,ES8,ES9,ES10新特性一览