万能 随机森林回归 补缺函数
#####todo 只对一列数据含有缺失,另外的数据都不含缺失值的数据有效def fill_missing_rf(X, Y, to_fill):"""使用随机森林填补一个特征的缺失值的函数:param X: 要填补的特征矩阵:param Y: 完整的,没有缺失值的标签:param to_fill: 字符串,要填补的那一列的名称:return:"""# 构建我们的新的特征矩阵和标签df = X.copy()fill = df.loc[:, to_fill]df = pd.concat([df.loc[:,df.columns != to_fill], pd.DataFrame(Y)], axis=1)# 找出训练集和测试集Ytrain = fill[fill.notnull()]Ytest = fill[fill.isnull()]Xtrain = df.iloc[Ytrain.index, :]Xtest = df.iloc[Ytest.index, :]# 用随机森林回归填补缺失值from sklearn.ensemble import RandomForestRegressor as rfcrfc = rfc(n_estimators=100).fit(Xtrain, Ytrain)Ypredict = rfc.predict(Xtest)return Ypredict
X = data.iloc[:, 1:] # 原数据的原特征 Y = data['SeriousDlqin2yrs'] # 原数据的原标签 # print(X.shape) y_pred = fill_missing_rf(X, Y, "MonthlyIncome") # 参数: 特征,标签,含有缺失值的列名# 确认我们的结果合理之后,我们就可以将数据覆盖了 data.loc[data.loc[:, "MonthlyIncome"].isnull(), "MonthlyIncome"] = y_pred #补缺覆盖原数据 # print(y_pred) # print(data.info())
万能 随机森林回归 补缺函数相关推荐
- predict函数 R_R包randomForest的随机森林回归模型以及对重要变量的选择
R包randomForest的随机森林回归模型以及对重要变量的选择关于随机森林(random forest),前文"随机森林分类以及对重要变量的选择"中已经对其基本原理作了简单概括 ...
- 五、实例:在波士顿房价数据集上用随机森林回归填补缺失值
在波士顿房价数据集上用随机森林回归填补缺失值 点击标题即可获取源代码和笔记 一.引入 我们从现实中收集的数据,几乎不可能是完美无缺的,往往都会有一些缺失值.面对缺失值,很多人选择的方式是直接将含有缺失 ...
- Python数据分析案例-利用多元线性回归与随机森林回归算法预测笔记本新品价格
1.前言 目的: 本文通过多元线性回归与随机森林算法预测笔记本新品的发售价 工具: 语言:Python 3.8 软件:Jupyter Notebook 库:pandas.numpy.matplotli ...
- sklearn线性回归,支持向量机SVR回归,随机森林回归,神经网络回归参数解释及示例
1.sklearn线性回归 线性回归,其中目标值 y 是输入变量 x 的线性组合. 在数学概念中,如果 是预测值. 在整个模块中,我们定义向量 作为 coef_ ,定义 作为 intercept ...
- MATLAB随机森林回归模型
MATLAB随机森林回归模型: 调用matlab自带的TreeBagger.m T=textread('E:\datasets-orreview\discretized-regression\10bi ...
- 随机森林 html5,利用随机森林回归算法预测总有机碳含量
受美国"页岩气革命"的影响,页岩气勘探受到了大量的关注( 现有利用测井曲线预测TOC的方法有4类:①利用单曲线或多曲线建立回归关系的预测方法,如利用密度曲线(DEN)预测TOC.利 ...
- 基于蜣螂算法改进的随机森林回归算法 - 附代码
基于蜣螂算法改进的随机森林回归算法 - 附代码 文章目录 基于蜣螂算法改进的随机森林回归算法 - 附代码 1.数据集 2.RF模型 3.基于蜣螂算法优化的RF 4.测试结果 5.Matlab代码 6. ...
- sklearn机器学习:随机森林回归器RandomForestRegressor
sklearn随机森林回归器类的格式 sklearn.ensemble.RandomForestRegressor (n_estimators='warn', criterion='mse', max ...
- Lesson 9.2 随机森林回归器的参数
文章目录 一.弱分类器的结构 1. 分枝标准与特征重要性 2. 调节树结构来控制过拟合 二.弱分类器的数量 三.弱分类器训练的数据 1. 样本的随机抽样 2. 特征的随机抽样 3. 随机抽样的模式 四 ...
最新文章
- 跨国婚姻登记指南是怎样的一个流程呢??
- spring boot实现导出数据到excel
- 批量调整word表格根据窗口调整内容
- static 二次理解
- 程序员必备的10大健康装备!——我们要工作更要健康!
- java——获取一个应用程序运行的次数,如果超过5次,给出使用次数已到请注册的提示,并不要再运行程序
- python 系统时间24小时制_Python 日期和时间
- php pdo批量操作,PDO使用二维数组批量操作MYSQL数据库
- ios 替换数组中元素_leetcode169 数组中的主要元素
- 怎么在cmd中安装python库_cmd中安装python库时出现的错误
- Maven插件介绍:spring-boot-maven-plugin
- 专利电子申请那些事儿 |入股不亏 |专利代理 |CPC客户端
- Java类的三大特性
- excel向下填充公式快捷键
- Java 生成二维码名片(Springboot)
- 华三防火墙web端口_设置H3C SecPath F100 系列防火墙的web访问
- @程序员,你哄女朋友要是有写代码那么 6,你早就脱单了
- 第十一届蓝桥杯省赛B组(C/C++组)(第一场)
- nodejs 安装模块失败 解决方法
- 微信小程序之打开其他小程序(两个小程序必须在同一公众号下关联)wx.navigateToMiniProgram