(14)Python_SimpleImputer缺失值处理
前言
目前常用的SimpleImputer补全缺失值的策略有平均值,最大值,中值等,采用的方式transform, fit_transform,fill_value
导入包
from sklearn.impute import SimpleImputer
import numpy as np
transform(X)
#使用数据训练imp模型,按照原数据的内容对新数据的确实值进行补充
X = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
X1 = np.array([[1, 2, np.nan],[4, np.nan, 6],[np.nan, 8, 9]])
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
imp.fit(X)
print(imp.transform(X1))
fit_transform(X)
#根据缺失值的列剩余值的特点对缺失值进行补充,这里采用的是平均值
X1 = np.array([[1, 2, np.nan],[4, np.nan, 6],[np.nan, 8, 9]])
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
print(imp.fit_transform(X1))
fill_value(x)
#将数据中某个值修改为指定值
X = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])imp = SimpleImputer(missing_values=1, strategy='constant', fill_value=199)
print(imp.fit_transform(X))
get_params()
专门用来查看SimpleImputer里面的参数情况
参考文献
https://blog.csdn.net/qq_43965708/article/details/115625768
(14)Python_SimpleImputer缺失值处理相关推荐
- Topic 17. 临床预测模型之缺失值识别及可视化
桓峰基因公众号推出基于R语言临床预测模型构建方法教程并配有视频在线教程,目前整理出来的教程目录如下: Topic 1. _临床_标志物生信分析常规思路 Topic 2. 生存分析之 Kaplan-Me ...
- python怎么重新开始_人人都是数据科学家从新开始用Python学习数据科学的完整教程P3...
上周一P2篇大家熟悉一些有用的库来学习Python.P3篇让我们学习如何用Pandas在Python中进行探索型数据分析. 为了进一步探索我们的数据,让我向您介绍另一种动物(好像Python还不够!) ...
- 随机森林做特征重要性排序和特征选择
随机森林模型介绍: 随机森林模型不仅在预测问题上有着广泛的应用,在特征选择中也有常用. 随机森林是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和 ...
- pandas 基本使用
介绍 是什么 pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的. 关于NumPy,参考这里. 主要功能 具备对齐功能的数据结构DataFrame.Series 集成时间序 ...
- 互联网金融借款违约预测
本项目主要关注实现,数据分析.特征工程涉及较少,而且数据量较大,并没有进行多次调参. 另外,由于数据的分类极其不平衡,本项目尝试使用SMOTE增加偏少类的样本数量. %matplotlib inlin ...
- python5.0完整版
想要这份详细的教程的可以留言,完整视频版,带课件和课程里提到的软件. 1. python5.0 1 1.1. 1-Python基础语法v5.0 1 1.1.1. 第1节 开发环境安装介绍 1 1.1. ...
- sas proc sql 基础入门 (原创作品,转载请注明出处 )
/*结构*/ /* PROC SQL; SELECT column(s) FROM table(s) | view(s) WHERE expression GROUP BY column(s) ...
- 零基础:数据分析的完整Python教程
目录 1.用于数据分析的Python基础(略) 为什么要学习Python进行数据分析? Python 2.7 v /秒3.4 如何安装Python? 在Python中运行一些简单的程序 2.Pytho ...
- Excel电商女装评价分析
电商女装评价分析 数据来源:https://www.kesci.com/home/dataset/5aab7e09afaabd5e93e4df30/project 项目背景 基于某电商女性服装评论数据 ...
- 【deepctr】学习入门笔记01
目录 了解 准备工作 1.下载包 2.导入pycharm 3.导入所需包 代码(例:run_classification_criteo.py) 导入所需包 数据预处理 1.对稀疏特征进行标签编码,对稠 ...
最新文章
- RocketMQ 介绍 msgId生成算法
- JVM调优总结(五)-调优方法(转载)
- python3精要(30)-深入列表解析
- Tomcat的安装和运行
- mp4v2 写mp4 java_使用mp4v2将H264+AAC合成mp4文件
- oracle sql between and 范围,oracle between and 边界有关问题
- Android学习笔记(十一)——从意图返回结果
- 2021-09-02最大矩形
- 程序员一毕业就年薪 110 万竟然是靠……
- DVWA 靶场通关教程
- 老司机的HCIE战报
- java excel 批注_Java 添加、读取和删除 Excel 批注
- 武汉市计算机学校报名条件,自主招生报名条件
- 搞个大点的 某团购App mtgsig
- 求一个只包含0、1的矩阵中只包含1的最大子矩阵大小
- Go语言开发工具 LiteIDE X27 发布
- 恒辉信达全数据AI管控云平台动态运维管控
- C语言—飞机大战小游戏
- checkbox jq 监听_「checkbox 选中事件」jquery checkbox 选中、改变状态、change 和 click 事件 - seo实验室...
- GeneXus学习记录