前言
目前常用的SimpleImputer补全缺失值的策略有平均值,最大值,中值等,采用的方式transform, fit_transform,fill_value

导入包

from sklearn.impute import SimpleImputer
import numpy as np

transform(X)

#使用数据训练imp模型,按照原数据的内容对新数据的确实值进行补充
X = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
X1 = np.array([[1, 2, np.nan],[4, np.nan, 6],[np.nan, 8, 9]])
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
imp.fit(X)
print(imp.transform(X1))

fit_transform(X)

#根据缺失值的列剩余值的特点对缺失值进行补充,这里采用的是平均值
X1 = np.array([[1, 2, np.nan],[4, np.nan, 6],[np.nan, 8, 9]])
imp = SimpleImputer(missing_values=np.nan, strategy='mean')
print(imp.fit_transform(X1))

fill_value(x)

#将数据中某个值修改为指定值
X = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])imp = SimpleImputer(missing_values=1, strategy='constant', fill_value=199)
print(imp.fit_transform(X))

get_params()

专门用来查看SimpleImputer里面的参数情况

参考文献
https://blog.csdn.net/qq_43965708/article/details/115625768

(14)Python_SimpleImputer缺失值处理相关推荐

  1. Topic 17. 临床预测模型之缺失值识别及可视化

    桓峰基因公众号推出基于R语言临床预测模型构建方法教程并配有视频在线教程,目前整理出来的教程目录如下: Topic 1. _临床_标志物生信分析常规思路 Topic 2. 生存分析之 Kaplan-Me ...

  2. python怎么重新开始_人人都是数据科学家从新开始用Python学习数据科学的完整教程P3...

    上周一P2篇大家熟悉一些有用的库来学习Python.P3篇让我们学习如何用Pandas在Python中进行探索型数据分析. 为了进一步探索我们的数据,让我向您介绍另一种动物(好像Python还不够!) ...

  3. 随机森林做特征重要性排序和特征选择

    随机森林模型介绍: 随机森林模型不仅在预测问题上有着广泛的应用,在特征选择中也有常用. 随机森林是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,更令人惊奇的是它在分类和 ...

  4. pandas 基本使用

    介绍 是什么 pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的. 关于NumPy,参考这里. 主要功能 具备对齐功能的数据结构DataFrame.Series 集成时间序 ...

  5. 互联网金融借款违约预测

    本项目主要关注实现,数据分析.特征工程涉及较少,而且数据量较大,并没有进行多次调参. 另外,由于数据的分类极其不平衡,本项目尝试使用SMOTE增加偏少类的样本数量. %matplotlib inlin ...

  6. python5.0完整版

    想要这份详细的教程的可以留言,完整视频版,带课件和课程里提到的软件. 1. python5.0 1 1.1. 1-Python基础语法v5.0 1 1.1.1. 第1节 开发环境安装介绍 1 1.1. ...

  7. sas proc sql 基础入门 (原创作品,转载请注明出处 )

    /*结构*/ /* PROC SQL;  SELECT column(s)  FROM table(s) | view(s)  WHERE expression  GROUP BY column(s) ...

  8. 零基础:数据分析的完整Python教程

    目录 1.用于数据分析的Python基础(略) 为什么要学习Python进行数据分析? Python 2.7 v /秒3.4 如何安装Python? 在Python中运行一些简单的程序 2.Pytho ...

  9. Excel电商女装评价分析

    电商女装评价分析 数据来源:https://www.kesci.com/home/dataset/5aab7e09afaabd5e93e4df30/project 项目背景 基于某电商女性服装评论数据 ...

  10. 【deepctr】学习入门笔记01

    目录 了解 准备工作 1.下载包 2.导入pycharm 3.导入所需包 代码(例:run_classification_criteo.py) 导入所需包 数据预处理 1.对稀疏特征进行标签编码,对稠 ...

最新文章

  1. RocketMQ 介绍 msgId生成算法
  2. JVM调优总结(五)-调优方法(转载)
  3. python3精要(30)-深入列表解析
  4. Tomcat的安装和运行
  5. mp4v2 写mp4 java_使用mp4v2将H264+AAC合成mp4文件
  6. oracle sql between and 范围,oracle between and 边界有关问题
  7. Android学习笔记(十一)——从意图返回结果
  8. 2021-09-02最大矩形
  9. 程序员一毕业就年薪 110 万竟然是靠……
  10. DVWA 靶场通关教程
  11. 老司机的HCIE战报
  12. java excel 批注_Java 添加、读取和删除 Excel 批注
  13. 武汉市计算机学校报名条件,自主招生报名条件
  14. 搞个大点的 某团购App mtgsig
  15. 求一个只包含0、1的矩阵中只包含1的最大子矩阵大小
  16. Go语言开发工具 LiteIDE X27 发布
  17. 恒辉信达全数据AI管控云平台动态运维管控
  18. C语言—飞机大战小游戏
  19. checkbox jq 监听_「checkbox 选中事件」jquery checkbox 选中、改变状态、change 和 click 事件 - seo实验室...
  20. GeneXus学习记录

热门文章

  1. Centos查看进程命令
  2. 智能驾驶的深度神经网络模型嵌入式部署的线路思考
  3. 3月24 matlab函数polyfit(x,y,n)分析
  4. 2月20日 梯度下降、三种方式、三种超参数学习率冲量衰减因子、应用举例
  5. HanLP1.5.2 -python使用介绍
  6. 数据-第17课-栈课后练习
  7. 软件工程第二次作业中第一个作业
  8. DUBBO服务启动过程
  9. [转载]AWS使用小记之EC2(Elastic Compute Cloud)
  10. linux 下网站压力测试工具webbench