imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)

主要参数说明:

missing_values:缺失值,可以为整数或NaN(缺失值numpy.nan用字符串‘NaN’表示),默认为NaN

strategy:替换策略,字符串,默认用均值‘mean’替换

①若为mean时,用特征列的均值替换

②若为median时,用特征列的中位数替换

③若为most_frequent时,用特征列的众数替换

axis:指定轴数,默认axis=0代表列,axis=1代表行

copy:设置为True代表不在原数据集上修改,设置为False时,就地修改,存在如下情况时,即使设置为False时,也不会就地修改

①X不是浮点值数组

②X是稀疏且missing_values=0

③axis=0且X为CRS矩阵

④axis=1且X为CSC矩阵

statistics_属性:axis设置为0时,每个特征的填充值数组,axis=1时,报没有该属性错误

举例,原X:

[['France' 44.0 72000.0]
['Spain' 27.0 48000.0]
['Germany' 30.0 54000.0]
['Spain' 38.0 61000.0]
['Germany' 40.0 nan]
['France' 35.0 58000.0]
['Spain' nan 52000.0]
['France' 48.0 79000.0]
['Germany' 50.0 83000.0]
['France' 37.0 67000.0]]

  

填充

imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)
imputer = imputer.fit(X[ : ,1:3])

[['France' 44.0 72000.0]['Spain' 27.0 48000.0]['Germany' 30.0 54000.0]['Spain' 38.0 61000.0]['Germany' 40.0 nan]['France' 35.0 58000.0]['Spain' nan 52000.0]['France' 48.0 79000.0]['Germany' 50.0 83000.0]['France' 37.0 67000.0]]

  

转载于:https://www.cnblogs.com/1113127139aaa/p/10251044.html

sklearn.preprocessing.Imputer相关推荐

  1. python怎么处理数据集的缺失值_python 对数据集的缺失值补全方法 sklearn.preprocessing.Imputer...

    1.官方说明 sklearn.preprocessing.Imputer 用于对数据中的缺失值进行补全,支持"均值(mean)"."中值(median)".&q ...

  2. python画猪头_python - sklearn.preprocessing.Imputer

    在数据集中可能会出现为空的数据,我们不能删除有空数据的列,这样会对我们机器学习的结果造成影响,在data science中我们可以用NaN代替空值,但是在ML中必须要求数据为numeric.所以我们可 ...

  3. jupyter notebook报错:ImportError: cannot import name ‘Imputer‘ from ‘sklearn.preprocessing‘解决方法

    今天在处理丢失数据时,运行下面代码报错 from sklearn.preprocessing import Imputer imputer = Imputer(missing_values = &qu ...

  4. sklearn.preprocessing下的数据标准化(scale、MinMaxScaler)

    文章目录 scale MinMaxScaler scale from sklearn.preprocessing import scale Center to the mean and compone ...

  5. sklearn.preprocessing.PolynomialFeatures

    生成多项式和交互特征. 生成一个新的特征矩阵,该矩阵由度数小于或等于指定度数的特征的所有多项式组合组成.例如,如果输入样本是二维的且形式为 [a, b],则 2 次多项式特征为 [1, a, b, a ...

  6. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  7. Sklearn:sklearn.preprocessing之StandardScaler 的transform()函数和fit_transform()函数清晰讲解及其案例应用

    Sklearn:sklearn.preprocessing之StandardScaler 的transform()函数和fit_transform()函数清晰讲解及其案例应用 目录 sklearn.p ...

  8. sklearn:sklearn.preprocessing的MinMaxScaler简介、使用方法之详细攻略

    sklearn:sklearn.preprocessing的MinMaxScaler简介.使用方法之详细攻略 目录 MinMaxScaler简介 MinMaxScaler函数解释 MinMaxScal ...

  9. 成功解决sklearn\preprocessing\label.py:151: DeprecationWarning: The truth value of an empty array is amb

    成功解决sklearn\preprocessing\label.py:151: DeprecationWarning: The truth value of an empty array is amb ...

最新文章

  1. 关于我的Android 博客
  2. 160个Crackme004
  3. 如何成为android开发工程师,android开发工程师薪资 如何成为一名合格的android开发工程师?...
  4. nacos 公共_Nacos数据模型
  5. java treemap_Java TreeMap keySet()方法与示例
  6. oracle静默文件建库,【配置上线】Oracle静默建库 for 11g
  7. 我的世界暮色森林java下载_我的世界暮色森林mod1.7.2下载-暮色森林整合包下载...
  8. 小米8大幅降价促销 性价比十足!
  9. cocos2d之z轴位置示例
  10. python反序列化漏洞_【事件分析】No.10 影响深远的反序列化漏洞
  11. POJ P1185 炮兵阵地 【状压dp】
  12. React中的三种类型组件介绍
  13. stolz定理考研能用吗_这些高数定理,2021二战考研租房的你千万别记混
  14. 快门光圈感光度口诀_摄影:一张图让你明白什么叫光圈、快门、感光度、景深、ISO。...
  15. 解决移动端特别是ios滑动卡屏 滑动卡顿
  16. 若依ruoyi-vue总结
  17. 视频流PS打包方式详解
  18. 广义表的长度和深度计算
  19. 基于MFC的五子棋设计与实现
  20. twitter推特全量用户收集与发文采集

热门文章

  1. DiskGenius无损调整C盘容量方法
  2. 给notepad++添加右键菜单
  3. 使用 .NET 平台,如何玩转 Universal Windows 应用? 1
  4. C# 进程间通信(共享内存)
  5. 移动支付到底有多美?
  6. DEDECMS使用SQL语句批量删除文章
  7. [笔记].关于使用JLINK的三线SWD模式调试NUC1xx的一点粗浅认识
  8. oracle安装过程中内核参数详解
  9. Libiconv裁剪
  10. java jdk 加密_jdk实现常见的加密算法