sklearn.preprocessing.Imputer
imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)
主要参数说明:
missing_values:缺失值,可以为整数或NaN(缺失值numpy.nan用字符串‘NaN’表示),默认为NaN
strategy:替换策略,字符串,默认用均值‘mean’替换
①若为mean时,用特征列的均值替换
②若为median时,用特征列的中位数替换
③若为most_frequent时,用特征列的众数替换
axis:指定轴数,默认axis=0代表列,axis=1代表行
copy:设置为True代表不在原数据集上修改,设置为False时,就地修改,存在如下情况时,即使设置为False时,也不会就地修改
①X不是浮点值数组
②X是稀疏且missing_values=0
③axis=0且X为CRS矩阵
④axis=1且X为CSC矩阵
statistics_属性:axis设置为0时,每个特征的填充值数组,axis=1时,报没有该属性错误
举例,原X:
[['France' 44.0 72000.0]
['Spain' 27.0 48000.0]
['Germany' 30.0 54000.0]
['Spain' 38.0 61000.0]
['Germany' 40.0 nan]
['France' 35.0 58000.0]
['Spain' nan 52000.0]
['France' 48.0 79000.0]
['Germany' 50.0 83000.0]
['France' 37.0 67000.0]]
填充
imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)
imputer = imputer.fit(X[ : ,1:3])
[['France' 44.0 72000.0]['Spain' 27.0 48000.0]['Germany' 30.0 54000.0]['Spain' 38.0 61000.0]['Germany' 40.0 nan]['France' 35.0 58000.0]['Spain' nan 52000.0]['France' 48.0 79000.0]['Germany' 50.0 83000.0]['France' 37.0 67000.0]]
转载于:https://www.cnblogs.com/1113127139aaa/p/10251044.html
sklearn.preprocessing.Imputer相关推荐
- python怎么处理数据集的缺失值_python 对数据集的缺失值补全方法 sklearn.preprocessing.Imputer...
1.官方说明 sklearn.preprocessing.Imputer 用于对数据中的缺失值进行补全,支持"均值(mean)"."中值(median)".&q ...
- python画猪头_python - sklearn.preprocessing.Imputer
在数据集中可能会出现为空的数据,我们不能删除有空数据的列,这样会对我们机器学习的结果造成影响,在data science中我们可以用NaN代替空值,但是在ML中必须要求数据为numeric.所以我们可 ...
- jupyter notebook报错:ImportError: cannot import name ‘Imputer‘ from ‘sklearn.preprocessing‘解决方法
今天在处理丢失数据时,运行下面代码报错 from sklearn.preprocessing import Imputer imputer = Imputer(missing_values = &qu ...
- sklearn.preprocessing下的数据标准化(scale、MinMaxScaler)
文章目录 scale MinMaxScaler scale from sklearn.preprocessing import scale Center to the mean and compone ...
- sklearn.preprocessing.PolynomialFeatures
生成多项式和交互特征. 生成一个新的特征矩阵,该矩阵由度数小于或等于指定度数的特征的所有多项式组合组成.例如,如果输入样本是二维的且形式为 [a, b],则 2 次多项式特征为 [1, a, b, a ...
- Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...
- Sklearn:sklearn.preprocessing之StandardScaler 的transform()函数和fit_transform()函数清晰讲解及其案例应用
Sklearn:sklearn.preprocessing之StandardScaler 的transform()函数和fit_transform()函数清晰讲解及其案例应用 目录 sklearn.p ...
- sklearn:sklearn.preprocessing的MinMaxScaler简介、使用方法之详细攻略
sklearn:sklearn.preprocessing的MinMaxScaler简介.使用方法之详细攻略 目录 MinMaxScaler简介 MinMaxScaler函数解释 MinMaxScal ...
- 成功解决sklearn\preprocessing\label.py:151: DeprecationWarning: The truth value of an empty array is amb
成功解决sklearn\preprocessing\label.py:151: DeprecationWarning: The truth value of an empty array is amb ...
最新文章
- 关于我的Android 博客
- 160个Crackme004
- 如何成为android开发工程师,android开发工程师薪资 如何成为一名合格的android开发工程师?...
- nacos 公共_Nacos数据模型
- java treemap_Java TreeMap keySet()方法与示例
- oracle静默文件建库,【配置上线】Oracle静默建库 for 11g
- 我的世界暮色森林java下载_我的世界暮色森林mod1.7.2下载-暮色森林整合包下载...
- 小米8大幅降价促销 性价比十足!
- cocos2d之z轴位置示例
- python反序列化漏洞_【事件分析】No.10 影响深远的反序列化漏洞
- POJ P1185 炮兵阵地 【状压dp】
- React中的三种类型组件介绍
- stolz定理考研能用吗_这些高数定理,2021二战考研租房的你千万别记混
- 快门光圈感光度口诀_摄影:一张图让你明白什么叫光圈、快门、感光度、景深、ISO。...
- 解决移动端特别是ios滑动卡屏 滑动卡顿
- 若依ruoyi-vue总结
- 视频流PS打包方式详解
- 广义表的长度和深度计算
- 基于MFC的五子棋设计与实现
- twitter推特全量用户收集与发文采集