sklearn.preprocessing.Imputer

imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)

主要参数说明：

missing_values：缺失值，可以为整数或NaN(缺失值numpy.nan用字符串‘NaN’表示)，默认为NaN

strategy：替换策略，字符串，默认用均值‘mean’替换

①若为mean时，用特征列的均值替换

②若为median时，用特征列的中位数替换

③若为most_frequent时，用特征列的众数替换

axis：指定轴数，默认axis=0代表列，axis=1代表行

copy：设置为True代表不在原数据集上修改，设置为False时，就地修改，存在如下情况时，即使设置为False时，也不会就地修改

①X不是浮点值数组

②X是稀疏且missing_values=0

③axis=0且X为CRS矩阵

④axis=1且X为CSC矩阵

statistics_属性：axis设置为0时，每个特征的填充值数组，axis=1时，报没有该属性错误

举例，原X：

[['France' 44.0 72000.0]
['Spain' 27.0 48000.0]
['Germany' 30.0 54000.0]
['Spain' 38.0 61000.0]
['Germany' 40.0 nan]
['France' 35.0 58000.0]
['Spain' nan 52000.0]
['France' 48.0 79000.0]
['Germany' 50.0 83000.0]
['France' 37.0 67000.0]]

填充

imputer = Imputer(missing_values="NaN",strategy="mean",axis=0)
imputer = imputer.fit(X[ : ,1:3])

[['France' 44.0 72000.0]['Spain' 27.0 48000.0]['Germany' 30.0 54000.0]['Spain' 38.0 61000.0]['Germany' 40.0 nan]['France' 35.0 58000.0]['Spain' nan 52000.0]['France' 48.0 79000.0]['Germany' 50.0 83000.0]['France' 37.0 67000.0]]

转载于:https://www.cnblogs.com/1113127139aaa/p/10251044.html

sklearn.preprocessing.Imputer相关推荐

python怎么处理数据集的缺失值_python 对数据集的缺失值补全方法 sklearn.preprocessing.Imputer...
1.官方说明 sklearn.preprocessing.Imputer 用于对数据中的缺失值进行补全,支持"均值(mean)"."中值(median)".&q ...
python画猪头_python - sklearn.preprocessing.Imputer
在数据集中可能会出现为空的数据,我们不能删除有空数据的列,这样会对我们机器学习的结果造成影响,在data science中我们可以用NaN代替空值,但是在ML中必须要求数据为numeric.所以我们可 ...
jupyter notebook报错：ImportError: cannot import name ‘Imputer‘ from ‘sklearn.preprocessing‘解决方法
今天在处理丢失数据时,运行下面代码报错 from sklearn.preprocessing import Imputer imputer = Imputer(missing_values = &qu ...
sklearn.preprocessing下的数据标准化（scale、MinMaxScaler）
文章目录 scale MinMaxScaler scale from sklearn.preprocessing import scale Center to the mean and compone ...
sklearn.preprocessing.PolynomialFeatures
生成多项式和交互特征. 生成一个新的特征矩阵,该矩阵由度数小于或等于指定度数的特征的所有多项式组合组成.例如,如果输入样本是二维的且形式为 [a, b],则 2 次多项式特征为 [1, a, b, a ...
Python之 sklearn：sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略目录 sklearn.preprocessing中的Stand ...
Sklearn：sklearn.preprocessing之StandardScaler 的transform()函数和fit_transform()函数清晰讲解及其案例应用
Sklearn:sklearn.preprocessing之StandardScaler 的transform()函数和fit_transform()函数清晰讲解及其案例应用目录 sklearn.p ...
sklearn：sklearn.preprocessing的MinMaxScaler简介、使用方法之详细攻略
sklearn:sklearn.preprocessing的MinMaxScaler简介.使用方法之详细攻略目录 MinMaxScaler简介 MinMaxScaler函数解释 MinMaxScal ...
成功解决sklearn\preprocessing\label.py:151: DeprecationWarning: The truth value of an empty array is amb
成功解决sklearn\preprocessing\label.py:151: DeprecationWarning: The truth value of an empty array is amb ...

sklearn.preprocessing.Imputer

sklearn.preprocessing.Imputer相关推荐

最新文章

热门文章