1、官方说明

sklearn.preprocessing.Imputer 用于对数据中的缺失值进行补全,支持“均值(mean)”、“中值(median)”、“众数(most_frequant,也就是mode)”三种数值替换数据集中的缺失值(numpy.nan、NaN等)

https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.Imputer.html

参数:

(1)missing_values:可选参数,整数或“NaN”,默认为“NaN”,对于编码为 np.nan 的缺失值,使用字符值"NaN"

(2)strategy:可选参数,替换的目标数值,支持“均值(mean)”、“中值(median)”、“众数(most_frequant,也就是mode),默认为平均值

(3)axis:可选参数,整数,支持“沿列(0)或沿行(1)计算 strategy 中使用的替换值”,默认为

(4)verbose:可选参数,整数,默认为 0

(5)copy:可选参数,布尔值,默认为 True

方法:

(1)fit(self, X[,y]):在数据集上拟合插值器

(2)fit_transform(self, X[,y]):拟合数据,并转换

(3)get_params(self[,deep]):获得该插值器的参数

(4)set_params(self,\*\*params):设置该插值器的参数

(5)transform(self,X):插值数据集 X 中的缺失值

2、实例

from sklearn.preprocessing import Imputer

import numpy as np

imputer = Imputer(missing_values='NaN', strategy="mean", axis=0)

duty_data = [[1,2,np.nan],[4,5,6],[7,np.nan,9],[10,11,12],[np.nan,14,15]]

imputed_data = imputer.fit_transform(duty_data)

print(imputed_data)

[[ 1. 2. 10.5]

[ 4. 5. 6. ]

[ 7. 8. 9. ]

[10. 11. 12. ]

[ 5.5 14. 15. ]]

python怎么处理数据集的缺失值_python 对数据集的缺失值补全方法 sklearn.preprocessing.Imputer...相关推荐

  1. 数据缺失值补全方法 sklearn.impute.SimpleImputer 使用实例

    一.环境 Python 3.7.3(Anaconda 3) sklearn.version'0.20.3' 二.方法 对数据中的缺失值进行插补 官方说明:https://scikit-learn.or ...

  2. python画猪头_python - sklearn.preprocessing.Imputer

    在数据集中可能会出现为空的数据,我们不能删除有空数据的列,这样会对我们机器学习的结果造成影响,在data science中我们可以用NaN代替空值,但是在ML中必须要求数据为numeric.所以我们可 ...

  3. python tab键自动补全_设置python中TAB键自动补全方法

    设置python中TAB键自动补全方法 一.创建自动补全脚本如下: vi /tmp/python/tab.py #!/usr/bin/python # python tab file import s ...

  4. html标签 补全方法 python,Python Beautiful Soup学习之HTML标签补全功能

    Beautiful Soup是一个非常流行的Python模块.该模块可以解析网页,并提供定位内容的便捷接口. 使用下面两个命令安装: pip install beautifulsoup4或者 sudo ...

  5. python处理csv文件缺失值_python处理数据中缺失值

    (1)直接删除法(当缺失值个数只占整体很小一部分时) 在采用删除法处理缺失值时,需要首先检测样本总体中确实值得的个数.python中统计缺失值的方法为: import numpy as np impo ...

  6. python批量下载网页文件夹_Python抓取网页批量下载文件方法初探(正则表达式+BeautifulSoup) (转)...

    最近两周都在学习Python抓取网页方法,任务是批量下载网站上的文件.对于一个刚刚入门python的人来说,在很多细节上都有需要注意的地方,以下就分享一下我在初学python过程中遇到的问题及解决方法 ...

  7. python tab键自动补全怎么用_python添加tab键自动补全功能

    默认python是没有tab键补全功能的: >>> import tab Traceback (most recent call last): File "", ...

  8. python如何输出16进制_python 以16进制打印输出的方法

    python 以16进制打印输出的方法 打印整数16进制 num=10 print('%#x'%num) 打印字符串中的16进制 arr='12342535' for i in arr: print( ...

  9. python代码命令行tab补齐_超简python命令行tab一键补全方法

    玩转Linux的朋友们,还在为python默认的无tab补全而烦恼吗? 下面是在下的一个解决方法,希望能帮助到新入学python的学者. 第一步:编写一键补全脚本tab.py [root@localh ...

最新文章

  1. php 加载一个文件路径_PHP文件加载过程
  2. 备忘录:CISCO router ENABLE crack
  3. 笔记-信息化与系统集成技术-云计算操作系统的主要关键技术
  4. 【转】volatile关键字。编译器不优化,多线程会改。防止随时变动的
  5. boost::hana::when用法的测试程序
  6. oci mysql_Oracle常用的OCI函数
  7. mysql数据库之单表查询
  8. Eclipse javax.servlet.jsp.PageContext cannot be resolved to a type 错误解决办法
  9. node.js 初体验(转载)
  10. 开源.NET项目 CSS、JS资源优化类库及工具
  11. CMake构建_增加编译选项(debugrelease)
  12. 应用程序窗口小部件App Widgets
  13. 基于cpolar内网穿透工具ssh远程访问linux服务器
  14. Python网络爬虫(2)- 爬虫翻译程序-含有道、金山、百度翻译
  15. 给UILabel中的文字加删除线
  16. 脚本小子_Lua函数
  17. Windows2000、2003浏览器无法上网、无法联网
  18. Vue处理后台返回List集合带有Object对象的数据
  19. 直播数据采集的10个经典方法
  20. 赛效:电脑在线美化图片怎么弄?

热门文章

  1. 现在大厂面试,也太太太太太难了吧!
  2. 为什么别人年底购物,同学们年底考证?
  3. 腾讯云开发者大会 | 腾讯云大学首次与业界顶尖厂商合作的线上学习专区重磅发布...
  4. 为何优秀如程序员,也会构建 Bug 满格的软件?
  5. 今年的 618,你清空的不仅仅是购物车,还有焦虑和迷茫
  6. @程序员,如何轻松实现数据可视化?
  7. 滴滴顺风车春运暂不上线;锤子员工被强制离职;苹果聘请三星高管 | 极客头条...
  8. 微博回应裁员;罗永浩股权被冻结;“隐形贫困”人群最爱苹果 | 极客头条
  9. 程序员如何 Get 分布式锁的正确姿势?| 技术头条
  10. 为什么微型芯片是机器学习的命门?