python怎么处理数据集的缺失值_python 对数据集的缺失值补全方法 sklearn.preprocessing.Imputer...
1、官方说明
sklearn.preprocessing.Imputer 用于对数据中的缺失值进行补全,支持“均值(mean)”、“中值(median)”、“众数(most_frequant,也就是mode)”三种数值替换数据集中的缺失值(numpy.nan、NaN等)
https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.Imputer.html
参数:
(1)missing_values:可选参数,整数或“NaN”,默认为“NaN”,对于编码为 np.nan 的缺失值,使用字符值"NaN"
(2)strategy:可选参数,替换的目标数值,支持“均值(mean)”、“中值(median)”、“众数(most_frequant,也就是mode),默认为平均值
(3)axis:可选参数,整数,支持“沿列(0)或沿行(1)计算 strategy 中使用的替换值”,默认为
(4)verbose:可选参数,整数,默认为 0
(5)copy:可选参数,布尔值,默认为 True
方法:
(1)fit(self, X[,y]):在数据集上拟合插值器
(2)fit_transform(self, X[,y]):拟合数据,并转换
(3)get_params(self[,deep]):获得该插值器的参数
(4)set_params(self,\*\*params):设置该插值器的参数
(5)transform(self,X):插值数据集 X 中的缺失值
2、实例
from sklearn.preprocessing import Imputer
import numpy as np
imputer = Imputer(missing_values='NaN', strategy="mean", axis=0)
duty_data = [[1,2,np.nan],[4,5,6],[7,np.nan,9],[10,11,12],[np.nan,14,15]]
imputed_data = imputer.fit_transform(duty_data)
print(imputed_data)
[[ 1. 2. 10.5]
[ 4. 5. 6. ]
[ 7. 8. 9. ]
[10. 11. 12. ]
[ 5.5 14. 15. ]]
python怎么处理数据集的缺失值_python 对数据集的缺失值补全方法 sklearn.preprocessing.Imputer...相关推荐
- 数据缺失值补全方法 sklearn.impute.SimpleImputer 使用实例
一.环境 Python 3.7.3(Anaconda 3) sklearn.version'0.20.3' 二.方法 对数据中的缺失值进行插补 官方说明:https://scikit-learn.or ...
- python画猪头_python - sklearn.preprocessing.Imputer
在数据集中可能会出现为空的数据,我们不能删除有空数据的列,这样会对我们机器学习的结果造成影响,在data science中我们可以用NaN代替空值,但是在ML中必须要求数据为numeric.所以我们可 ...
- python tab键自动补全_设置python中TAB键自动补全方法
设置python中TAB键自动补全方法 一.创建自动补全脚本如下: vi /tmp/python/tab.py #!/usr/bin/python # python tab file import s ...
- html标签 补全方法 python,Python Beautiful Soup学习之HTML标签补全功能
Beautiful Soup是一个非常流行的Python模块.该模块可以解析网页,并提供定位内容的便捷接口. 使用下面两个命令安装: pip install beautifulsoup4或者 sudo ...
- python处理csv文件缺失值_python处理数据中缺失值
(1)直接删除法(当缺失值个数只占整体很小一部分时) 在采用删除法处理缺失值时,需要首先检测样本总体中确实值得的个数.python中统计缺失值的方法为: import numpy as np impo ...
- python批量下载网页文件夹_Python抓取网页批量下载文件方法初探(正则表达式+BeautifulSoup) (转)...
最近两周都在学习Python抓取网页方法,任务是批量下载网站上的文件.对于一个刚刚入门python的人来说,在很多细节上都有需要注意的地方,以下就分享一下我在初学python过程中遇到的问题及解决方法 ...
- python tab键自动补全怎么用_python添加tab键自动补全功能
默认python是没有tab键补全功能的: >>> import tab Traceback (most recent call last): File "", ...
- python如何输出16进制_python 以16进制打印输出的方法
python 以16进制打印输出的方法 打印整数16进制 num=10 print('%#x'%num) 打印字符串中的16进制 arr='12342535' for i in arr: print( ...
- python代码命令行tab补齐_超简python命令行tab一键补全方法
玩转Linux的朋友们,还在为python默认的无tab补全而烦恼吗? 下面是在下的一个解决方法,希望能帮助到新入学python的学者. 第一步:编写一键补全脚本tab.py [root@localh ...
最新文章
- php 加载一个文件路径_PHP文件加载过程
- 备忘录:CISCO router ENABLE crack
- 笔记-信息化与系统集成技术-云计算操作系统的主要关键技术
- 【转】volatile关键字。编译器不优化,多线程会改。防止随时变动的
- boost::hana::when用法的测试程序
- oci mysql_Oracle常用的OCI函数
- mysql数据库之单表查询
- Eclipse javax.servlet.jsp.PageContext cannot be resolved to a type 错误解决办法
- node.js 初体验(转载)
- 开源.NET项目 CSS、JS资源优化类库及工具
- CMake构建_增加编译选项(debugrelease)
- 应用程序窗口小部件App Widgets
- 基于cpolar内网穿透工具ssh远程访问linux服务器
- Python网络爬虫(2)- 爬虫翻译程序-含有道、金山、百度翻译
- 给UILabel中的文字加删除线
- 脚本小子_Lua函数
- Windows2000、2003浏览器无法上网、无法联网
- Vue处理后台返回List集合带有Object对象的数据
- 直播数据采集的10个经典方法
- 赛效:电脑在线美化图片怎么弄?
热门文章
- 现在大厂面试,也太太太太太难了吧!
- 为什么别人年底购物,同学们年底考证?
- 腾讯云开发者大会 | 腾讯云大学首次与业界顶尖厂商合作的线上学习专区重磅发布...
- 为何优秀如程序员,也会构建 Bug 满格的软件?
- 今年的 618,你清空的不仅仅是购物车,还有焦虑和迷茫
- @程序员,如何轻松实现数据可视化?
- 滴滴顺风车春运暂不上线;锤子员工被强制离职;苹果聘请三星高管 | 极客头条...
- 微博回应裁员;罗永浩股权被冻结;“隐形贫困”人群最爱苹果 | 极客头条
- 程序员如何 Get 分布式锁的正确姿势?| 技术头条
- 为什么微型芯片是机器学习的命门?