缺失值填充1——缺失值查看、确定值填充、参考值填充
可以参考:https://blog.csdn.net/weixin_35757704/article/details/89280715
查看缺失值
可以通过下面的代码得到缺失值的数量:
dataframe.isnull().sum()
也可通过简单的 .info() 来看缺失值的情况;
下面的代码可以得到 dataframe的缺失值占比情况:为0就表示没有缺失值
dataframe.isnull().sum()/len(dataframe)
缺失值在进行求和时,会被默认视为0
确定值填充
使用 0 填充缺失值:
dataframe.fillna(0,inplace=True)
也经常用这一列的平均值填充:
dataframe.fillna(dataframe.mean(),inplace=True)
参考当前列其他值填充
dataframe.fillna(method='pad',inplace=True) #参考前面值
dataframe.fillna(method='bfill',inplace=True) #参考后面值
删除行
dataframe.dropna(axis = 0,inplace=True)
这个可以直接删除有缺失值的行。
如果把axis=1,则会删除列,不建议这样做,除非这个维度的缺失值非常严重。
如果希望整行都缺失才删除,可以使用:
dataframe.dropna(axis=0, how='all', inplace=True)
缺失值填充1——缺失值查看、确定值填充、参考值填充相关推荐
- python做数据分析时缺失值填补、缺失值填充方法汇总
在我们进行数据分析时,通常会遇到各种数据缺失的情况,针对这种情况我们该如何进行填补呢? 1.人工填补 该方法仅适用于小数据集,受个人因素影响. 2.平均值填补 对某一列的缺失值,采用该列的平均值填充 ...
- R语言使用xgboost构建回归模型:vtreat包为xgboost回归模型进行数据预处理(缺失值填充、缺失值标识、离散变量独热onehot编码)、构建出生体重的xgboost模型回归模型
R语言使用xgboost构建回归模型:vtreat包为xgboost回归模型进行数据预处理(缺失值填充.缺失值标识.离散变量独热onehot编码).构建出生体重的xgboost模型回归模型 目录
- 机器学习数据清洗之缺失值处理、缺失的原因、缺失值删除、缺失值填充、KNN填充
机器学习数据清洗之缺失值处理.缺失的原因.缺失值删除.缺失值填充.KNN填充 目录
- 用pandas填充时间序列缺失值
用pandas填充时间序列缺失值 例如,下有时间缺失值: Date_time current_demand Temp_Mean humidity_Mean 0 2018-05-01 00:00 159 ...
- R语言时间序列数据的合并(merge time series):使用merge函数合并时间序列数据、使用zoo包中的na.spline函数使用三次样条方法(cubic spline)填充时间序列缺失值
↵ R语言时间序列数据的合并(merge time series):使用merge函数合并时间序列数据.使用zoo包中的na.spline函数使用三次样条方法(cubic spline)填充时间序列缺 ...
- 【excel】根据某一定值/公式快速填充某一列/行
键入定值/公式,如图中1,2所示: 根据B列的长度填充至底部:选中C1,CTRL+SHIFT+↓,目的是选中该列 CTRL+D:根据公式填充C列,同理定值也是这样处理
- C语言什么时候必须用到二级指针?(需要调用函数为一维空指针确定值的情况下,需要传入二维指针,也就是那个一维指针的指针)
结论:需要调用函数为一维空指针确定值的情况下,需要传入二维指针,也就是那个一维指针的指针 例子:为空指针p开辟内存空间 1.不用二级指针(无法实现) #include <stdio.h> ...
- html中如何设置图片填充颜色渐变,实现SVG图标的渐变填充效果
2016年我写过一篇文章如何使用SVG图标,其"试验性部分"的结语是个警告 - "抱歉,渐变填充无法工作". 我指的是像fill: linear-gradien ...
- mybatis 自动填充无效_开发小知识-mybatis-plus自动填充与读写分离
mybatis-plus 自动填充 说明 我们在设计表结构的时候,往往会额外添多如下几个字段 create_time[表字段]-- createTime[实体字段] : 创建时间 update_tim ...
最新文章
- boost::type_erasure::any_cast相关的测试程序
- spring boot与spring mvc的区别是什么?
- 清理jdk注册表_JDK 9早期版本安装后的Windows注册表清理
- 利用爬虫模拟网页微信wechat
- 230. Kth Smallest Element in a BST
- 前端学习(2461):打包发布
- linuxShell之一 文件读取 循环与分支
- Pro Git 读书笔记
- 来几个 9 块 9 好吃零食
- 全新 ENVI Modeler 遥感建模工具
- 删数问题 山东理工oj2072(贪心)
- MP3播放(javazoom.jl.player.Player)
- java谷歌翻译_Java 调用 google 翻译
- React中防止事件冒泡:e.stopPropagation()
- 学英语《每日一歌》之brave
- 【转】photoshop CS2安装激活破解教程
- 使用 OneDrive 对电脑内的任意文件进行备份
- Android 之注册Facebook开发者账号
- SIGGRAPH 2022最佳技术论文奖重磅出炉!北大陈宝权团队获荣誉提名
- IT行业岗位及发展方向
热门文章
- group by很多字段是不是会很慢_3分钟短文 | MySQL在分组时,把多列合并为一个字段!
- python画椭圆形_手残党福音:用Python画出机器人Dev
- java三个数比大小_三个数的比较 不同的实现方法java
- Direct3D9 Fx/HLSL的若干条有用的笔记
- 四层和七层负载均衡的区别介绍(转载)
- 多浏览器判断,切换及使用
- 为基于spring-boot的应用添加根据运行时操作系统环境来提示用户选择active profile的功能...
- Alamofire4.x开源代码分析(三)文件上传下载
- PHP遍历文件夹下所有文件
- 干净虚拟机(centos 6.4)上从头到尾安装并调试Mdrill(四)