Pandas处理缺失数据
利用pandas.DataFrame.dropna处理含有缺失值的数据
1.使用形式:
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
功能:处理含有缺失值的dataframe,将缺失值的行列过滤
2.参数解释:
参数:axis : 确定过滤行还是列,默认为0,可取值为:{0 or ‘index’, 1 or ‘columns’}
how : 确定过滤的标准,可选值为{}‘any’, ‘all’}。any : 存在NA就过滤,all:某一行或者某一列全为NA就过滤
thresh : 确定过滤的敏感程度int,取值为num,表示保留至少有num个非NA值得行、列
inplace : boolean, 默认值 False。
inplace=False,默认该删除操作不改变原数据,返回一个执行删除操作后的新dataframe;
inplace=True,则会直接在原数据上进行删除操作
3.测试
测试一个过滤过缺失值的dataframe时候还有缺失值:
print(data[data.isnull().any(axis=1)].size) #输出data中含有NA值得列的数目,输出为0
转载于:https://www.cnblogs.com/cnXuYang/p/8529045.html
Pandas处理缺失数据相关推荐
- Data Whale第20期组队学习 Pandas学习—缺失数据
Data Whale第20期组队学习 Pandas学习-缺失数据 一.缺失值的统计和删除 1.1 统计缺失信息 1.2 删除缺失信息 二.缺失值的填充和插值 2.1 利用fillna进行填充 2.2 ...
- pandas删除缺失数据(pd.dropna()方法)
1.创建带有缺失值的数据库: import pandas as pd import numpy as npdf = pd.DataFrame(np.random.randn(5, 3), index ...
- pandas plot label_数据科学| 手把手教你用 pandas 索引、汇总、处理缺失数据
作者:Paul 编者按: pandas提供了很多常用的数学和统计方法,本文中将用十分详细的例子来具体进行介绍:另外在许多数据分析工作中,缺失数据是经常发生的,将会具体介绍如何处理缺失数据.本文十分详细 ...
- 字段缺失_数据科学| 手把手教你用 pandas 索引、汇总、处理缺失数据
作者:Paul 编者按: pandas提供了很多常用的数学和统计方法,本文中将用十分详细的例子来具体进行介绍:另外在许多数据分析工作中,缺失数据是经常发生的,将会具体介绍如何处理缺失数据.本文十分详细 ...
- 数据科学 IPython 笔记本 7.6 Pandas 中的数据操作
7.6 Pandas 中的数据操作 原文:Operating on Data in Pandas 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(P ...
- Pandas 基础 (5) —— 处理缺失数据及层次化索引
处理缺失数据 pandas 使用浮点值 NaN (Not a Number)表示浮点和非浮点数组中的缺失数据.它只是一个便于被检测出来的标记而已. In [168]: data = Series([' ...
- Pandas简明教程:七、Pandas缺失数据的处理(数据清洗基础)
文章目录 1.缺失数据的类型 2.定位缺失数据 3.修改定位数据 4.批量修改缺失数据 5.数据修复的利器--插值法(`interpolate`) 本系列教程教程完整目录: 数据清洗的内容其实很丰富, ...
- Pandas高级教程之:处理缺失数据
文章目录 简介 NaN的例子 整数类型的缺失值 Datetimes 类型的缺失值 None 和 np.nan 的转换 缺失值的计算 使用fillna填充NaN数据 使用dropna删除包含NA的数据 ...
- DataWhale组队-Pandas(下)缺失数据(打卡)
1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成分析结果的不准确,以下从缺失值产生的原因及影响扥方面展开分析. (1)缺失值产生的原因 1)有些信息暂时无法获取,或 ...
- python fillna,Pandas之Fillna填充缺失数据的方法
约定: import pandas as pd import numpy as np from numpy import nan as NaN 填充缺失数据 fillna()是最主要的处理方式了. d ...
最新文章
- 【Ubuntu】dpkg-deb -c :查看deb文件中的内容
- FireBug(Firefox Plugin) 好用的web开发助手
- Python6种创建字典的方式
- CCIE学习(34)—— EIGRP配置
- 在Spring Boot使用H2内存数据库
- Spring JDBC 框架一个最简单的Hello World级别的例子
- 数字图像处理实验三图像增强
- 网上购物商城 html+css+MVC+sql server+idea编辑器实现。
- Python计算校验文件的MD5、SHA1、SHA256和CRC32,获取文件创建日期、修改日期和文件大小
- delphi listview失去焦点后的颜色_阴阳师姑获鸟和惠比寿建模更新对比 爷爷帅了 觉醒后鸟姐颜值提升...
- 女生学的计算机专业有前途吗,计算机专业好不好 女生学计算机有前途吗
- Mybatis_day4_Mybatis的缓存
- 20.Linux 账号管理与 ACL 权限设置
- 重构改善既有代码的设计思维导图
- 【FlinkX】两个issue分析:reader和writer的通道数不一致+获取JobId
- EF Code First 更新数据库, 数据库迁移
- 串口转以太网服务器原理,串口服务器和串口转以太网模块的区别
- python可以做数据库功能吗_python可以用哪些数据库
- 项目开发中的dev, test, prod , staging 环境是什么意思
- kali 镜像阿里云下载地址
热门文章
- c++ 银行管理系统
- 数据挖掘原理与算法_古今争翘,一首机器学习与数据挖掘神曲,共11.99G送你直上云霄...
- 存储过程创建临时表_【松勤教育】MySQL如何创建存储过程
- mysql延迟写入概念_三分钟了解MySQL的简单概念
- java string 匹配次数_Java实现统计某字符串在另一个字符串中出现的次数
- 支持向量机SVM原理(参数解读和python脚本)
- 计算机房采用c02采灭火,[灭火器使用.doc
- oracle函数调用语法,simpleJdbcCall调用函数语法
- 全国二级c语言公共基础知识,全国计算机二级C语言及公共基础知识复习资料
- vscode快速打开html页面_VSCode安装和测试