python的dropna 和notna的性能_python轻松滤除缺失数据
前言
缺失数据(missing data)在大部分数据分析应用中都很常见。Pandas的设计目标之一就是让缺失数据的处理任务尽量轻松。
Pandas使用浮点值NAN(not a number)表示浮点和非浮点数组中的缺失数据,它只是一个便于被检测出来的标记而已。
Python内置的None值也会被当做NA处理。
滤除缺失数据-dropna()
过滤掉缺失数据的方法,一是手工,二是dropna,后者更实用。
Series缺失值过滤
对于一个Series,dropna返回一个仅含非空数据和索引值的series。
#书写方式如下
from numpy import nan as NA
data.dropna()
也可以通过布尔型索引达到这个目的:
Data[data.notnull()]
DataFrame缺失值过滤
对于DataFrame对象,事情就有点复杂了。你可能希望丢弃全NA或含有NA的行或列。
#dropna默认丢弃任何含有缺失值的行
书写方式:data.dropna()
#传入how=’all’将只丢弃全为NA的那些行
书写方式:data.dropna(how=’all’)
#传入axis=1丢弃列
书写方式:data.dropna(how=’all’,axis=1)
#thresh参数过滤时间序列数据
书写方式:df.dropna(thresh=3)
「亲,如果笔记对您有帮助,收藏的同时,记得给点个赞、加个关注哦!感谢!」
「文中代码均亲测过,若有错误之处,欢迎批评指正,一起学习,一起成长!」
python的dropna 和notna的性能_python轻松滤除缺失数据相关推荐
- python的dropna 和notna的性能_python数据分析学习(7)数据清洗与准备(1)
关于文件的读写方面先放一下,接下来介绍数据清洗方面的知识.有时候数据对于特定的任务来说格式并不正确,需要转化为更加适合的数据形式.这里介绍数据清洗的有关基础知识,本篇博客先介绍如何处理缺失值. 一:处 ...
- python pandas dropna_Pandas之Dropna滤除缺失数据的实现方法
约定: import pandas as pd import numpy as np from numpy import nan as NaN 滤除缺失数据 pandas的设计目标之一就是使得处理缺失 ...
- Pandas详解十之Dropna滤除缺失数据
约定: import pandas as pd import numpy as np from numpy import nan as NaN 滤除缺失数据 pandas的设计目标之一就是使得处理缺失 ...
- .Dropna()滤除缺失数据||空字符串处理
滤除缺失数据 DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False) Remove missing v ...
- python合并多个excel为一个_Python合并多个Excel数据
安装模块 1.找到对应的模块 2.用pip install 安装 pip install xlrd pip install XlsxWriter pip list查看 XlsxWriter示例 1 i ...
- python爬取app中的音频_Python爬取喜马拉雅音频数据详解
码农公社 210.net.cn 210是何含义?10月24日是程序员节,1024 =210.210既 210 之意. Python爬取喜马拉雅音频数据详解 一.项目目标 爬取喜马拉雅音频数据 受害 ...
- python读取txt文件中的数字_python从txt文件读取数据
(作为一个python初学者,记录一点学习期间的笔记,方便日后查阅,若有错误或者更加便捷的方法,望指出!) 1.读取TXT文件数据,并对其中部分数据进行划分.一部分作为训练集数据,一部分作为测试集数据 ...
- python爬取微博评论点赞数_python 爬虫 爬微博 分析 数据
python 爬虫 爬微博分析 数据 最近刚看完爱情公寓5,里面的大力也太好看了吧... 打开成果的微博,小作文一样的微博看着也太爽了吧... 来 用python分析分析 狗哥这几年微博的干了些啥. ...
- python爬取股票大单历史记录_python爬取股票实时数据,python爬虫与股票分析
内容导航: Q1:怎么学python爬取财经信息 本程序使用Python 2.7.6编写,扩展了Python自带的HTMLParser,自动根据预设的股票代码列表,从Yahoo Finance抓取列表 ...
最新文章
- 数据解析框架之Gson
- cin 和 getline 混用中需要注意的问题
- Linux环境下的Popush部署——张凯
- python变量后面加星号_Python基础找茬系列20--python函数的秘密
- Java BigInteger类| 带示例的shiftLeft()方法
- python 配置文件返回的两种方式,写法不一样而已
- 在没有密码提示的情况下在Ubuntu上安装MySQL
- Eclipse+Wildfly10 创建第一个EJB项目
- 用Python搭建股票舆情分析系统
- dw怎么打开html模板,Dreamweaver怎样使用网页模板及修改模板
- CentOS7.9 查询内网ip
- 2022最新QQ协议登陆,QQ密码加密源代码
- 问脉首创旁路云原生安全检测框架!
- 2021-2027全球与中国环卫云平台市场现状及未来发展趋势
- 纹理基础知识和过滤模式详解
- C语言实现最大值、最小值、均值、标准差、峰值因子、方差和百分位数的计算
- python opcua使用教程
- 福利来了,python 淘宝旗舰店、天猫、抢茅台,干死黄牛党《本人亲测有效》
- 一些比较实用的书籍推荐
- BFC是什么?有什么用?
热门文章
- 用户自定义函数代替游标进行循环拼接
- 【JAQS】jaqs与DataCore 框架安装,学习笔记(一)
- Android 中文 API (28) —— CheckedTextView
- Linux2.6.32内核笔记(5)在应用程序中移植使用内核链表【转】
- Powershell都有哪些好用的技能?
- PS2: 这篇文章中的图片绘图工具使用的是Dia (sudo apt-get install dia)。据说yEd也很不错。...
- MyEclipse 修改 默认的 工作空间(转)
- QT 创建鼠标右键菜单
- Docker-服务安装
- Numpy 基本除法运算和模运算