drop和dropna的用法详解

进行数据清洗时，经常会遇到缺失值。
处理缺失值的一种方式是，直接删除

dropna篇

官方文档：

DataFrame.dropna(self, axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

参数：

0.构建实例

import pandas as pd
import numpy as np
df = pd.DataFrame({'name':['zhao','qian','sun','li'],'mark':[150,122,np.nan,32],'gender':['female',np.nan,np.nan,'male']})
dfname  mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male

1.axis： axis=0、index，删除所在行，axis=1、columns，删除所在列。默认为行。default

df.dropna(axis=0) #删除空值所在行，1,2行被删掉name   mark    gender
0   zhao    150.0   female
3   li      32.0    maledf.dropna(axis='columns')#删除空值所在列，mark、gender都被删掉name
0   zhao
1   qian
2   sun
3   li

2.how：选择删除的模式，有any和all两种。

any：只要存在空值即删除所在行列，默认为any。default
all：所在行或列如果全是空值，则删除

df.dropna(axis=0,how='any')#any模式name    mark    gender
0   zhao    150.0   female
3   li      32.0    male#为方便演示，新构建一下dfname   mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male
4   NaN     NaN     NaNdf.dropna(axis=0,how='all')#all模式，第5行被删除name  mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male

3.thresh：指定当一行或一列存在多少非空值时，保留该行或该列
thresh 美 [θrεʃ] vt.打(谷);翻来覆去vi.打谷脱粒

dfname   mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male
4   NaN     NaN     NaNdf.dropna(axis=0,thresh=1) #当df中每行有至少1个非空值是，保留该行name    mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    maledf.dropna(axis=0,thresh=2)#当df中，每行至少有2个空值，保留该行name  mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
3   li      32.0    male

4.subset：传入一个列表，指定相应的列名，如果指定列内有空值，则删除所在行，可以和how搭配。

dfname   mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male
4   NaN     NaN     NaNdf.dropna(how='all',subset=['name','gender'])#name和gender列同为空值是，删除对应的行。name   mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male

5.inplace：执行操作后，将返回值赋值给df。default=“False”

dfname   mark    gender
0   zhao    150.0   female
1   qian    122.0   NaN
2   sun     NaN     NaN
3   li      32.0    male
4   NaN     NaN     NaNdf.dropna(inplace=True) #df已重新赋值
dfname  mark    gender
0   zhao    150.0   female
3   li      32.0    male

drop篇

官方文档：

DataFrame.drop**(self,** labels=None**,** axis=0**,** index=None**,** columns=None**,** level=None**,** inplace=False**,** errors='raise’)

参数

0.构建实例

import pandas as pd
import numpy as np
df = pd.DataFrame({'name':['张三','李四','王二','麻子','杜甫'],'mark':[120,111,135,150,151],'gender':['male','female','female','male',np.nan]})
df #构建出df实例name mark    gender
0   张三  120     male
1   李四  111     female
2   王二  135     female
3   麻子  150     male
4   杜甫  151     NaN

1.labels：按照标签删除对应的行或列，接受单个标签或是一个列表。

df.drop('name',axis=1)#删除列需加上axis参数mark   gender
0   120     male
1   111     female
2   135     female
3   150     male
4   151     NaNdf.drop([1,3])#传入多个参数需使用列表name   mark    gender
0   张三  120     male
2   王二  135     female
4   杜甫  151     NaN

2.axis：指出需要删除的是行（0或index，）还s是列（1或columns），default = 0.默认为0

#效果同上，此处不演示了

3.index\columns:0.21.0版本之后，可以通过直接指定index= 来代替“label= ，axis=”。可以传入单个标签或是一个列表。

dfname   mark    gender
0   张三  120     male
1   李四  111     female
2   王二  135     female
3   麻子  150     male
4   杜甫  151     NaNdf.drop(index= 1)#这里等价于df.drop(1,axis=0)name   mark    gender
0   张三  120     male
2   王二  135     female
3   麻子  150     male
4   杜甫  151     NaNdf.drop(columns= ['name','gender'])#这里等价于df.drop(['name','gender'],axis=2)mark
0   120
1   111
2   135
3   150
4   151

4.level:针对多级标签。多级标签计算时，从0开始。

m_index1=pd.Index([("A","x1"),("A","x2"),("B","y1"),("B","y2"),("B","y3")],name=("class1","class2"))
#创建多级标签
df1=pd.DataFrame(np.random.randint(1,10,(5,3)),index=m_index1)
df1#构建一个df0 1   2
class1  class2
A       x1      6   6   6x2     1   8   6
B       y1      3   6   2y2     5   9   2y3     9   8   1df1.drop(index = ['y1','y2','x1'],level=1)#删除多级索引，从0开始，第二个，所以level=10    1   2
class1  class2
A       x2      1   8   6
B       y3      9   8   1

5.inplace:同dropna中效果一样，删除数据后自动赋值。
6.errors：如果传入的标签不存在，会报错，KeyError，errors可以忽略报错。可选择raise和ignore，default=raise

dfname   mark    gender
0   张三  120     male
1   李四  111     female
2   王二  135     female
3   麻子  150     male
4   杜甫  151     NaNdf.drop(columns= ['name','number'])#没有number列，结果会报错，keyerror
KeyError                                  Traceback (most recent call last)in
----> 1 df.drop(columns= ['name','number'])df.drop(columns= ['name','number'],errors='ignore')#忽略报错，删除参数中有的列mark gender
0   120     male
1   111     female
2   135     female
3   150     male
4   151     NaN

pandas学习之drop和dropna篇相关推荐

pandas数据清洗：drop函数案例详解、dropna函数案例详解、drop_duplicates函数案例详解
pandas数据清洗:drop函数.dropna函数.drop_duplicates函数详解 1 drop函数简介 1.1 构建学习数据 1.2 删除行两种方法 1.3 删除列两种方法 2 dropn ...
Python之pandas：pandas中缺失值与空值处理的简介及常用函数(drop()、dropna()、isna()、isnull()、fillna())函数详解之详细攻略
Python之pandas:pandas中缺失值与空值处理的简介及常用函数(drop().dropna().isna().isnull().fillna())函数详解之详细攻略目录 pandas中缺 ...
【pandas drop()和dropna()函数使用详解】
drop和dropna的用法详解进行数据清洗时,经常会遇到缺失值. 处理缺失值的一种方式是,直接删除 dropna使用 DataFrame.dropna(self, axis=0, how='any ...
数据分析之pandas学习笔记（六）（层次化索引、重塑、轴向旋转、行列变换、合并表数据）
数据分析之Pandas学习笔记(六)(层次化索引.重塑.轴向旋转.行列变换.合并表数据) level层次化索引 unstack()与stack()进行重塑,即:行列索引变换 swaplevel()交换 ...
pandas python2_Python数据分析之pandas学习（二）
有关pandas模块的学习与应用主要介绍以下8个部分: 1.数据结构简介:DataFrame和Series 2.数据索引index 3.利用pandas查询数据 4.利用pandas的DataFram ...
pandas学习笔记之DateFrame
pandas学习笔记之DateFrame 文章目录 pandas学习笔记之DateFrame 1.DateFrame的创建 1)认识DataFrame对象 2)由二维列表创建(默认index和colu ...
python数据分析-pandas学习
文章目录一.pandas环境的搭建 1.pandas 简介 2.pandas安装和调用二.pandas学习 1.pandas简介 2.pandas学习资源 3.pandas核心数据结构 4.Ser ...
Pandas学习（三）---数值运算
Pandas学习--数值运算数值计算和统计基础常用数学.统计方法基本参数:axis.skipna 主要数学计算方法,可用于Series和DataFrame(1) 主要数学计算方法,可用于Seri ...
基于Anaconda的pandas学习
基于Anaconda的pandas学习 Pandas安装创建对象创建Series对象创建DataFrame对象创建date_range 查看数据获取数据直接获取索引获取增删改数据索引 ...

pandas学习之drop和dropna篇

drop和dropna的用法详解

dropna篇

官方文档：

参数：

drop篇

官方文档：

参数

pandas学习之drop和dropna篇相关推荐

最新文章

热门文章