删除表中的某一行或者某一列更明智的方法是使用drop,它不改变原有的df中的数据,而是返回另一个dataframe来存放删除后的数据。本文出处主要来源于必备工具书《利用python进行数据分析》。

—————————————————————————————————————————————————————

清理无效数据

df[df.isnull()]  #返回的是个true或false的Series对象(掩码对象),进而筛选出我们需要的特定数据。
df[df.notnull()]df.dropna()     #将所有含有nan项的row删除
df.dropna(axis=1,thresh=3)  #将在列的方向上三个为NaN的项删除
df.dropna(how='ALL')        #将全部项都是nan的row删除

此处:print data.dropna() 和 print data[data.notnull()] 结果一样

填充无效值

df.fillna(0)
df.fillna({1:0, 2:0.5})         #对第一列nan值赋0,第二列赋值0.5
df.fillna(method='ffill')   #在列方向上以前一个值作为值赋给NaN

drop函数的使用

(1)drop函数的使用:删除行、删除列

print frame.drop(['a'])
print frame.drop(['Ohio'], axis = 1)

drop函数默认删除行,列需要加axis = 1

(2)drop函数的使用:inplace参数

采用drop方法,有下面三种等价的表达式:

1. DF= DF.drop('column_name', axis=1);
2. DF.drop('column_name',axis=1, inplace=True)
3. DF.drop([DF.columns[[0,1, 3]]], axis=1, inplace=True)   # Note: zero indexed

注意:凡是会对原数组作出修改并返回一个新数组的,往往都有一个 inplace可选参数。如果手动设定为True(默认为False),那么原数组直接就被替换。也就是说,采用inplace=True之后,原数组名(如2和3情况所示)对应的内存值直接改变;

而采用inplace=False之后,原数组名对应的内存值并不改变,需要将新的结果赋给一个新的数组或者覆盖原数组的内存位置(如1情况所示)。

(3)drop函数的使用:数据类型转换

df['Name'] = df['Name'].astype(np.datetime64)

DataFrame.astype() 方法可对整个DataFrame或某一列进行数据格式转换,支持Python和NumPy的数据类型。

python进行数据处理——pandas的drop函数相关推荐

  1. pandas使用drop函数删除dataframe中指定索引列表对应位置的数据行(drop multiple rows in dataframe with integer index)

    pandas使用drop函数删除dataframe中指定索引列表对应位置的数据行(drop multiple rows in dataframe with  integer index) 目录

  2. pandas dataframe drop函数

    使用drop函数删除dataframe的某列或某行数据: drop(labels, axis=0, level=None, inplace=False, errors='raise')-- axis为 ...

  3. 使用pandas的drop函数删除数据

    使用pandas的drop对数据进行删除操作 drop函数参数详解 DataFrame.drop(labels=None, axis=0, index=None, columns=None, leve ...

  4. 【Python】图解Pandas的宝藏函数:assign

    公众号:尤而小屋 作者:Peter 编辑:Peter 在我们处理数据的时候,有时需要根据某个列进行计算得到一个新列,以便后续使用,相当于是根据已知列得到新的列,这个时候assign函数非常方便.下面通 ...

  5. Python地理数据处理库shapely支持函数总结

    Shapely是一个Python库,用于操作和分析笛卡尔坐标系中的几何对象. 本文通过部分示例介绍了空间处理库Shape的部分概念与操作函数. 官方文档:https://shapely.readthe ...

  6. python中head_Python pandas.DataFrame.head函数方法的使用

    DataFrame.head(self, n=5) [source] 返回前n行. 此函数根据位置返回对象的前n行.这对于快速测试对象中的数据类型是否正确非常有用. 参数:n :int,默认5 要选择 ...

  7. python panda apply_python – Pandas – 关于apply函数缓慢的解释

    关于你的第一个问题,我不能确切地说为什么这个例子很慢.但通常,apply不会利用矢量化.此外,apply返回一个新的Series或DataFrame对象,因此对于一个非常大的DataFrame,你有相 ...

  8. python中unstack_Python pandas.DataFrame.unstack函数方法的使用

    DataFrame.unstack(level=-1, fill_value=None)[source] Pivot(必要的分层)索引标签的一个级别. 返回具有列标签新级别的DataFrame,其最内 ...

  9. python中fillna_Python pandas.DataFrame.fillna函数方法的使用

    DataFrame.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, ...

  10. Pandas数据处理2、DataFrame的drop函数具体参数使用详情

    Pandas数据处理2.DataFrame的drop函数具体参数使用详情 目录 Pandas数据处理2.DataFrame的drop函数具体参数使用详情 前言 环境 基础函数的使用 drop函数 编码 ...

最新文章

  1. idl结果显示窗口如何缩小_科学网—IDL 创建窗口 - 钱磊的博文
  2. 获取文件名和路径函数
  3. 【Oracle】【日期、时间】 date与数字时间戳互转
  4. 学习进度条(第十五周)
  5. ubuntu 15.04 系统中如何启用、禁用客人会话
  6. MySql优化 (2009-08-28 系统架构师大会) 演讲ppt
  7. oracle19c 安装权限_Oracle19c 安装及SQL developer连接
  8. Silverlight Blend动画设计系列七:模糊效果(BlurEffect)与阴影效果(DropShadowEffect)...
  9. WinForm下屏幕截图程序的实现
  10. springboot初始化逻辑_详解Spring Boot中初始化资源的几种方式
  11. 对$()与``区别的理解
  12. Children’s Queue
  13. tensorflow学习笔记(3)梯度下降法进行曲线拟合和线性回归
  14. MATLAB基本介绍(1)
  15. gitgub常用按钮说明
  16. 为什么大多公司不要培训班培训出来的Java程序员?
  17. 三国演义亲和度python_用python分析四大名著之三国演义
  18. 毕索大学计算机科学怎么样,毕索大学的计算机硕士如何
  19. 基于itextpdf java pdf添加水印后,部分文档无法显示水印的问题
  20. AOP(面向切面)原理及使用

热门文章

  1. 好的vue框架-模板
  2. 学习笔记47—PhotoShop技巧
  3. 惠普台式机开不了机怎么办 惠普台式电脑无法开机的解决方法
  4. Ajax 传参的两种方式
  5. 【笔记】2022.06.20 python数据分析三大神器numpy、pandas、matplotlib
  6. 数据类型——字符串(str)
  7. python bytes转str_Python3中bytes类型转换为str类型
  8. 网赚项目 - 利用社区广告牌,空手赚钱创业项目
  9. 北大2022计算机学院夏令营,2020年北京大学“第十三届(2020)全国优秀大学生暑期夏令营”录取名单(第一批)及活动须知...
  10. 如何将ppt压缩到最小?