一、缺失值检测与统计

1.按列

df.isna().sum()
df.isnull().sum()
df.shape[0] - df.count()

2. 按行

df.isna().sum(axis=1)
df.isnull().sum(axis=1)
df.shape[1] - df.count(axis=1)

二、相关处理函数

df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

函数作用:删除含有空值的行或列
axis:维度,axis=0表示index行,axis=1表示columns列,默认为0
how:"all"表示这一行或列中的元素全部缺失(为nan)才删除这一行或列,"any"表示这一行或列中只要有元素缺失,就删除这一行或列
thresh:一行或一列中至少出现了thresh个才删除。
subset:在某些列的子集中选择出现了缺失值的列删除,不在子集中的含有缺失值得列或行不会删除(有axis决定是行还是列)
inplace:得新数据是存为副本还是直接在原数据上进行修改。

df.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

函数作用: 填充缺失值
value: 需要用什么值去填充缺失值
axis: 确定填充维度,从行开始或是从列开始
method: fill:用缺失值前面的一个值代替缺失值,如果axis =1,那么就是横向的前面的值替换后面的缺失值,如果axis=0,那么则是上面的值替换下面的缺失值。backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现
limit: 确定填充的个数,如果limit=2,则只填充两个缺失值。

python dataframe中缺失值处理相关推荐

  1. pandas使用fillna函数将dataframe中缺失值替换为空字符串(replace missing value with blank string in dataframe)

    pandas使用fillna函数将dataframe中缺失值替换为空字符串(replace missing value with blank string in dataframe) 目录 panda ...

  2. python中如何计算集合的长度_Python如何计算序列长度 python dataframe中元素如何统计?...

    如何在python列表中查找某个元素的索引 方法二:利用enumerate函数.没有任何一个男人,可以游手好闲赢得女人的欣赏. python dataframe中元素如何统计? 比如我有一个数据集a, ...

  3. python 去掉空格_如何从Python DataFrame中去除空格在这个例子中

    使用applymap到数据帧,applymap施加一拉每个单元格上的mbda函数.在lambda函数中拆分字符串(白色空格在其中被忽略)然后加入它.如果有一个int,那么你可以在lambda函数中使用 ...

  4. Pandas 对DataFrame的缺失值NA值处理4种方法总结

    数据清洗是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节.有人说一个分析项目80%的时间都是在清洗数据,这听起来有些匪夷所思,但在实际的工作中确实如此. 数据清洗的目的有两个,第一是通 ...

  5. python 数据框缺失值_Python:处理数据框中的缺失值

    python 数据框缺失值 介绍 (Introduction) In the last article we went through on how to find the missing value ...

  6. Python中缺失值的填充

    Python中缺失值的填充 文章目录 Python中缺失值的填充 0 常用方法 1 填充None 2 填充众数 3 检查是否含有缺失值 0 常用方法 ​ 在Python中最常用的处理数据格式为Data ...

  7. Python Pandas DataFrame 删除缺失值 None Nan drop dropna 替换缺失值 fillna 重复值删除 duplicate 数值替换 replace apply

    一.获取缺失值. 二.剔除缺失值. 三.缺失值补全. 四.重复值剔除(按照行和列). 五.数值转换. 原始数据展示.数据下载链接 https://download.csdn.net/download/ ...

  8. Python中缺失值删除 pd.dropna()函数

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中缺失值删除 pd.dropna()函数 ● 选择题 以下 ...

  9. Python中缺失值的填充fillna()函数

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中缺失值的填充 fillna()函数 ● 选择题 以下关于 ...

最新文章

  1. RDKit | 通过分析活性化合物确定指标阈值
  2. 一个中等规模的七段数码数据库以及利用它训练的识别网络
  3. Oracle脑裂 驱逐,了解Oracle RAC Brain Split Resolution集群脑裂协议
  4. Linux之awk:按照字符或列进行筛选与计算列值 条件动作
  5. linux桌面效率提高,ElementaryOS:使用这个轻量级 Linux 桌面提高工作效率
  6. pmp中ram和raci的区别_【PMP知识点总结】采购流程、采购合同的类型、采购合同的条款...
  7. c++jpg转bmp_用C++加速julia:BMP图片读取
  8. 分布科技荣登海南省实施区块链应用示范揭榜工程名单
  9. Codeforces Round #666 (Div. 2)D. Stoned Game(博弈问题)
  10. 【Proteus仿真8086】将IO接口电路封装成子电路CCT001
  11. 用JavaScript添加选择按钮的背景颜色和juqery添加选择按钮的背景色
  12. docker php示例,Docker 编程语言之 PHP
  13. ISO18000-6B和ISO18000-6C(EPC C1G2)标准的区别
  14. ACM题库(计蒜客A1001整除问题)
  15. 基于JDK1.8的JVM 内存结构【JVM篇三】
  16. Linux基础:破解root密码(rd.break)
  17. 几个免费的长链接缩短工具
  18. 【MYSQL】ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)
  19. 公众号客服消息超过48小时_免费模板消息群发的方法,在这里!
  20. shell编程之iptables

热门文章

  1. [Lintcode]102. Linked List Cycle/[Leetcode]
  2. fastDFS 命令笔记
  3. 对于transform的新认识
  4. iOS-UICollectionView自定义布局
  5. spark内核揭秘-06-TaskSceduler启动源码解析初体验
  6. C# const与readonly的用法和区别解析(转)
  7. Android 中Base64的操作
  8. RLE压缩及优化--图片压缩
  9. 软件设计师12-数据库(范式)
  10. 刚刚人均国民收入突破1万美元,作为打工人的你有感知吗?