约定:

import pandas as pd

import numpy as np

from numpy import nan as NaN

填充缺失数据

fillna()是最主要的处理方式了。

df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])

df1

代码结果:

0

1

2

0

1.0

2.0

3.0

1

NaN

NaN

2.0

2

NaN

NaN

NaN

3

8.0

8.0

NaN

用常数填充:

df1.fillna(100)

代码结果:

0

1

2

0

1.0

2.0

3.0

1

100.0

100.0

2.0

2

100.0

100.0

100.0

3

8.0

8.0

100.0

通过字典填充不同的常数:

df1.fillna({0:10,1:20,2:30})

代码结果:

0

1

2

0

1.0

2.0

3.0

1

10.0

20.0

2.0

2

10.0

20.0

30.0

3

8.0

8.0

30.0

传入inplace=True直接修改原对象:

df1.fillna(0,inplace=True)

df1

代码结果:

0

1

2

0

1.0

2.0

3.0

1

0.0

0.0

2.0

2

0.0

0.0

0.0

3

8.0

8.0

0.0

传入method=” “改变插值方式:

df2=pd.DataFrame(np.random.randint(0,10,(5,5)))

df2.iloc[1:4,3]=NaN;df2.iloc[2:4,4]=NaN

df2

代码结果:

0

1

2

3

4

0

6

6

2

4.0

1.0

1

4

7

0

NaN

5.0

2

6

5

5

NaN

NaN

3

1

9

9

NaN

NaN

4

4

8

1

5.0

9.0

df2.fillna(method='ffill')#用前面的值来填充

代码结果:

0

1

2

3

4

0

6

6

2

4.0

1.0

1

4

7

0

4.0

5.0

2

6

5

5

4.0

5.0

3

1

9

9

4.0

5.0

4

4

8

1

5.0

9.0

传入limit=” “限制填充个数:

df2.fillna(method='bfill',limit=2)

代码结果:

0

1

2

3

4

0

6

6

2

4.0

1.0

1

4

7

0

NaN

5.0

2

6

5

5

5.0

9.0

3

1

9

9

5.0

9.0

4

4

8

1

5.0

9.0

传入axis=” “修改填充方向:

df2.fillna(method="ffill",limit=1,axis=1)

代码结果:

0

1

2

3

4

0

6.0

6.0

2.0

4.0

1.0

1

4.0

7.0

0.0

0.0

5.0

2

6.0

5.0

5.0

5.0

NaN

3

1.0

9.0

9.0

9.0

NaN

4

4.0

8.0

1.0

5.0

9.0

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

python fillna,Pandas之Fillna填充缺失数据的方法相关推荐

  1. 《利用python进行数据分析》之处理缺失数据

    <利用python进行数据分析>之处理缺失数据 # -*- coding: utf-8 -*- """ Created on Fri Nov 16 19:50 ...

  2. python使用pandas通过聚合获取时序数据的最后一个指标数据(例如长度指标、时间指标)生成标签并与原表连接(join)进行不同标签特征的可视化分析

    python使用pandas通过聚合获取时序数据的最后一个指标数据(例如长度指标.时间指标)生成标签并与原表连接(join)进行不同标签特征的可视化分析 目录

  3. python《pandas入门》实现Excel数据字段的拆分

    ** python<pandas入门>实现Excel数据字段的拆分 ,简单说一下自己为什么写博客,主要原因如下: 1,先简单介绍下自己,我是药学本科毕业,工作几年了.在这几年里做过药物相关 ...

  4. Py之Pandas:Python的pandas库简介、安装、使用方法详细攻略

    Py之Pandas:Python的pandas库简介.安装.使用方法详细攻略 目录 pandas库简介 pandas库安装 pandas库使用方法 1.函数使用方法 2.使用经验总结 3.绘图相关操作 ...

  5. 文献记录(part61)--基于不完备数据聚类的缺失数据填补方法

    学习笔记,仅供参考,有错必纠 关键词: 数据填补:不完备数据:聚类:约束容差集合差异度 基于不完备数据聚类的缺失数据填补方法 摘要 缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失 ...

  6. Python 3 与 Javascript escape 传输确保数据正确方法和中文乱码解决方案

    Python 3 与 Javascript escape 传输确保数据正确方法和中文乱码解决方案 参考文章: (1)Python 3 与 Javascript escape 传输确保数据正确方法和中文 ...

  7. DataWhale组队-Pandas(下)缺失数据(打卡)

    1.缺失值概要 数据的缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成分析结果的不准确,以下从缺失值产生的原因及影响扥方面展开分析. (1)缺失值产生的原因 1)有些信息暂时无法获取,或 ...

  8. 使用Python和Pandas的最简单的数据清理方法

    在本文中,我们将学习如何使用Python包Pyjanitor简化数据预处理工作.具体来说,我们将学习如何: 向一个Pandasdataframe(数据帧)中添加一个列 删除缺失的值 删除一个空列 清洗 ...

  9. Python使用pandas扩展库DataFrame对象的pivot方法对数据进行透视转换

    Python扩展库pandas的DataFrame对象的pivot()方法可以对数据进行行列互换,或者进行透视转换,在有些场合下分析数据时非常方便. DataFrame对象的pivot()方法可以接收 ...

最新文章

  1. 报名 | 图灵奖得主John Hopcroft做客清华,与你畅谈信息革命!
  2. 电子商务的发展和出现
  3. NIOS II spi详解
  4. Java 中日期的几种常见操作 —— 取值、转换、加减、比较
  5. XGBoost类库使用小结
  6. K 近邻法(K-Nearest Neighbor, K-NN)
  7. 【英语学习】【WOTD】valetudinarian 释义/词源/示例
  8. mysql 编译cpu数量_适合MySQL的Xeon 55XX系列CPU编译参数
  9. IDEA中Spring智能提示,XML Configuration File中spring config
  10. 华为MatePad 11开启预售:鸿蒙OS加持 2499元起!
  11. 【Docker】Docker 安装node-exporter prometheus pushgateway 页面显示Down
  12. Retrofit2设置返回类型是字符串(String)类型
  13. 工作模板-----MySQL示例
  14. 《麦肯锡精英的谈判策略》 -豆瓣评分8.2
  15. 华为路由交换由浅入深系列(二):静态路由、浮动路由、默认路由配置以及华为路由协议优先级总结
  16. ALPS TCP新建配置——网络测试仪实操
  17. 【matlab报错】错误使用 graph.validateEdgeProperties (第 375 行) 边属性必须为表。
  18. android区域统计,安卓版WPS教程:内置函数跨表求和统计区域销量
  19. 学习日志(三):感知机
  20. 解决Picasa网络相册打不开

热门文章

  1. 《零基础》MySQL 事务(二十二)
  2. xy坐标正负方向_【笛卡尔坐标系】
  3. java 生成客户端代码_swagger-codegen生成java客户端代码
  4. maven工程打包老是报错_maven工程pom文件老是报错
  5. Jsoup设置一个元素的HTML内容
  6. 计算机设计大赛国奖作品_2. 报名材料
  7. weblogic中ssrf漏洞修复_Weblogic-SSRF漏洞复现
  8. 国产自主可控的代码自动生成工具SkyEye
  9. vue 如何生成一个dom元素_通过一个简单的示例学习如何编写Vue组件
  10. 10-Linux与windows文件互传-pscp坑---- 'pscp' 不是内部或外部命令,也不是可运行的程序或批处理文件...