对于大多数情况而言,fillna方法是最主要的函数。通过一个常数调用fillna就会将缺失值替换为那个常数值。

fillna(value)

参数:value

说明:用于填充缺失值的标量值或字典对象

#通过常数调用fillna

书写方式:df.fillna(0) #用0替换缺失值

#通过字典调用fillna

书写方式:df.fillna({1:0.5,3:-1})

fillna(value,inplace=True)

参数:inplace

说明:修改调用者对象而不产生副本

#总是返回被填充对象的引用

书写方式:df.fillna(0,inplace=True)

fillna(method=ffill)

参数:method

说明:插值方式。如果函数调用时未指定其他参数的话,默认为“ffill”

对reindex有效的那些插值方法也可用于fillna:

In [23]: from numpy import nan as NA

In [21]: df=DataFrame(np.random.randn(6,3))

In [24]: df.ix[2:,1]=NA;df.ix[4:,2]=NA

In [25]: df

Out[25]:

0 1 2

0 -0.863925 1.005127 -0.529901

1 0.701671 -0.501728 -0.617387

2 -0.951060 NaN -0.263626

3 0.810230 NaN -0.277401

4 -0.403899 NaN NaN

5 -0.081091 NaN NaN

In [26]: df.fillna(method='ffill')

Out[26]:

0 1 2

0 -0.863925 1.005127 -0.529901

1 0.701671 -0.501728 -0.617387

2 -0.951060 -0.501728 -0.263626

3 0.810230 -0.501728 -0.277401

4 -0.403899 -0.501728 -0.277401

5 -0.081091 -0.501728 -0.277401

fillna(limit=2)

参数:limit

说明:(对于前向和后向填充)可以连续填充的最大数量

In [27]: df.fillna(method='ffill',limit=2)

Out[27]:

0 1 2

0 -0.863925 1.005127 -0.529901

1 0.701671 -0.501728 -0.617387

2 -0.951060 -0.501728 -0.263626

3 0.810230 -0.501728 -0.277401

4 -0.403899 NaN -0.277401

5 -0.081091 NaN -0.277401

fillna(data.mean())

只要稍微动动脑子,就可以利用fillna实现许多别的功能。比如说,可以传入Series的平均值或中位数:

In [28]: data=Series([1,NA,3.5,NA,7])

In [29]: data.fillna(data.mean())

Out[29]:

0 1.000000

1 3.833333

2 3.500000

3 3.833333

4 7.000000

dtype: float64

axis

参数:axis

说明:待填充的值,默认axis=0

「亲,如果笔记对您有帮助,收藏的同时,记得给点个赞、加个关注哦!感谢!」

「文中代码均亲测过,若有错误之处,欢迎批评指正,一起学习,一起成长!」

python缺失值填充_python填充缺失数据相关推荐

  1. python 条形图 负值_Python处理JSON数据并生成条形图

    一.JSON 数据准备 首先准备一份 JSON 数据,这份数据共有 3560 条内容,每条内容结构如下: 本示例主要是以 tz(timezone 时区) 这一字段的值,分析这份数据里时区的分布情况. ...

  2. python导出结果_Python连接Oracle数据查询导出结果

    python连接oracle,需用用到模块cx_oracle,可以直接pip安装,如网络不好,可下载离线后本地安装 本人由于工作需要,期望便捷查询所得结果,且固定输出某个格式 具体代码如下: #! c ...

  3. python 文件格式转换_Python的处理数据,如何进行数据转换,学会三种方式

    平时我们在处理数据的时候,有些数据类型不是我们想要的,怎么办? 如: python数据转换 num01,num02是str类型,但是我们需要的是整型,所以通过int转换成了整数. 数据转换 如何完成数 ...

  4. python csv数据处理_python处理csv数据的方法

    本文实例讲述了python处理csv数据的方法.分享给大家供大家参考.具体如下: Python代码: #coding=utf-8 __author__ = 'dehua.li' from dateti ...

  5. python保存表格_python怎么把数据保存为excel

    在python中把数据保存为excel的方法:首先下载xlwt:然后使用[win+R]快捷键打开cmd,切换目录到下载的文件地址并输入[python setup.py install]:再调用xlwt ...

  6. python 预测算法_Python 与金融数据使用机器学习算法预测交易策略

    记得 关注.分享.点在看 呀- 这样您就能持续收到优质的推送啦 这一期,我们将使用上一期处理好的数据特征和标签训练机器,然后预测交易策略.我们将分别使用 K近邻算法和集成学习两种方法分别完成模型的训练 ...

  7. python列表导出_python list格式数据excel导出方法

    如下所示: # _*_ coding:utf-8 _*_ #----------------------------------------------- # import modules #---- ...

  8. python与数据处理_python数据处理:数据合并和Reshaping

    本文资料来自于: Python for Data Analysis: Chapter5, 7, 12 文中实例查看地址:http://nbviewer.jupyter.org/github/RZAmb ...

  9. python串口通信_python 读取串口数据的示例

    python3 读取串口数据 demo 最近在写一个demo,zigbee串口连接树莓派,树莓派使用串口通信接受zigbee穿过来得值.其中我是用的树莓派是3代B+,zigbee每隔三秒钟从串口输出数 ...

最新文章

  1. Java一个线程能否结束另一个永不停止的线程
  2. SpringMVC一些功能
  3. python input与返回值-Python 详解基本语法_函数_返回值
  4. 2.7 负采样-深度学习第五课《序列模型》-Stanford吴恩达教授
  5. 6.6折票仅剩3天 | BDTC 2019全日程公布,哪些是你感兴趣的话题?
  6. wpf 代码获取contextmenu_[C#] 转:在WPF里面获取右键弹出菜单(ContextMenu)的鼠标点击源(Owner)控件...
  7. python语句join_详解Python中的join()函数的用法
  8. mysql进程删除文件_完全卸载mysql 停止服务、卸载相关程序、删除注册表
  9. [摘录]第10章 培养胜过对手的力量
  10. c java python go 哪种编程语言接近编程的本质_一图看懂编程语言迁移模式:终点站是Python、Go、JS...
  11. 别人加薪你加班,征服老板才是王道
  12. Unable to find a @SpringBootConfiguration, you need to use @ContextConfiguration or @SpringBootTest(
  13. lnmp一键安装包 php7,LNMP一键安装包 V1.7 正式版发布
  14. 尚德计算机科学与技术网课,计算机科学与技术
  15. 谷歌、斯坦福联合发文:我们为什么一定要用大模型?
  16. CSS 实现文字渐变色
  17. 认证 (authentication) 和授权 (authorization) 的区别.md
  18. 如何查看glibc版本
  19. Android pms权限管理,PMS权限管理和鉴权过程
  20. linux --压缩xz

热门文章

  1. matlab单边带调制器设计,通信系统综合设计与实践(基于MATLAB的单边带调制)研究.doc...
  2. Unity + Mirror实现原创卡牌游戏局域网联机
  3. python汇率的转换程序_如何实现python汇率转换代码
  4. KDD 2020(五) | 基于多源异构信息整合的视频标题生成模型(作者带你读论文)...
  5. win10 管理员权限运行
  6. Unity零基础到入门 ☀️| 近万字教程 对 Unity 中的 动画系统基础 全面解析+实战演练,你确定要错过吗?
  7. RT-Thread 4.1.0 特性解析之LIBC与POSIX
  8. git第一次提交代码至远程仓库
  9. 华为TechWave峰会上主推的分布式云到底什么来头?
  10. 使用Python将mat文件转换为npy文件