数据量大,缺失数据比较少的情况下,可以直接滤除;数据量小,缺失数据比较多时,对数据进行填充就很有必要了。

数据填充函数fillna(),默认参数如下:

案例学习:

import numpy as np
from numpy import nan
import pandas as pddata = pd.DataFrame(np.arange(3, 19, 1).reshape(4, 4), columns=list('abcd'), index=list("1234"))
print(data)
data.iloc[0:2, 0:3] = nan
print(data)

运行结果:

# 用0填充缺失数据
print(data.fillna(0))

运行结果:

# 用每列特征的均值填充缺失数据
print(data.fillna(data.mean()))

运行结果:

# 用每列特征的中位数填充缺失数据
print(data.fillna(data.median()))

运行结果:

# 用相邻后面(back)特征填充前面空值
print(data.fillna(method='bfill'))
print(data.fillna(method='backfill'))

运行结果:

# 用相邻前面(before)特征填充后面空值
print(data.fillna(method='ffill'))
print(data.fillna(method='pad'))

运行结果:

# 用字典对不同的列填充不同的缺失数据
values = {"a": 10, "b": 20, "c": 30}
print(data.fillna(value=values))

运行结果:

完整代码如下:

import numpy as np
from numpy import nan
import pandas as pddata = pd.DataFrame(np.arange(3, 19, 1).reshape(4, 4), columns=list('abcd'), index=list("1234"))
print(data)
data.iloc[1:2, 0:3] = nan
print(data)# 用0填充缺失数据
print("\n用0填充缺失数据\n", data.fillna(0))# 用每列特征的均值填充缺失数据
print("\n用每列特征的均值填充缺失数据\n", data.fillna(data.mean()))# 用每列特征的中位数填充缺失数据
print("\n用每列特征的中位数填充缺失数据\n", data.fillna(data.median()))# 用相邻后面(back)特征填充前面空值
print("\n用相邻后面(back)特征填充前面空值\n", data.fillna(method='bfill'))
print("\n用相邻后面(back)特征填充前面空值\n", data.fillna(method='backfill'))# 用相邻前面(before)特征填充后面空值
print("\n用相邻前面(before)特征填充后面空值\n", data.fillna(method='ffill'))
print("\n用相邻前面(before)特征填充后面空值\n", data.fillna(method='pad'))# 用字典对不同的列填充不同的缺失数据
values = {"a": 10, "b": 20, "c": 30}
print("\n用字典对不同的列填充不同的缺失数据\n", data.fillna(value=values))

Python 数据清洗之缺失数据填充fillna()相关推荐

  1. python数据清洗实例_python 数据的清理行为实例详解

    python 数据的清理行为实例详解 数据清洗主要是指填充缺失数据,消除噪声数据等操作,主要还是通过分析"脏数据"产生的原因和存在形式,利用现有的数据挖掘手段去清洗"脏数 ...

  2. 四行Python代码解决excel数据填充到word指定位置!

    网上介绍这两种格式转换的文章很多, 发现很少有实现指定位置替换并将所有内容生成在一个文档的,综合前辈的经验探索出了解决方案,希望能给有需要的小伙伴帮助. excel原数据: 目标格式: 我们的目标就是 ...

  3. python颜色填充随机_使用python中的随机数据填充mysql表

    How can create a mysql table in python and then populate it with random data.I want around 10000 row ...

  4. cp分解实现_如何用贝叶斯高斯张量分解修复缺失数据?(Jupyter notebook - Python)

    本文来源于BGCP Imputation - transdim,主要讨论如何利用贝叶斯高斯张量分解(Bayesian Gaussian CP decomposition, BGCP) 估计矩阵中的缺失 ...

  5. 【Python数据分析】之数据合并的concat函数与merge函数

    文章目录 系列文章 一.concat函数 1)横向堆叠与外连接 横向堆叠合并df1和df2,采用==外连接==的方式 2) 纵向堆叠与内链接 二.merge()函数 1)根据行索引合并数据 2)合并重 ...

  6. fillna填充某一列_python dataframe向下向上填充,fillna和ffill的方法

    摘要:这篇Python开发技术栏目下的"python dataframe向下向上填充,fillna和ffill的方法",介绍的技术点是"DataFrame.fillna. ...

  7. python缺失值处理 fillna能否用scala来处理_数据清洗(一)丨处理缺失数据

    原标题:数据清洗(一)丨处理缺失数据 其实数据分析中80%的时间都是在数据清理部分,而为什么要进行数据清洗呢? 因为在实际生产环境中,存在大量"脏"数据 ✔不完整数据:缺少感兴趣属 ...

  8. python fillna,Pandas之Fillna填充缺失数据的方法

    约定: import pandas as pd import numpy as np from numpy import nan as NaN 填充缺失数据 fillna()是最主要的处理方式了. d ...

  9. python数据分析第七章实训3_《利用Python进行数据分析·第2版》第7章 数据清洗和准备7.1 处理缺失数据7.2 数据转换7.3 字符串操作7.4 总结...

    在数据分析和建模的过程中,相当多的时间要用在数据准备上:加载.清理.转换以及重塑.这些工作会占到分析师时间的80%或更多.有时,存储在文件和数据库中的数据的格式不适合某个特定的任务.许多研究者都选择使 ...

最新文章

  1. 人工智能实践:TensorFlow笔记学习(三)——TensorFlow框架
  2. 常纪文:智慧城市有助于实现低碳绿色发展
  3. UI自动化之特殊处理三(日期控件\表格\富文本)
  4. 微软服务器藏,配置微软CA服务器+SCEP
  5. python基础教程小甲鱼-小甲鱼零基础入门学习Python3视频教程全套96集
  6. 洛谷 P3391 文艺平衡树
  7. java集合——遗留的集合
  8. Rails 使用 Google Analytics 示例
  9. java getevent_Java ActionEvent.getWhen方法代码示例
  10. 音视频开发(18)---视频监控客户端开发(IP Camera)总结
  11. Python 打印嵌套list中每个数据(遍历列表)
  12. iPad Air PSD设计模板
  13. windows api中定义的基本数据类型简介(转)
  14. ORA-01017: invalid username/password; logon denied
  15. python超市管理系统流程图_python实现超市管理系统(后台管理)
  16. 在线 LaTeX 公式编辑器
  17. word怎么设置边距为80磅_word 字体磅数 word怎么设置字体磅数
  18. MySQL 8.0完美卸载(windows)
  19. CentOS7下 SVN版本控制的安装(包括yum与非yum)的步骤记录。
  20. 那些你所不知道的结构光技术

热门文章

  1. 对称加密非对称加密怎么一起使用(初级版)
  2. Mac osX 添加自定义字体库
  3. 系统设计(四) 设计Instagram
  4. macOS Ventura 13.2.1 (22D68) 正式版发布,ISO、IPSW、PKG 下载
  5. android如何定时息屏_手机息屏显示时间如何设置?其实息屏显示App也能帮你实现...
  6. 卧槽,SQL注入竟然把我们的系统搞挂了!
  7. 求四门课平均成绩c语言,C语言:有三个学生,上四门课,要求输入全部学生的各门课成绩,并分别求出每门课的平均成绩按升序输出...
  8. Linux常用命令(排版精美)
  9. 软件测试工程师是做什么的?待遇前景怎么样?
  10. 免费云空间支持ftp/asp/php/cgi/mysql/_免费域名空间pipni.cz申请和使用攻略(MYSQL+PHP+CGI+mail+FTP)...