python数据处理之0值的替换和缺失值的填充

  • 零值的替换:replace()方法里面填充的是键值对结构,注意空值必须用numpy.NaN来取而不是用字符串null
data['AvgHomeValue'] = data['AvgHomeValue'].replace({0:np.NaN})
  • 标记重复数据:用duplicated()方法
##todo  标记重复数据 并且增加新的一列dup来判断是否是重复的行 duplicated
data['dup'] = data.duplicated()
  • 去重:通过刚刚获得的 ‘ dup ’列的数据来进行去重
data_dup = data[data['dup'] == True]
data_undup = data[data['dup'] == False]
  • 缺失值的填充:

    我这里以平均值填充为例,先取出整列的平均值,形成标记列,在对缺失值进行填充(三部)。
##todo 处理缺失值
Amean =  data['Age'].mean(axis=0,skipna = True)
data['AgeFlag'] = data['Age'].isnull()
data['NewAge'] = data['Age'].fillna(Amean)

python数据处理之0值的替换缺失值的填充相关推荐

  1. python 矩阵运算出现0值_python 常见矩阵运算

    python 的 numpy 库提供矩阵运算的功能,因此我们在需要矩阵运算的时候,需要导入 numpy 的包. 1.numpy 的导入和使用 from numpy import *;#导入numpy的 ...

  2. 【Python】np.where()替换缺失值

    使用Python做数据分析时经常需要替换缺失值. 1. np.where(条件,x,y)np.where函数的结果是,如果"条件"为真,则x,否则y.2.如下import pand ...

  3. python数据处理工具-Pandas笔记

    序列与数据框的构造 Pandas模块的核心操作对象就是序列Series和数据框DataFrame序列可以理解为数据集中的一个字段数据框是指含有至少两个字段(或序列)的数据集. 构造序列 可以通过以下几 ...

  4. python替换缺失值,处理空值+生成图形+图形标准化

    本例用到的库及方法有:json库读取json文件,pandas中value_counts计数,fillna替换缺失值,空字符串替换,counts的plot方法生成图形 plot(kind='barh' ...

  5. python列表替换元素_24_Pandas.DataFrame,Series元素值的替换(replace)

    24_Pandas.DataFrame,Series元素值的替换(replace) 要替换pandas.DataFrame,pandas.Series元素的值,请使用replace()方法. 这里,将 ...

  6. python concat去除重复值语句_Python数据处理从零开始----第二章(pandas)④数据合并和处理重复值...

    目录 第二章(pandas) Python数据处理从零开始----第二章(pandas)④数据合并和处理重复值 ============================================ ...

  7. R语言缺失值替换:缺失的值(NA)替换每个分组最近的非缺失值

    R语言缺失值替换:缺失的值(NA)替换每个分组最近的非缺失值 目录 R语言缺失值替换:缺失的值(NA)替换每个分组最近的非缺失值

  8. R语言dplyr包的mutate函数将列添加到dataframe中或者修改现有的数据列:使用na_if()函数将0值替换为NA值、负收入替换为NA值

    R语言dplyr包的mutate函数将列添加到dataframe中或者修改现有的数据列:使用na_if()函数将0值替换为NA值.负收入替换为NA值 目录

  9. Python使用numpy中trim_zeros函数去除首尾0值的语法

    Python使用numpy中trim_zeros函数去除首尾0值的语法 目录 Python使用numpy中trim_zeros函数去除首尾0值的语法 #numpy中trim_zeros

最新文章

  1. 自动获取mysql建表语句_脚本工具---自动解析mysql建表语句,生成sqlalchemy表对象声明...
  2. linux排序语言,Linux sort 排序命令uniq去重复行
  3. 微型CRM SaaS应用HubSpot的一些使用截图
  4. 在你的andorid设备上运行netcore (Linux Deploy)
  5. 分阶段付款 学php,项目整理-支付宝的支付问题
  6. 【自定义Android带图片和文字的ImageButton】
  7. node js、npm、homebrew、cocoapod、git、hexo
  8. vue 将字符串最后一个字符给替换_前端开发:Vue项目实战-Music
  9. 《众妙之门——用户体验设计的秘密》一2.3 触摸至上的设计
  10. JsonCpp 入门教程
  11. Divide and conquer method
  12. 网络信息安全及常见数据加密技术
  13. mac 爱普生打印机驱动_EPSON 打印机软件
  14. 计算思维是利用计算机,计算机思维论文
  15. EF(EntityFramework) 的 CodeFirst 使用指南二(基本使用)
  16. U盘插入之后有声音但是无法显示打开U盘
  17. windows11安装日语输入法(添加输入法)
  18. Ubuntu20.04.iso光盘镜像源文件百度云下载
  19. 价值几千行代码的一键安装开源啦,欢迎各位领导莅临指导(贡献代码)
  20. Python之OpenGL笔记(17):键盘鼠标控制摄像机移动旋转

热门文章

  1. 真心求一个有pi控制的基于28335的dsp程序
  2. 计算机毕设(附源码)JAVA-SSM基于java的图书管理系统
  3. matlab简单的程序,一段简单的matlab程序 - 程序语言 - 小木虫 - 学术 科研 互动社区...
  4. 7-13 日K蜡烛图 (15 分)
  5. java 递归查询多级菜单
  6. excel转换txt文本(matlab版本)
  7. xss完成浏览器视窗炸弹
  8. 博图V17 DB块 导入 昆仑通态屏
  9. LeetCode-824. Goat Latin(字符串分割)
  10. pythonif嵌套层数太多怎么办_优化过多的if else嵌套