import pandas as pd# 显示所有列,行
# pd.set_option('display.max_columns', None)
# pd.set_option('display.max_rows', None)
# pd.set_option('max_colwidth',100)# 读取文件
df = pd.read_csv("z:/clear1.csv", encoding="utf-8", low_memory=True)
print(df.head())
# 查询平方差(控制统计)
nan_mean = df.isna().mean()
nan_mean = nan_mean[nan_mean != 0].sort_values()
print(nan_mean)
# 日期格式
dt_series = pd.to_datetime(df["issue_d"])
df["year"] = dt_series.dt.year
# 筛选
df = df.loc[df["year"] >= 2014]
print(df["year"].value_counts())
# 删除
df.drop(["total_bal_ex_mort", 'tot_coll_amt', 'sub_grade'], axis=1, inplace=True)
# 删除指定内容的行
df = df[~ df['issue_d'].str.contains('issue_d')]
# 统计指定列
print(df["issue_d"].value_counts(sort=True))
print(df)
# 保存数据
df.to_csv("z:/clear1.csv", index=False, encoding="utf-8")

转载于:https://www.cnblogs.com/jumpkin1122/p/11509771.html

pandas数据清洗的一些操作相关推荐

  1. 2.pandas数据清洗

    2.pandas数据清洗 pandas是用于数据清洗的库,安装配置pandas需要配置许多依赖的库,而且安装十分麻烦. 解决方法:可以用Anaconda为开发环境,Anaconda内置了许多有关数据清 ...

  2. python能实现excel什么功能_Python pandas对excel的操作实现示例

    最近经常看到各平台里都有Python的广告,都是对excel的操作,这里明哥收集整理了一下pandas对excel的操作方法和使用过程.本篇介绍 pandas 的 DataFrame 对列 (Colu ...

  3. python pandas 读取excel 去重某一列_Python中Pandas读取修改excel操作攻略(代码示例)...

    本篇文章给大家带来的内容是关于Python中Pandas读取修改excel操作攻略(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 环境:python 3.6.8 以某米赛 ...

  4. 数据科学 IPython 笔记本 7.6 Pandas 中的数据操作

    7.6 Pandas 中的数据操作 原文:Operating on Data in Pandas 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是<Python 数据科学手册>(P ...

  5. python pandas数据清洗:sample()函数

    DataFrame.sample DataFrame.sample方法主要是用来对DataFrame进行简单随机抽样的. PS:这里说的是简单随机抽样,表示是不能用来进行系统抽样.分层抽样的. Dat ...

  6. pandas中的concat操作

    文章目录 前言 一.表结构相同,首尾合并 二.横向表连接 三.交叉合并 总结 前言 本文将介绍pandas中concat的数据合并方式,包括首位合并.横向表合并和交叉合并 一.表结构相同,首尾合并 # ...

  7. python pandas excel 排序_Python pandas对excel的操作实现示例

    最近经常看到各平台里都有Python的广告,都是对excel的操作,这里明哥收集整理了一下pandas对excel的操作方法和使用过程.本篇介绍 pandas 的 DataFrame 对列 (Colu ...

  8. Pandas数据表关联操作

    pandas数据表关联操作 Pandas具有功能全面的高性能内存中连接操作,与SQL等关系数据库非常相似. Pandas提供了一个单独的merge()函数,作为DataFrame对象之间所有标准数据库 ...

  9. python read_excel 参数_详解pandas库pd.read_excel操作读取excel文件参数整理与实例

    详解pandas库pd.read_excel操作读取excel文件参数整理与实例 来源:中文源码网    浏览: 次    日期:2019年11月5日 详解pandas库pd.read_excel操作 ...

  10. pandas数据清洗:案例详解 fillna函数 填补空缺值

    pandas数据清洗:fillna函数填补空缺值 1 fillna函数简介 2 填补空缺值3种方法 2.1 构建学习数据 2.2 填补特定值 2.3 用前一个非空缺值填充 2.4 用后一个非空缺值填充 ...

最新文章

  1. Spring - @ControllerAdvice + @ExceptionHandler全局处理Controller层异常(转)
  2. c++中虚函数和纯虚函数定义
  3. 解决 No module named ‘PyQt5.QtWebEngineWidgets‘
  4. JS之返回数组指定元素的slice
  5. Written English-书面-一般过去时
  6. DropDownList实现无限分级
  7. FPGA _Verilog HDL_8位加法计数器设计实验
  8. java实现保存一张图片_Java图片剪裁并保存的代码实现
  9. 好消息,MaxtoCode 1.10 已经封包,待2005.5.5日发布(如果有Bug将在1.20改正)
  10. Java开源电商系统
  11. 深度学习技术在不同方向的应用及相关开源项目
  12. 计算机锁屏图片怎么设置方法,电脑锁屏照片怎么设置
  13. 国内自由下载jar包的地址
  14. PDPS软件:带颜色的机器人工作站二维布局图JT格式文件转换方法
  15. 容器技术在企业落地的最佳实践
  16. 双绞线与PCB差分信号布线
  17. 查看linux下tomcat启动日志
  18. 武夷山停排事件内幕调查
  19. brew 一直等待_58岁上海股神自爆交易铁则:80%时间的等待+20%的时间操作,精髓...
  20. fan4801开关电源原理图_FAN41501

热门文章

  1. latex 在线表格编辑器
  2. 英雄联盟登陆服务器显示外文,英雄联盟手游进不去出现英文怎么办 进不去出现英文解决方法[多图]...
  3. 1946计算机用途,计算机在我们的工作、生活中的作用越来越大, 你知道计算机的起源于发展吗?请就计算机的发明时间(1946年)、大小、用途等...
  4. 技术总监岗位职责和要求
  5. 也谈谈如何胜任中小型公司的技术总监
  6. 【读后感】薛兆丰经济学讲义
  7. linux驱动开发(三):Linux字符设备驱动实例
  8. ARM芯片学习内容规划及ARM开发环境的搭建
  9. 宇枫资本投资理财投资入门与技巧
  10. 基于 HTML5 + WebGL 的太阳系 3D 展示系统