1、数据清洗检查空值:

df[df.isna().values == True]

df = df.dropna(how='any', axis=0)

2、数据清洗去重

df1.drop_duplicates(subset=['user_id','item_id','time'],keep='first',inplace=True)

df1.info()

3、DataFrame数据的set_index() 和reset_index()set_index()

In [307]: data

Out[307]:

a b c d

0 bar one z 1.0

1 bar two y 2.0

2 foo one x 3.0

3 foo two w 4.0

In [308]: indexed1 = data.set_index('c') #单索引

In [309]: indexed1

Out[309]:

a b d

c

z bar one 1.0

y bar two 2.0

x foo one 3.0

w foo two 4.0

In [310]: indexed2 = data.set_index(['a', 'b'])#复合索引

In [311]: indexed2

Out[311]:

c d

a b

bar one z 1.0

two y 2.0

foo one x 3.0

two w 4.0reset_index():

reset_index可以还原索引,重新变为默认的整型索引

DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=”)

level控制了具体要还原的那个等级的索引

drop为False则索引列会被还原为普通列,否则会丢失

In [318]: data

Out[318]:

c d

a b

bar one z 1.0

two y 2.0

foo one x 3.0

two w 4.0

In [319]: data.reset_index()

Out[319]:

a b c d

0 bar one z 1.0

1 bar two y 2.0

2 foo one x 3.0

3 foo two w 4.0

4、dataframe 分组 并 求和

#按照站点名称分组

temp_number = data.groupby(['站点名称']).size()

temp_number.index = ['A','B','C','D','E','F']

print(temp_number)

#筛选站点ABC的记录并按照多个字段分别求和

data_ABC = data[(data['站点名称']=='站点A')|(data['站点名称']=='站点B')|(data['站点名称']=='站点C')]

data_ABC.groupby(['站点名称']).agg({'仪表不整':sum})#只按照一列求和

#按照多列求和

data_ABC.groupby(['站点名称']).agg({'仪表不整':sum,'超时送达':sum,'送达不通知':sum,'提前点送达':sum,'骚扰威胁':sum,'其他':sum,'送错餐品':sum,'态度不好':sum,'少餐/洒餐':sum})

5、dataframe列名重命名

data_A = data_A.rename(columns={'index':'原因','count':'数量'})

python打卡记录去重_Python笔记记录相关推荐

  1. python打卡记录去重_python中对list去重的多种方法

    今天遇到一个问题,在同事随意的提示下,用了 itertools.groupby 这个函数.不过这个东西最终还是没用上. 问题就是对一个list中的新闻id进行去重,去重之后要保证顺序不变. 直观方法 ...

  2. 中文python笔记_Python笔记记录

    python2和python3的不同: Unicode(统一码.万国码),在3里面可以直接写中文了. python2里rae_input与python3中的input效果一样 在计算机内存中,统一用U ...

  3. python做实时温度曲线图_Python学习记录 - matplotlib绘制温度变化折线图

    Python学习记录 - matplotlib绘制温度变化折线图 Python学习记录 - matplotlib绘制温度变化折线图 题目:列表a表示10点到12点每一分钟的气温,累计为2个小时,绘制折 ...

  4. python小括号报错_Python学习记录:括号配对检测问题

    Python学习记录:括号配对检测问题 一.问题描述 在练习Python程序题的时候,我遇到了括号配对检测问题. 问题描述:提示用户输入一行字符串,其中可能包括小括号 (),请检查小括号是否配对正确, ...

  5. python连接linux获取日志_Python 日志记录模块logging的使用

    shell当中记录log,满眼花花的重定向符合,看着很不爽有没有!我喜欢Python,就是喜欢这种买个手电筒,备用电池都准备好了的感觉.logging模块很简单,导入模块,定义日志格式.代码中就可以通 ...

  6. python多线程怎么写日志_Python日志记录在多进程下的使用

    1. 问题描述 项目中,使用RotatingFileHandler根据日志文件大小来切分日志.设置文件的MaxBytes为1GB, backupCount大小为5. 经查看,发现日志文件的大小均小于1 ...

  7. python增量赋值是什么_python学习记录20190122_增量赋值

    python中的增量赋值 一,在python中a=a+b和a+=b有区别吗 **1,对可变的数据类型 a=[1,2,3] print(id(a)) #1602469350792 b=[4,5] a=a ...

  8. python stdout stderr 一起输出_Python日志记录在stdout和stderr之间拆分

    Is it possible to have python logging messages which are INFO or DEBUG to go to stdout and WARNING o ...

  9. python访问陌生人qq空间_python程序记录QQ空间条说说的访问详情

    3.[代码]主要代码文件 #!python # coding=utf-8 import qqlib, getpass, json, time, sys, codecs reload(sys) sys. ...

最新文章

  1. Android开发--多媒体应用开发(一)--MediaPlayer的使用介绍
  2. JS基础语法(05)-隐式数据类型转换
  3. jQuery基础--样式篇(3)
  4. vi交互式批量替换 vi批量替换 vi查找和替换
  5. 物联网协议比较 MQTT CoAP RESTful/HTTP XMPP
  6. Java基础---循环结构+例题
  7. Python批量修改Word文档中特定关键字的颜色
  8. Install Eclipse 3.7 Indigo and configure Eclipse
  9. python学习笔记--Django入门二 Django 的模板系统
  10. E-Prime 2.0 用了一段时间出现警告信息无法编辑实验程序
  11. JAVA处理字符串压缩以及文件压缩
  12. 360优化开机速度后慢了_电脑开机速度慢的原因及解决方法
  13. 漫步STL-string in [Cpp] v.s. String in [Java]
  14. java类定义初成员变量赋值_Java中成员变量初始化
  15. python库源码分析_python第三方库Faker源码解读
  16. BUCK电流检测分析
  17. HP前中国CEO孙振耀:关于工作与生活
  18. zabbix5.0监控esxi和vcenter
  19. 井字棋小游戏代码(Visual Studio)
  20. openstack研究意义_OpenStack如何推动CERN的研究

热门文章

  1. 非常适合小白的 Asyncio 教程
  2. “12306” 的架构到底有多牛逼?
  3. 程序员的日常竟然是这样,真的是又心疼又好笑······
  4. 电脑桌面整个都变大了_三招拯救你的电脑桌面,堪比整容!
  5. 树形结构:二叉树,分治,合并子树,递归
  6. CodeForces 906D (欧拉降幂)
  7. Javaweb开发环境与搭建
  8. Linux命令之sftp - 安全文件传输命令行工具
  9. 我的Android进阶之旅------gt;Android 关于arm64-v8a、armeabi-v7a、armeabi、x86下的so文件兼容问题...
  10. poj 3590 The shuffle Problem(置换群+DP)