"""
分组统计一个时间段内的数据,如三个月内,但不限于某个时间起止,是任何三个月的长度内
"""import pandas as pd
import openpyxl
import datetime
import numpy as npdf = pd.DataFrame(pd.read_excel('F:/test/三个月内出现大于三次记录.xlsx',sheet_name = 'Sheet1'))
#将str类型转为时间类型
df['入院日期'] = pd.to_datetime(df['入院日期'])djxh = set()
#通过groupby进行分组
for groupName, groupDf in df.groupby('身份证号'):#遍历分组里的行for index,row in groupDf.iterrows():# + datetime.timedelta(days = 92)表示加上92天(三个月)startDate = pd.to_datetime(row['入院日期'])if groupDf[(startDate < groupDf['入院日期']) & (groupDf['入院日期'] <startDate + datetime.timedelta(days = 92))].count()['身份证号'] > 3:#符合条件的添加到集合当中djxh.add(groupName) #这里只要符合条件的就退出循环,根据实际情况设置break#筛选符合条件的数据,astype(str)转为str类型,空值将变为'nan',如果不转为str类型,int类型保存到excel时会丢失数据,最后几位变为0
df2 = df[df['身份证号'].isin(djxh)].astype(str)
#将'nan'值替换为空,这样在excel中空值不保存为nan
df2 = df2.replace('nan', np.nan)
#保存到excel
print(df2)
df2.to_excel("F:/test/三个月内出现-(已去重).xlsx")print("sucess")

python excel 分组统计一个时间段内的数据,如三个月内,但不限于某个时间起止,是任何三个月的长度内相关推荐

  1. Excel 分组统计不重复项

    Excel 分组统计不重复项 通过数据透视表,详见链接 链接: link.

  2. Python利用PyQt5制作一个获取网络实时数据NBA数据播报GUI

    现在NBA联赛也进行到半决赛了,我们怎么样才能以更快的方法获取NBA的数据呢?这里我们就自己来做一个数据播报的程序 文章目录 制作NBA数据爬虫 捋顺思路 编写代码 NBAReporter.py NB ...

  3. Excel怎么统计合并单元格后面数据总和

    今天小编跟大家分享一下Excel怎么统计合并单元格后面数据总和 1.打开Excel文件 2.找到并点击下图选项(Excel工具箱,百度即可了解详细下载安装信息,本文这里就不做详细解说.) 3.点击[统 ...

  4. 【统计技术】运营商数据:三大运营商2012年1月手机用户数据

    [统计技术]运营商数据:三大运营商2012年1月手机用户数据 by huawei [导读]数据来源于3大运营商官方网站,最新发布的数据显示: 1)截至2012年1月底,中国累计手机用户9.88亿户,其 ...

  5. python分组统计_python数据分析8:数据分组统计

    1.根据给定的条件将数据拆分成组 2.每个组都可以独立应用函数(如求和,求平均值) 3.将结果合并到一个数据结构中 DataFrame.groupby(by=None,axis=0,level=Non ...

  6. python 数据分组后看每组多少个_【Python】分组统计GroupBy技术详解

    摘要 进行数据分析时,GroupBy分组统计是非常常用的操作,也是十分重要的操作之一.基本上大部分的数据分析都会用到该操作,本文将对Python的GroupBy分组统计操作进行讲解. 1.GroupB ...

  7. Excel怎么统计多行多列数据出现的重复次数

    今天跟大家分享一下怎么统计多行多列数据出现的重复次数 1.我们想要统计课程表中.每周各个科目一共上了多少节. 2.首先我们选中课程数据单元格区域 3.点击下图选项(Excel工具箱,百度即可了解详细下 ...

  8. python excel 之 按格式生成图表和数据

    python excel 针对python 对excel的操作目前有已经有很多库可以使用, 比如最常用的读写库xlrd,xlwt,xlutils 对xlsx.xlsm读写的openpyxl 针对xls ...

  9. MySQL连表分组统计使用count查询出数据不准确问题解决方案

    先上两副图 这里有两张表:score表和year_as表,要求统计出score表按年份分组的个数,且查询出来的内容需要包括year_as表中的year_as字段. 使用正常连表并分组统计count得出 ...

最新文章

  1. 深度卷积生成对抗网络
  2. VTK:K均值聚类用法实战
  3. mysql 5.7.20主从配置_mysql5.7.20免安装版配置方法图文教程
  4. Spring Boot 解决跨域Cors问题
  5. 第八篇: 消息总线(Spring Cloud Bus)(Finchley版本)V2.0_dev
  6. Phpstorm-php在线手册配置
  7. paip.Image对象出现“对象当前正在其他地方使用或者GDI+中发生一般性错误的解决
  8. SQL Server 2012 中 SSAS 多维数据浏览器已经废除
  9. Setup Factory操作注册表
  10. Live reload
  11. 语音识别字幕_语音识别字幕软件_自动识别语音生成字幕 - 云+社区 - 腾讯云
  12. 【Python打卡2019】20190423之52周存钱挑战-for+range()函数使用
  13. AutoCAD中添加块和块参照(转载)
  14. 《红楼梦》的香气空白
  15. idea项目名称重命名
  16. Proftpd安装与配置
  17. win10电脑右击新建没有Word、Excel怎么办
  18. 苹果自带高德地图搜索周边功能
  19. 安卓开发用什么语言好!这是一份用心整理的Android面试总结,已拿offer入职
  20. 视频号日引流500+精准流量6大玩法,实现微信后端转化变现丨国仁网络资讯

热门文章

  1. SAPUI5教程——ABAP环境下SAP Fiori 系统搭建以及开发实践
  2. unity给头发添加物理_unity3d Hair real time rendering 真实头发实时渲染
  3. 学习的答案:为终身学习者赋能
  4. 空间复杂度计算超全整理!!(一起手撕复杂度计算
  5. php生成二维码并下载图片(适应于框架)
  6. 价目表报价单微信小程序
  7. Windows RDP协议中对 Windows 用户密码加密库使用
  8. 卡莱特递交注册:年营收5.8亿 周锦志控制63%股权
  9. Namenode学习
  10. Uefi hexedit 源码分析