最近收到一个求助邮件,他的需求如下:

我是小学的一名统计员,因长期做统计工作,近期,自学一点python,但如何把excel中的8位数出生日期转成年龄,一直做不好,现请您帮忙一下,不知能否帮!

这个问题其实比较简单,做出来的最终形式如下:

主要涉及格式转换和分组统计的需求,那么我们就开始一步一步的完成这一次的任务。

1、读入excel文件

import pandas as pdfile_name = r'学生信息表.xlsx'data = pd.read_excel(file_name)data

输出:

读入数据2、处理出生日期,转化为时间格式这次我们用pandas自带的to_datetime函数,好用快捷。

data['出生日期'] = pd.to_datetime(data['出生日期'],format='%Y%m%d')

3、增加一列年龄引入datetime包,根据当前时间的year减去出生日期得到。

import datetime as dtnow = dt.datetime.today().yeardata['周岁'] = now - data['出生日期'].dt.year

输出:

新加周岁列

4、对周岁、性别同时分组

熟悉教程的小伙伴知道,这一期的分组内容其实可以用pandas的透视表pivot_table函数解决。

这次我们就用另一种方法:groupby函数同样能搞定。

#开始分组统计age = data.groupby(['周岁','性别'])age_group  = age.agg({'学生姓名':'count'}).T

输出:

周岁,性别分组结果

5、如果需要求和数据a.我们可以先对所有数据进行分组统计一次 b.再单独对女生数据统计一次c.最后把两次的统计数据合并起来合并分组

age_single = data.groupby(['周岁'])age_single_group = age_single.agg({'学生姓名':'count'}).Tage_single_group.index = ['合计']

仅女生数据

age_single_female = data[data['性别'] == '女'].groupby(['周岁'])age_single_female_group = age_single_female.agg({'学生姓名':'count'}).Tage_single_female_group.index = ['仅女生']

合并数据

age_union = pd.concat([age_single_group,age_single_female_group],join='outer')age_union.fillna(0)

输出:

这样就完成了年级的分组统计,其他的按年级分组,或者地区分组也是类似的。是不是一步步写过来感觉pandas特别好用,特别简单。

- END -

文源网络,仅供学习之用,如有侵权,联系删除。往期精彩

◆  50款开源工具你都用过吗?

◆  python+C、C++混合编程的应用

◆  python网络爬虫的基本原理详解

◆  Python自动操控excel,一小时解决你一天的工作

◆  如何用Python增强Excel,减少处理复杂数据的痛苦?

influxdb 最近小时统计_用pandas快速统计学生年龄班级等分组信息相关推荐

  1. python计算学生年龄_用pandas快速统计学生年龄班级等分组信息

    最近收到一个求助邮件,他的需求如下: 我是小学的一名统计员,因长期做统计工作,近期,自学一点python,但如何把excel中的8位数出生日期转成年龄,一直做不好,现请您帮忙一下,不知能否帮! 这个问 ...

  2. python关键词统计_使用Python快速统计关键词及其词频

    版权声明:转载附链接哦.https://blog.csdn.net/weixin_43886356/article/details/86711012 思路: 1.通过jieba库分词获取所有的词语列表 ...

  3. pandas 作图 统计_解决pandas 作图无法显示中文的问题

    最近开始使用 pandas 处理可视化数据,挖掘信息.但是在作图时遇到,无法显示中文的问题. 下面这段代码是统计 fujian1.csv 文件中 City 所在列中各个城市出现次数的代码.可是作图直方 ...

  4. java写类似百度统计_资讯 | 与百度统计功能类似的产品—360分析系统

    原标题:资讯 | 与百度统计功能类似的产品-360分析系统 360自主研发的商业推广投放效果统计分析产品"360分析"近日已全流量上线,该产品为广告主量身定制,可实现对360推广点 ...

  5. mysql 非自然月统计_技本功|统计信息对SQL执行效率的影响

    点击蓝字 关注我们 在正文开始前,我们先补充一轮知识点. DING! 什么叫统计信息? 统计信息是数据库对所有表信息进行数据抽样后得出的数据统计,它是一个数据库优化器选择最佳执行计划的核心依据. 什么 ...

  6. jieba库词频统计_用jieba库统计文本词频及云词图的生成

    一.安装jieba库 :\>pip install jieba #或者 pip3 install jieba 二.jieba库解析 jieba库主要提供提供分词功能,可以辅助自定义分词词典. j ...

  7. python做统计_利用 Python 进行统计

    你将学到什么 Create and interpret data visualizations using the Python programming language and associated ...

  8. 人流量统计api接口_人数统计_区域人数实时统计

    对于输入的一张图片(可正常解码,且长宽比适宜),识别和统计图像当中的人体个数(静态统计,不支持追踪和去重). 适用于3米以上的中远距离俯拍,以头部为识别目标统计图片中的瞬时人数:无人数上限,广泛适用于 ...

  9. python成绩统计_用Python操作Excel,实现班级成绩的统计

    本次是在原来有一定格式的Excel文档中补充成绩. 安装的模块:xlwt . xlrd .xlutils xlrd的模块是只用读取xls文件,不能写文件,同理xlwt,只(新建写)不读已有的xls, ...

最新文章

  1. pytorch 测试每一类_DeepFM全方面解析(附pytorch源码)
  2. 播客#47:劳伦斯·布拉德福德
  3. 窗口属性 客户矩形_航空公司客户价值分析
  4. FIFO IP设计说明
  5. 今天拿到了同事给我买的《java与模式》
  6. 托管型呼叫中心与自建型呼叫中心的区别
  7. SAP License:ERP顾问们,为何你会面试失败?
  8. webpack4导入全局sass文件
  9. snprintf的返回值代表字节数 != 实际写入字节数
  10. 【下载】跨越鸿沟:颠覆性产品营销圣经-杰弗里·摩尔电子书下载(pdf,epub,mobi,txt)
  11. 一文搞懂MEMS传感器产业链(最全解析!)
  12. 搜索引擎背后的经典数据结构和算法
  13. HDU4622 Reincarnation
  14. 第三只眼与另一个世界
  15. 前端的扁平化是什么意思
  16. 微信小程序开发消息推送配置教程
  17. 测试必会Linux命令
  18. WMS设计开发方法及选购思路
  19. ESP32 寻迹模块测试
  20. 腾讯企业 html邮件模板,腾讯企业邮箱DMARC设置指南(TXT记录)

热门文章

  1. mysql 不join的原因
  2. yum标准化安装nginx最新版
  3. 人人都会设计模式:03-策略模式--Strategy
  4. Python-练习7
  5. WLAN产品形态之分层架构
  6. c++测试题2016-6-2
  7. “开启IT管理新时代”惠普软件客户论坛圆满闭幕
  8. 选好的两组台式机配置
  9. 如何建立程序代码包的联接?
  10. numpy.cov()和numpy.var()的用法