influxdb 最近小时统计_用pandas快速统计学生年龄班级等分组信息
最近收到一个求助邮件,他的需求如下:
我是小学的一名统计员,因长期做统计工作,近期,自学一点python,但如何把excel中的8位数出生日期转成年龄,一直做不好,现请您帮忙一下,不知能否帮!
这个问题其实比较简单,做出来的最终形式如下:
主要涉及格式转换和分组统计的需求,那么我们就开始一步一步的完成这一次的任务。
1、读入excel文件
import pandas as pdfile_name = r'学生信息表.xlsx'data = pd.read_excel(file_name)data
输出:
读入数据2、处理出生日期,转化为时间格式这次我们用pandas自带的to_datetime函数,好用快捷。
data['出生日期'] = pd.to_datetime(data['出生日期'],format='%Y%m%d')
3、增加一列年龄引入datetime包,根据当前时间的year减去出生日期得到。
import datetime as dtnow = dt.datetime.today().yeardata['周岁'] = now - data['出生日期'].dt.year
输出:
新加周岁列
4、对周岁、性别同时分组
熟悉教程的小伙伴知道,这一期的分组内容其实可以用pandas的透视表pivot_table函数解决。
这次我们就用另一种方法:groupby函数同样能搞定。
#开始分组统计age = data.groupby(['周岁','性别'])age_group = age.agg({'学生姓名':'count'}).T
输出:
周岁,性别分组结果
5、如果需要求和数据a.我们可以先对所有数据进行分组统计一次 b.再单独对女生数据统计一次c.最后把两次的统计数据合并起来合并分组
age_single = data.groupby(['周岁'])age_single_group = age_single.agg({'学生姓名':'count'}).Tage_single_group.index = ['合计']
仅女生数据
age_single_female = data[data['性别'] == '女'].groupby(['周岁'])age_single_female_group = age_single_female.agg({'学生姓名':'count'}).Tage_single_female_group.index = ['仅女生']
合并数据
age_union = pd.concat([age_single_group,age_single_female_group],join='outer')age_union.fillna(0)
输出:
这样就完成了年级的分组统计,其他的按年级分组,或者地区分组也是类似的。是不是一步步写过来感觉pandas特别好用,特别简单。
- END -
文源网络,仅供学习之用,如有侵权,联系删除。往期精彩
◆ 50款开源工具你都用过吗?
◆ python+C、C++混合编程的应用
◆ python网络爬虫的基本原理详解
◆ Python自动操控excel,一小时解决你一天的工作
◆ 如何用Python增强Excel,减少处理复杂数据的痛苦?
influxdb 最近小时统计_用pandas快速统计学生年龄班级等分组信息相关推荐
- python计算学生年龄_用pandas快速统计学生年龄班级等分组信息
最近收到一个求助邮件,他的需求如下: 我是小学的一名统计员,因长期做统计工作,近期,自学一点python,但如何把excel中的8位数出生日期转成年龄,一直做不好,现请您帮忙一下,不知能否帮! 这个问 ...
- python关键词统计_使用Python快速统计关键词及其词频
版权声明:转载附链接哦.https://blog.csdn.net/weixin_43886356/article/details/86711012 思路: 1.通过jieba库分词获取所有的词语列表 ...
- pandas 作图 统计_解决pandas 作图无法显示中文的问题
最近开始使用 pandas 处理可视化数据,挖掘信息.但是在作图时遇到,无法显示中文的问题. 下面这段代码是统计 fujian1.csv 文件中 City 所在列中各个城市出现次数的代码.可是作图直方 ...
- java写类似百度统计_资讯 | 与百度统计功能类似的产品—360分析系统
原标题:资讯 | 与百度统计功能类似的产品-360分析系统 360自主研发的商业推广投放效果统计分析产品"360分析"近日已全流量上线,该产品为广告主量身定制,可实现对360推广点 ...
- mysql 非自然月统计_技本功|统计信息对SQL执行效率的影响
点击蓝字 关注我们 在正文开始前,我们先补充一轮知识点. DING! 什么叫统计信息? 统计信息是数据库对所有表信息进行数据抽样后得出的数据统计,它是一个数据库优化器选择最佳执行计划的核心依据. 什么 ...
- jieba库词频统计_用jieba库统计文本词频及云词图的生成
一.安装jieba库 :\>pip install jieba #或者 pip3 install jieba 二.jieba库解析 jieba库主要提供提供分词功能,可以辅助自定义分词词典. j ...
- python做统计_利用 Python 进行统计
你将学到什么 Create and interpret data visualizations using the Python programming language and associated ...
- 人流量统计api接口_人数统计_区域人数实时统计
对于输入的一张图片(可正常解码,且长宽比适宜),识别和统计图像当中的人体个数(静态统计,不支持追踪和去重). 适用于3米以上的中远距离俯拍,以头部为识别目标统计图片中的瞬时人数:无人数上限,广泛适用于 ...
- python成绩统计_用Python操作Excel,实现班级成绩的统计
本次是在原来有一定格式的Excel文档中补充成绩. 安装的模块:xlwt . xlrd .xlutils xlrd的模块是只用读取xls文件,不能写文件,同理xlwt,只(新建写)不读已有的xls, ...
最新文章
- pytorch 测试每一类_DeepFM全方面解析(附pytorch源码)
- 播客#47:劳伦斯·布拉德福德
- 窗口属性 客户矩形_航空公司客户价值分析
- FIFO IP设计说明
- 今天拿到了同事给我买的《java与模式》
- 托管型呼叫中心与自建型呼叫中心的区别
- SAP License:ERP顾问们,为何你会面试失败?
- webpack4导入全局sass文件
- snprintf的返回值代表字节数 != 实际写入字节数
- 【下载】跨越鸿沟:颠覆性产品营销圣经-杰弗里·摩尔电子书下载(pdf,epub,mobi,txt)
- 一文搞懂MEMS传感器产业链(最全解析!)
- 搜索引擎背后的经典数据结构和算法
- HDU4622 Reincarnation
- 第三只眼与另一个世界
- 前端的扁平化是什么意思
- 微信小程序开发消息推送配置教程
- 测试必会Linux命令
- WMS设计开发方法及选购思路
- ESP32 寻迹模块测试
- 腾讯企业 html邮件模板,腾讯企业邮箱DMARC设置指南(TXT记录)