记录一下pandas的分组统计功能,agg
主要是记录一下pandas学习,最近要统计一个数据,我向以前stata里面有一个很好用的函数,就是tabstat,可以分组统计,并且输出很多指标。
最近处理数据我的数据是这样的。
我向按照 valid_num分组,统计avg_stand的均值,标准差,最大,最小。最先想到是的stata的tabstat,以前用的很舒服。现在换python了。感觉可以用groupby,但是不知道怎么用。百度了 一下。
group1 = df_avg.groupby('valid_num')
group1['avg_stand'].agg(['mean', 'std', 'count'])
可以这么用就,输出一些,基本上是想要的。
可以得到这个结果。
另外,我需要把 valid_num分一个组,比如分成,
valid_grp = pd.cut(valid_num, [0, 1, 2, 3, 4, 5, 10, 50, 100, 200])
分完组之后,在统计,也是可以的。
df_avg['vld_grp'] = valid_grpgroup2 = df_avg.groupby('vld_grp')
group2['avg_stand'].agg(['mean', 'std', 'max', 'min', 'median']).to_clipboard()
得到结果是:
记录一下pandas的分组统计功能,agg相关推荐
- Python数据分析pandas之分组统计透视表
Python数据分析pandas之分组统计透视表 数据聚合统计 Padans里的聚合统计即是应用分组的方法对数据框进行聚合统计,常见的有min(最小).max(最大).avg(平均值).sum(求和) ...
- 利用bobo-browse 实现lucene的分组统计功能
bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能. 可以从http://sna-projects.com/bobo/上下载和查看相关文档 ...
- MongoDB 分组统计
[摘要] MongoDB 在进行分组统计时如果面对一些比较复杂的计算情况,往往会遇到 shell 脚本过于复杂的问题.而集算器 SPL 语言,则因其有丰富的函数库及易用性恰好能弥补 Mongo 这方面 ...
- spss分组统计的方法
在做数据分析的时候,用的工具是excel,spss和oracle.因为对spss不了解,分组统计的活一直靠写sql,单调重复的工作让人烦躁,而且容易出错.后来发现spss有很好的分组统计功能,以二维数 ...
- lucene实现分组统计的方法
转:http://www.cnblogs.com/huangfox/archive/2012/07/10/2584750.html http://blog.163.com/liugangc@126/b ...
- pandas分组统计 - groupby功能
数据分组 分组统计 - groupby功能 ① 根据某些条件将数据拆分成组 ② 对每个组独立应用函数 ③ 将结果合并到一个数据结构中 Dataframe在行(axis=0)或列(axis=1)上进行分 ...
- pandas相关函数sort_values、字符串处理、index、merge、数据合并cancat、groupby分组统计
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.排序函数sort_values() 二.字符串处理 1.介绍 2.代码介绍 3.Categorical类型降低数据 ...
- Pandas数据分析—groupby分组统计
13.Pandas中groupby分组统计 文章目录 13.Pandas中groupby分组统计 前言 一.分组使用聚合函数做数据统计 1.准备数据 二.遍历groupby的结果理解执行流程 三.实例 ...
- pandas对数据进行分组统计
pandas对数据进行分组统计 文章目录 pandas对数据进行分组统计 前言 一.分组后进行sum操作 二.分组后进行迭代操作 三.分组后进行聚合agg操作 四.使用自定义函数进行统计 五.使用di ...
最新文章
- Linq基础知识小记二
- 经济学人: 低调应用, 高调回报, 亚马逊才是AI技术最大受益企业
- ubuntu 下的ftp安装及root身份远程配置
- C++string容器-字符串拼接
- chrome瀏覽器去掉緩存的方法
- PWN-PRACTICE-BUUCTF-14
- linux某个线程信号唤醒,linux多线程编程--信号量和条件变量 唤醒丢失事件
- bat文件打开cmd并且运行cmd命令
- html自动排版 vs,Visual Stidio Code (vscode)自定义HTML页面自动生成格式
- 服务器主板支持什么cpu,怎么看主板支持什么CPU(主板和cpu兼容搭配知识)
- 模拟人生4 Mac(经营模拟游戏)全DLC可无限金币版
- 一个int类型到底占多少个字节
- FREERTOS必备知识-喂狗-死机
- 快马探营:移动MM“热料”解密
- Android P 外置 SD 卡写入权限问题
- 为Excel单元格后面统一添加一个字符,导Excel数据到数据库
- Adas常用实验仪器和设备:RT3000/RTrange/IMU/INS/RTK等
- Java | javac中常见参数
- 计算机学校要学籍吗,对普通高中学校学籍档案信息化管理相关问题的几点探讨...
- 基于php的房屋销售管理系统