主要是记录一下pandas学习,最近要统计一个数据,我向以前stata里面有一个很好用的函数,就是tabstat,可以分组统计,并且输出很多指标。

最近处理数据我的数据是这样的。

我向按照 valid_num分组,统计avg_stand的均值,标准差,最大,最小。最先想到是的stata的tabstat,以前用的很舒服。现在换python了。感觉可以用groupby,但是不知道怎么用。百度了 一下。

group1 = df_avg.groupby('valid_num')
group1['avg_stand'].agg(['mean', 'std', 'count'])

可以这么用就,输出一些,基本上是想要的。

可以得到这个结果。

另外,我需要把 valid_num分一个组,比如分成,

valid_grp = pd.cut(valid_num, [0, 1, 2, 3, 4, 5, 10, 50, 100, 200])

分完组之后,在统计,也是可以的。

df_avg['vld_grp'] = valid_grpgroup2 = df_avg.groupby('vld_grp')
group2['avg_stand'].agg(['mean', 'std', 'max', 'min', 'median']).to_clipboard()

得到结果是:

记录一下pandas的分组统计功能,agg相关推荐

  1. Python数据分析pandas之分组统计透视表

    Python数据分析pandas之分组统计透视表 数据聚合统计 Padans里的聚合统计即是应用分组的方法对数据框进行聚合统计,常见的有min(最小).max(最大).avg(平均值).sum(求和) ...

  2. 利用bobo-browse 实现lucene的分组统计功能

    bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能. 可以从http://sna-projects.com/bobo/上下载和查看相关文档 ...

  3. MongoDB 分组统计

    [摘要] MongoDB 在进行分组统计时如果面对一些比较复杂的计算情况,往往会遇到 shell 脚本过于复杂的问题.而集算器 SPL 语言,则因其有丰富的函数库及易用性恰好能弥补 Mongo 这方面 ...

  4. spss分组统计的方法

    在做数据分析的时候,用的工具是excel,spss和oracle.因为对spss不了解,分组统计的活一直靠写sql,单调重复的工作让人烦躁,而且容易出错.后来发现spss有很好的分组统计功能,以二维数 ...

  5. lucene实现分组统计的方法

    转:http://www.cnblogs.com/huangfox/archive/2012/07/10/2584750.html http://blog.163.com/liugangc@126/b ...

  6. pandas分组统计 - groupby功能

    数据分组 分组统计 - groupby功能 ① 根据某些条件将数据拆分成组 ② 对每个组独立应用函数 ③ 将结果合并到一个数据结构中 Dataframe在行(axis=0)或列(axis=1)上进行分 ...

  7. pandas相关函数sort_values、字符串处理、index、merge、数据合并cancat、groupby分组统计

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.排序函数sort_values() 二.字符串处理 1.介绍 2.代码介绍 3.Categorical类型降低数据 ...

  8. Pandas数据分析—groupby分组统计

    13.Pandas中groupby分组统计 文章目录 13.Pandas中groupby分组统计 前言 一.分组使用聚合函数做数据统计 1.准备数据 二.遍历groupby的结果理解执行流程 三.实例 ...

  9. pandas对数据进行分组统计

    pandas对数据进行分组统计 文章目录 pandas对数据进行分组统计 前言 一.分组后进行sum操作 二.分组后进行迭代操作 三.分组后进行聚合agg操作 四.使用自定义函数进行统计 五.使用di ...

最新文章

  1. Linq基础知识小记二
  2. 经济学人: 低调应用, 高调回报, 亚马逊才是AI技术最大受益企业
  3. ubuntu 下的ftp安装及root身份远程配置
  4. C++string容器-字符串拼接
  5. chrome瀏覽器去掉緩存的方法
  6. PWN-PRACTICE-BUUCTF-14
  7. linux某个线程信号唤醒,linux多线程编程--信号量和条件变量 唤醒丢失事件
  8. bat文件打开cmd并且运行cmd命令
  9. html自动排版 vs,Visual Stidio Code (vscode)自定义HTML页面自动生成格式
  10. 服务器主板支持什么cpu,怎么看主板支持什么CPU(主板和cpu兼容搭配知识)
  11. 模拟人生4 Mac(经营模拟游戏)全DLC可无限金币版
  12. 一个int类型到底占多少个字节
  13. FREERTOS必备知识-喂狗-死机
  14. 快马探营:移动MM“热料”解密
  15. Android P 外置 SD 卡写入权限问题
  16. 为Excel单元格后面统一添加一个字符,导Excel数据到数据库
  17. Adas常用实验仪器和设备:RT3000/RTrange/IMU/INS/RTK等
  18. Java | javac中常见参数
  19. 计算机学校要学籍吗,对普通高中学校学籍档案信息化管理相关问题的几点探讨...
  20. 基于php的房屋销售管理系统

热门文章

  1. 微信有电脑客户端吗_微信公众号文章下载、打印、精确搜索定位与交流方式分享...
  2. 天津科技大学 物理实验平台使用教程及相关问题
  3. Android Studio错误代码汇总
  4. 内核启动流程分析(四)源码浅析
  5. CentOS8更换源后失败问题
  6. 阿里1582.73亿营收背后的持续交付如何玩?
  7. (进阶篇)Cookie与 Session使用详解
  8. Memcache 安装与使用
  9. 异步加载 防止图片混乱
  10. 用纯C面向过程写icefox3的代码