最近在做数据,记录一下遇到的问题,解决的方式,

有一个数据,如图

我想统计每年的idx_reply, idx_sat, idx_default的频数 交叉统计。

探索了一下午,做法是这样的。

data_testdata_test.groupby(data_test['year'])['idx_reply'].value_counts().unstack()

使用groupby 默认会把分组的作为索引 ,如果不用 unstack, 就会是这样

用了unstack ,就整齐一点

同样的效果,也可以使用crosstab 达到。

pd.crosstab(index=data_test['year'], columns=data_test['idx_reply'])

使用pivot_table,没有办法弄出上面的效果。

感觉就是crosstab命令做直接。还可以计算百分比

这里crosstab的margins 选项是

normalize : bool, {'all', 'index', 'columns'}, or {0,1}, default FalseNormalize by dividing all values by the sum of values.- If passed 'all' or `True`, will normalize over all values.- If passed 'index' will normalize over each row.- If passed 'columns' will normalize over each column.- If margins is `True`, will also normalize margin values.

后续还会继续学习。

pandas 分组统计的三个函数 pivot table crosstab groupby相关推荐

  1. pandas分组统计 - groupby功能

    数据分组 分组统计 - groupby功能 ① 根据某些条件将数据拆分成组 ② 对每个组独立应用函数 ③ 将结果合并到一个数据结构中 Dataframe在行(axis=0)或列(axis=1)上进行分 ...

  2. Oracle按日周月分组统计,及next_day()函数详解

    1.概述 工作中遇到如下问题:统计周期内关键词数,而这里的周期内最常用的就是日周月. 日月比较容易处理,周的话可以通过next_day()函数实现. 2.实例问题 如下,有一张表ljb_test,包括 ...

  3. pandas使用groupby函数进行分组聚合、使用agg函数指定聚合统计计算的数值变量、并自定义统计计算结果的名称(naming columns after aggregation)

    pandas使用groupby函数进行分组聚合.使用agg函数指定聚合统计计算的数值变量.并自定义统计计算结果的名称(naming columns after aggregation in dataf ...

  4. pandas使用groupby函数对dataframe进行分组统计、使用as_index参数设置分组聚合的结果中分组变量不是dataframe的索引(index)

    pandas使用groupby函数对dataframe进行分组统计.使用as_index参数设置分组聚合的结果中分组变量不是dataframe的索引(index) 目录

  5. pandas使用groupby函数按照多个分组变量进行分组聚合统计、使用agg函数计算分组的多个统计指标(grouping by multiple columns in dataframe)

    pandas使用groupby函数按照多个分组变量进行分组聚合统计.使用agg函数计算分组的多个统计指标(grouping by multiple columns in dataframe) 目录

  6. pandas相关函数sort_values、字符串处理、index、merge、数据合并cancat、groupby分组统计

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.排序函数sort_values() 二.字符串处理 1.介绍 2.代码介绍 3.Categorical类型降低数据 ...

  7. Python数据分析pandas之分组统计透视表

    Python数据分析pandas之分组统计透视表 数据聚合统计 Padans里的聚合统计即是应用分组的方法对数据框进行聚合统计,常见的有min(最小).max(最大).avg(平均值).sum(求和) ...

  8. Pandas数据分析—groupby分组统计

    13.Pandas中groupby分组统计 文章目录 13.Pandas中groupby分组统计 前言 一.分组使用聚合函数做数据统计 1.准备数据 二.遍历groupby的结果理解执行流程 三.实例 ...

  9. pandas对数据进行分组统计

    pandas对数据进行分组统计 文章目录 pandas对数据进行分组统计 前言 一.分组后进行sum操作 二.分组后进行迭代操作 三.分组后进行聚合agg操作 四.使用自定义函数进行统计 五.使用di ...

最新文章

  1. matlab函数isempty_matlab基本函数inf, isempty, round, floor, fix
  2. Windows+Python 3.6环境下安装PyQt4
  3. java学习笔记:使用dom4j解析xml
  4. 【UESTC 594】我要长高
  5. java 中的 Math.round(-1.5) 等于多少?
  6. JAVA入门到精通-第6讲-成员属性-成员方法
  7. vmware ethx的修改
  8. Elasticsearch-2.3.x填坑之路
  9. Selenium alert 弹窗处理
  10. Win10 Ubuntu子系统(内嵌ubuntu18.04)运行32bit Linux原生程序 解决Exec format error错误
  11. jQuery创建Dom元素
  12. 如何成为一个真正在路上的Linuxer
  13. .NET性能系列文章二:Newtonsoft.Json vs System.Text.Json
  14. 频谱图 与傅立叶变换
  15. 210917-电脑护眼模式总结
  16. 【行列式2】n阶行列式的展开
  17. JS中的柯里化(currying)
  18. BDP数据可视化分析工具,TAGUL数据可视化分析工具
  19. 阿里云和腾讯云服务器哪个好用?
  20. 如何从零开始用PyTorch实现Chatbot?(附完整代码)

热门文章

  1. Cuboid特征提取算法
  2. 【控制】《多智能体系统的动力学分析与设计》徐光辉老师-第10章-带有分层领航者的多智能体系统的混杂协调
  3. 【控制】《多智能体系统的动力学分析与设计》徐光辉老师-第9章-不确定分数阶系统的包含控制
  4. 关于stm32 hal 库 iic 一直是 busy 问题
  5. mysql 安装手册(转)
  6. 记录一次CPLD资源过少、时序伪例的解决办法
  7. 菜鸟教程 之 shell 脚本学习笔记 (一)
  8. Python入门篇-高级数据类型集合(set)和字典(dict)
  9. Centos7 安装 nginx 服务器的两种方式
  10. VS代码提示不出现或者提示变成英文或者各种奇葩问题的解决