1.分组与聚合原理

在Pandas中,分组是指使用特定的条件将原数据划分为多个组,聚合在这里指的是,对每个分组中的数据执行某些操作,最后将计算的结果进行整合。

三步骤:1.拆分 2.应用 3.合并

2.通过groupby【】方法groupby

(by=None, axis=0, level=None, as_index=True, sort=True,group_keys=True, squeeze=False, observed=False, **kwargs)

by:用于确定进行分组的依据。 axis:表示分组轴的方向。 sort:表示是否对分组标签进行排序,接收布eries调用groupby()方法返回的是

SeriesGroupBy对象。 使用DataFrame调用groupby()方法返回的是DataFrameBy对象。尔值,默认为True。

按列名进行分组

ataFrame对象的某一列数据符合划分成组的标准,则可以将该列当做分组键来拆分数据集。

df.groupby(by='Key')

group_obj = df.groupby('Key') # 遍历分组对象 for i in group_obj:

print(i)则可以使用for循环遍历DataFrameGroupBy对象。

series分组

ser_obj = pd.Series(['a', 'b', 'c', 'a', 'b']) # 按自定义Series对象进行分组

group_obj = df.groupby(by = ser_obj)

如果Series对象与Pandas对象的索引长度不相同时,则只会将具有相同索引的部分数据进行分组。

df = se = pd.Series(['a', 'a', 'b']) group_obj = df.groupby(se)['one', 'two', 'one','two', 'one'],                 'data1': [2, 3, 4, 6, 8],

'data2': [3, 5, 6, 3, 7]}) se = pd.Series(['a', 'a', 'b']) group_obj = df.groupby(se)

3.数据聚合

如果内置方法无法满足聚合要求时,则可以自定义函数,将它作为参数传给agg()方法,实现Pandas对象的聚合运算。

agg(func,axis = 0,* args,** kwargs )

func:表示用于汇总数据的函数,可以为单个函数或函数列表。 axis:表示函数作用于轴的方向,0或index表示将函数应用到每一列;1或columns表示将函数应用到每一行,该参数的默认值为0。

对不同列数据应用不同函数

如果希望对不同的列使用不同的函数,则可以在agg()方法中传入一个{"列名":"函数名"}格式的字典。

data_group.agg({'a': 'sum', 'b': 'mean', 'c': range_data_group})

agg()方法执行聚合操作时,会将一组标量值参与某些运算后转换为一个标量值。

python--数据聚合与分组运算相关推荐

  1. 【学习经典】python 数据聚合与分组运算(part 2)

    本文的前半部分:python 数据聚合与分组运算(part 1) 4. 透视表和交叉表 透视表(pivot table)是各种电子表格程序和其他数据分析软件中一种常见的数据汇总工具.它根据一个或多个键 ...

  2. Python数据聚合和分组运算(1)-GroupBy Mechanics

    前言 Python的pandas包提供的数据聚合与分组运算功能很强大,也很灵活.<Python for Data Analysis>这本书第9章详细的介绍了这方面的用法,但是有些细节不常用 ...

  3. Python之数据聚合与分组运算

    Python之数据聚合与分组运算 1. 关系型数据库方便对数据进行连接.过滤.转换和聚合. 2. Hadley Wickham创建了用于表示分组运算术语"split-apply-combin ...

  4. 【Python】GroupBy:数据聚合与分组运算

    [博客地址]:https://blog.csdn.net/sunyaowu315 [博客大纲地址]:https://blog.csdn.net/sunyaowu315/article/details/ ...

  5. 类的应用python平均分_【数据科学系统学习】Python # 数据分析基本操作[四] 数据规整化和数据聚合与分组运算...

    本篇内容为整理<利用Python进行数据分析>,博主使用代码为 Python3,部分内容和书本有出入. 在前几篇中我们介绍了 NumPy.pandas.matplotlib 三个库的基本操 ...

  6. python 数据聚合与分组

    python 数据聚合与分组 前面讲完了字符处理,但对数据进行整体性的聚合运算以及分组操作也是数据分析的重要内容. 通过数据的聚合与分组,我们能更容易的发现隐藏在数据中的规律. 数据分组 数据的分组核 ...

  7. vfp python_python foxpro数据聚合和分组运算——分组级运算和转换(3)

    数据聚合和分组运算--分组级运算和转换(3),有需要的朋友可以参考下. 1.假设我们想要为一个DataFrame添加一个用于存放各索引分组平均值的列,一个办法是先聚合再合并: >>> ...

  8. pandas合并groupby_pandas数据聚合与分组运算——groupby方法

    简介 pandas中一类非常重要的操作是数据聚合与分组运算.通过groupby方法能够实现对数据集的拆分.统计.转换等操作,这个过程一气呵成. 在本文中,你将学到: 选取特定列分组: 对分组进行迭代: ...

  9. 【学习】数据聚合和分组运算【groupby】

    [学习]数据聚合和分组运算[groupby] 分组键可以有多种方式,且类型不必相同 列表或数组, 某长度与待分组的轴一样 表示DataFrame某个列名的值 字典或Series,给出待分组轴上的值与分 ...

  10. 《利用python进行数据分析》读书笔记--第九章 数据聚合与分组运算(一)

    http://www.cnblogs.com/batteryhp/p/5046450.html 对数据进行分组并对各组应用一个函数,是数据分析的重要环节.数据准备好之后,通常的任务就是计算分组统计或生 ...

最新文章

  1. 在家搭建大数据分布式计算环境!
  2. 协方差中的正相关与负相关
  3. 教育场景下的实时音频解决方案
  4. 小甲鱼 OllyDbg 教程系列 (七) :VB 程序逆向分析
  5. C# Winform 跨线程更新UI控件常用方法汇总(多线程访问UI控件)
  6. oracle主备不同步,主备环境下数据不一致重新部署复制
  7. 互联网行业哪个职位比较有前途?
  8. Solaris下设置nfs与nfs挂载
  9. fastdfs安装部署
  10. 7种JVM垃圾收集器特点,优劣势、及使用场景
  11. 2021年道路运输企业安全生产管理人员考试内容及道路运输企业安全生产管理人员题库
  12. HDU4699 Editor(双栈对弹)
  13. 正在保存备份的驱动器与启动计算机,如何创建和使用Dell Recovery Restore USB驱动器...
  14. iOS封装相册API的tips
  15. 《神经科学:探索脑》学习笔记(第2章 神经元和神经胶质细胞)
  16. 老板掌控公司方向的三张图
  17. 初学者入门阿里云haas510开板式DTU(2.0版本)--510-AS
  18. 黑马程序员--Java学习01--java简介
  19. Springboot项目install打包-某些输入文件使用了未经检查或不安全的操作。分析与解决
  20. Python糗事百科完整代码

热门文章

  1. 如何用kaldi训练好的DNN模型做在线识别
  2. Android AAPT详解
  3. 【第40期】游戏策划:给@真轶的应聘攻略
  4. Xsens MTI-300 ubuntu20.04配置
  5. 财务共享中心,是要白刀子进去 红刀子出来
  6. 软件测试界面测试是什么,什么是软件测试的界面测试?
  7. 详解计算机组成原理组成篇(磁盘调度算法,cache命中率,效率,平均访问时间,以及FIFO、LFU、LRU算法。拒绝挂科)
  8. python2 urllib模块_python urllib与urllib2模块用法教程
  9. python加解密过程
  10. 【四足机器人--控制指令输入及转换】(1)遥控手柄状态指令转换为机器人躯干状态输入代码解析