对于聚合,我指的是任何能够从数组产生标量值的数据转换过程。

数据聚合

在这里我们除了使用groupby自带那些函数,还可以自己定义我们的聚合函数,例如我们来求一下,最大值和最小值的差。

def peak_to_peak(arr):

return arr.max() - arr.min()

grouped.agg(peak_to_peak)

grouped.describe()

#另外还可以用一些非聚合运算例如describe

面向列的多函数应用

首先我们读取一个实例数据tips.csv

tips = pd.read_csv("tips.csv")

tips['tip_pct'] = tips['tip']/tips['total_bill']

grouped = tips.groupby(['sex','smoker'])

我们有这样几种传入函数的方法:

直接传入函数

使用一个元组一次传入多个函数

grouped_pct.agg([('foo','mean'),('bar',np.std)])

这样改变默认的列名

grouped.agg({'tip':np.max,'size':'sum'})

result = grouped['tip_pct',

'total_bill'].agg(functions)

另外如果要求不同的列对应不同的函数。具体的方法是向agg传入一个字典映射。

grouped.agg({'tip':np.max,'size':'sum'})

以“无索引”的形式返回聚合数据

这里就是加一句 as_index=False

python数据分析实验报告_数据聚合相关推荐

  1. python数据分析实验报告_用Python处理实验数据

    开篇语 近来忙于考试以及应付专业课,基本很少写简书了.昨晚攻坚了三个学生工作的任务(妈妈的吻.好久没有这么疯狂工作了.还是很爽的哦!) 只恨这张图没有标记时间,其实已经是十二点四十多了 今天难得清静, ...

  2. python数据分析实验报告_使用 Python 3 进行气象数据分析

    项目简介 :本实验将对意大利北部沿海地区的气象数据进行分析与可视化.我们在实验过程中先会运用 Python 中 matplotlib 库的对数据进行图表化处理,最终在图表分析的支持下得出我们的结论. ...

  3. python数据分析实验报告_Python数据分析综合小练习:销售数据分析

    有这样一个小小的练习题: 卖电子商品的老板,每天记录了自己卖出的U盘,电脑支架,插座,电池,音箱,鼠标,usb数据线,手机充电线等数量,客户的需求是一方面,也可以通过客户购买关联性比较强的商品进行引导 ...

  4. python数据分析模块包括_数据开发必会 | Python数据分析模块

    作为数据开发,Python强大的数据分析模块还是必须要会的,横向拓展数据分析与挖掘技术栈也是很有必要的.本文将对Pandas.NumPy.SciPy.Matplotlib等分析挖掘库的安装和使用进行简 ...

  5. 二分法python上机实验报告_数值分析上机实验报告..doc

    数值分析上机实验报告. 实验报告一 题目: (绪论) 非线性方程求解及误差估计 摘要:非线性方程的解析解通常很难给出,因此线性方程的数值解法就尤为重要.本实验采用两种常见的求解方法二分法.Newton ...

  6. python主成分分析实验报告_主成分分析案例1-Python数据科学技术详解与商业项目实战精讲 - Python学习网...

    主成分分析案例1主成分分析案例1 查找并更新 在取出数据后,更改字段内容后使用save方法更新数据.这种方式是最佳的更新方式.$user = User::find(1); $user->name ...

  7. python数据分析实验报告_Python 数据分析入门实战

    本训练营中,我们将学习怎么样使用 Python 进行数据分析.课程将从数据分析基础开始,一步步深入讲解.从 Python 的基础用法到数据分析的各种算法,并结合各种实例,讲解数据分析过程中的方方面面. ...

  8. python数据分析前景如何_数据分析师的前景怎么样?

    数据分析师已经存在多年了.但是,对该职业的需求在2020年再次成为头条新闻.接下来,我将带领大家了解为什么,并帮助分析一下数据分析行业在2020年的发展情况. 一.数据分析师的需求猛增,前景一片大好! ...

  9. python数据分析就业前景_数据分析师找工作的秘诀,从读懂招聘 JD 开始

    JD(job description缩写),在招聘中,最常用到的意思是岗位介绍和工作职责描述. JD让无数求职者头痛,数据分析师更是其中的头疼之最.这份工作门槛尚可,薪资不错,行业发展前景好,因此吸引 ...

  10. 二分法python上机实验报告_二分查找-Python刷题笔记

    二分搜索是一种在有序数组中查找某一特定元素的搜索算法. 二分查找示意图 搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束:如果某一特定元素大于或者小于中间元素,则在数组大于 ...

最新文章

  1. 思谋科技A轮融资超1亿美元 ,成为最年轻“准独角兽”AI企业
  2. 对于量子计算来说,99%的准确度足够吗?
  3. onnx模型部署 python_onnxruntime模型部署流程
  4. python导出excel文件数字签名_Python使用RSA+MD5实现数字签名
  5. 红黑树 java代码实现
  6. Python中利用LSTM模型进行时间序列预测分析
  7. sql 连接数不释放 ,Druid异常:wait millis 40000, active 600, maxActive 600
  8. C语言回调函数 钩子函数,回调函数和钩子函数的说明
  9. Fragment生命周期(转)
  10. 64位lua引擎如何支持32位luac编译出来的二进制字节码?
  11. 徐培成2017大数据Hadoop经典案例-徐培成-专题视频课程
  12. 微信小程序阻止事件冒泡【看这里】
  13. iTween介绍和用法
  14. 【Python】Pandas DataFrame 一维表二维表的转换
  15. echarts pie 饼图 border宽度
  16. Leetcode PHP题解D1:宝石与石头
  17. “D语言风采不再”的说法言过其实
  18. Linux利用脏牛漏洞提权
  19. 认识机器学习与深度学习
  20. Android 9.0 recovery 菜单页跳过弹窗自动 WIPE_DATA(恢复出厂设置)

热门文章

  1. 下手重了,我把同事小刘的腿打断了...
  2. html表格复制最后一行字,为什么Word中的表格输入文字最后一行文字会自动跳到下一页...
  3. 测试打字有什么软件是什么,打字测试软件介绍
  4. Android Root
  5. 工商管理专业的毕业论文怎么选题?
  6. 教你简单制作视频滚动字幕
  7. 经济法基础之企业所得税思维导图
  8. dex文件解析(第三篇)
  9. 离群值是什么意思_医学数据如果存在离群值应如何处理?spss箱式图解决——【杏花开医学统计】...
  10. php期末作业总结,期末考试总结与反思(精选6篇)