python- pandas cumsum用法
Cumsum :计算轴向元素累加和,返回由中间结果组成的数组
第一部分:求累计次数(转自https://blog.csdn.net/qq_22238533/article/details/72900634)
本文主要是针对 cumsum函数的一些用法。具体应用场景看下面的数据集。
第一列是userID,第二列是安装的时间,第三列是安装的次数。
我们现在想做一件事情。就是统计用户在某一天前累计的安装次数。
譬如,对userID为20的用户,问在16天前,其安装次数为多少? 答案应该是4次。用python的实现也很简单。
又譬如,userID为44在19天前安装的次数,那就应该是1+3+1+1=6次。
具体代码:(假设数据集为data)
由于是针对每个userID,所以是需要将userID划分一下(这个方法在组内排序的时候有提到,可以参考前面的文章)。
所以才有下面这一句
groupby(['userID'])
然后,分完组后需要统计的Times,所以就是下面这一句
data['Times'].groupby(['userID'])
最后,我们需要的是累加量,所以,用cumsum()这个函数。
data['sum_Times']=data['Times'].groupby(['userID']).cumsum()
用得到的结果放在一列。
最后得到结果如下:
可以从sum_Times这列看到,每一个值都是相应userID在前一行的累加值。
第二部分:返回由中间结果组成的数组
(转自 https://blog.csdn.net/yuansuo0516/article/details/78331568)
shape | 索引 |
2 | 0 |
2 | 1 |
3 | 2 |
import numpy as np
arr = np.array([[[1,2,3],[8,9,12]],[[1,2,4],[2,4,5]]])
print(arr.cumsum(0))
print(arr.cumsum(1))
print(arr.cumsum(2))
输出结果:
#cumsum(0)
[[[ 1 2 3] [ 8 9 12]] [[ 2 4 7] [10 13 17]]]
#cumsum(1)
[[[ 1 2 3] [ 9 11 15]] [[ 1 2 4] [ 3 6 9]]]
#cumsum(2)
[[[ 1 3 6] [ 8 17 29]] [[ 1 3 7] [ 2 6 11]]]
import numpy as np
arr = np.arange(32).reshape((2,2,2,4))
print(arr)
print(arr.cumsum(0))
print(arr.cumsum(1))
print(arr.cumsum(2))
print(arr.cumsum(3))
arr: ## arr是一个2*2*2*4四维矩阵,索引值为0,1,2,3
[[[[ 0 1 2 3] [ 4 5 6 7]] [[ 8 9 10 11] [12 13 14 15]]] [[[16 17 18 19] [20 21 22 23]] [[24 25 26 27] [28 29 30 31]]]]
[[[ 0 1 2 3] [ 4 5 6 7]] [[ 8 9 10 11] [12 13 14 15]]]
[[[16 17 18 19] [20 21 22 23]] [[24 25 26 27] [28 29 30 31]]]]
结果:
[[[[ 0 1 2 3] [ 4 5 6 7]] [[ 8 9 10 11] [12 13 14 15]]] [[[16 18 20 22] [24 26 28 30]] [[32 34 36 38] [40 42 44 46]]]]
cumsum(1):实现1轴上的累加即:以次外面元素为单位,累加以下四个
[[ 0 1 2 3] [ 4 5 6 7]] [[ 8 9 10 11] [12 13 14 15]] [[16 17 18 19] [20 21 22 23]] [[24 25 26 27] [28 29 30 31]]
[[[[ 0 1 2 3] [ 4 5 6 7]] [[ 8 10 12 14] [16 18 20 22]]] [[[16 17 18 19] [20 21 22 23]] [[40 42 44 46] [48 50 52 54]]]]
python- pandas cumsum用法相关推荐
- python loc iloc,Python pandas loc用法与iloc区别 聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明...
想了解聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明的相关内容吗,Rainpages在本文为您仔细讲解Python pandas loc用法与iloc区别的相关知识和一些C ...
- python pandas inplace用法
https://blog.csdn.net/songyunli1111/article/details/82937954
- Python pandas用法
Python pandas用法 无味之味关注 12019.01.10 15:43:25字数 2,877阅读 91,914 介绍 在Python中,pandas是基于NumPy数组构建的,使数据预处理. ...
- python 数据分析模块_Python数据分析pandas模块用法实例详解
本文实例讲述了Python数据分析pandas模块用法.分享给大家供大家参考,具体如下: pandas pandas10分钟入门,可以查看官网:10 minutes to pandas 也可以查看更复 ...
- Python pandas 中loc函数的意思及用法,及跟iloc的区别
Python pandas 中loc函数的意思及用法,及跟iloc的区别 loc和iloc的意思 loc和iloc的区别及用法展示 参考文献 loc和iloc的意思 首先,loc是location的意 ...
- 独家 | 浅谈Python/Pandas中管道的用法
作者:Gregor Scheithauer博士 翻译:王闯(Chuck)校对:欧阳锦本文约2000字,建议阅读5分钟本文介绍了如何在Python/Pandas中运用管道的概念,以使代码更高效易读. 图 ...
- python中ix用法_Python: pandas中ix的详细讲解
Python: pandas中ix的详细讲解 发布时间:2018-09-21 15:59, 浏览次数:2372 , 标签: Python pandas ix 在上一篇博客 中,我们已经仔细讲解了ilo ...
- pandas object转float_数据分析篇 | Pandas基础用法6【完结篇】
这是最后一篇,至此Pandas系列终于连载完了,有需要的也可以看看前面6篇,尽请收藏. 数据分析篇 | Pandas 概览 数据分析篇 | Pandas基础用法1数据分析篇 | Pandas基础用法2 ...
- csv 20位数据 如何打开可以预览完整数字_干货Python Pandas 做数据分析之玩转 Excel 报表分析...
本篇文章选自作者在 GitChat 的分享,若有什么问题,可在公众号回复「小助手」添加小助手微信,邀请你进入技术交流群. 各位朋友大家好,非常荣幸和大家聊一聊用 Python Pandas 处理 Ex ...
- pandas 不要编号 加一行_文科生带你学Python|Pandas读取数据
16 2020-08 文科生带你学Python|Pandas读取数据 距离上一次更新时间有点久,原因么,被大佬的代码打击到了,于是回去自闭充了一波电-- LEARN MORE 图片来自网络,如侵删 向 ...
最新文章
- TVM代码生成codegen
- 字符串排序 java_java字符串排序
- WCF热带鱼书学习手记 - Service Contract Overload
- jsp中的内置对象(9个)、作用
- C++ const相关内容学习
- python3字典菜鸟教程_Python3 字典(map)
- springboot主线程_springboot中的多线程.md
- tcpdump 抓包让wireshark来分析
- pdf多页合成一张pdf图片
- 苹果手机运行html游戏,苹果手机如何运行PSP游戏方法
- 基于Java Swing的进销存管理系统
- 【多线程】如何保证线程安全
- Java实现简单电子邮件的发送
- @00后,有个编程问题请教下
- python 单词纠错_自然语言处理1——语言处理与Python(内含纠错)
- java求六位数以内所有自幂数
- 史上最全面、最详细的Cookie总结
- bibtex 共生_游戏与音乐的共生
- 论文阅读《Semantic Relation Reasoning for Shot-Stable Few-Shot Object Detection》
- “10•24”专供:Spark全套知识体系,免费领!