python datatime 平均值_python-熊猫时间序列:时间戳列的平均值
使用groupby和diff并表示:
df = df.groupby('ID')['Date'].apply(lambda x: x.diff().mean()).reset_index()
print (df)
ID Date
0 16812 21 days 04:48:00
1 16911 16 days 09:00:00
2 16912 10 days 00:00:00
如果需要转换时间增量,例如到几天:
df = df.groupby('ID')['Date'].apply(lambda x: x.diff().mean().days).reset_index()
print (df)
ID Date
0 16812 21
1 16911 16
2 16912 10
编辑:
#create difference column per ID
df['new'] = df.groupby('ID')['Date'].diff().dt.days
#remove NaT rows (first for each group)
df = df.dropna(subset=['new'])
#convert to integers
df['new'] = df['new'].astype(int)
#aggreagte lists and mean
df = df.groupby('ID', sort=False)['new'].agg([('val', lambda x: x.tolist()),('avg', 'mean')])
print (df)
ID
16911 [10, 2, 11, 12, 5, 75, 3, 13] 16.375
16912 [10] 10.000
16812 [11, 12, 5, 75, 3] 21.200
python datatime 平均值_python-熊猫时间序列:时间戳列的平均值相关推荐
- python 并列条形图_python – 熊猫:如何绘制两个类别和四个系列的条形图?
我有以下数据框,其中pd.concat已用于对列进行分组: a b C1 C2 C3 C4 C5 C6 C7 C8 0 15 37 17 10 8 11 19 86 1 39 84 11 5 5 13 ...
- python迭代列表_Python迭代列表中列的元素
嗨,所有python新手更习惯于矩阵式软件 我在遍历列表列表时遇到问题.在 我导入了一个csv文件作为列表列表['2004', '1', '7', '20', '50', '0', '8.92', ' ...
- python分组函数_Python中如何按列分组和按自己的函数汇总
让df作为我们来自熊猫的测试数据框:import pandas as pd import numpy as np df = pd.DataFrame({'A' : ['foo', 'bar', 'fo ...
- python去重语句_Python Dataframe 指定多列去重、求差集的方法
1)去重 指定多列去重,这是在dataframe没有独一无二的字段作为PK(主键)时,需要指定多个字段一起作为该行的PK,在这种情况下对整体数据进行去重. Attention:主要用到了drop_du ...
- python如何互换_python中怎么交换列的顺序
DataFrame的列有时我们需要对添加的列或原来的列进行交换顺序.data = pd.DataFrame(np.arange(16).reshape(4,4),columns=list('abcd' ...
- python long类型_python获取当前时间戳Long类型
python获取当前时间戳Long类型 怎么用python完成获取时间,并且转换成long类型 timestamp=long(int(round(time.time() * 1000))) 怎么完成5 ...
- python词频云图_python安娜卡列妮娜词云图制作
知识点普及 词频:某个词在该文档中出现的次数停用词:数据处理时过滤掉某些字或词,如:网站.的等语料库:也就是我们要分析的所有文档的集合中文分词:将汉字序列分成一个个单独的词 使用第三方库介绍 jieb ...
- python比较长度_Python:XLRD;比较列长度
我正在使用xlrd处理xls文件.我的xls文件有两列,我的要求是确保两列的行数相等.我从help()中了解到,我们有一个row_len()来查找索引给出的行的长度,但无法找到任何col_len.你能 ...
- python用均值填充空值_python-用同一列的平均值填充pyspark DataFrame 列的空值
像这样的 DataFrame , rdd_2 = sc.parallelize([(0,10,223,"201601"), (0,10,83,"2016032" ...
最新文章
- git记住用户名和密码
- 浅谈函数调用的汇编实现细节(用栈来传递参数)
- 怎样用jQuery拿到select中被选中的option的值
- 1虚拟地址,虚拟内存映射,系统调用本质,进程运行状态
- Oracle中PLSQL中一个例外的写法
- mysql客户端工具的使用
- flutter Radio 单选框
- 怎样运用Oracle的BFILE
- python索引用法_python 列表索引问题
- 软件工程--瀑布模型
- [转]SQL2000修改表创建日期
- 郁闷的开始--8月21日
- win10无法防问其他计算机没有权限,win10系统访问磁盘共享没有权限的解决方案...
- 删除MAC电脑中卸载PS后在launchpad中残留的图标
- 吐血整理C++书单,萌新到大牛,要看哪些书?
- Linux下终端分屏利器tmux
- GNN-Retro 逆合成路线规划
- C# vb .net实现gamma伽玛调整特效滤镜
- 华为MateBook D14 安装ubuntu16 wifi、蓝牙、触控板驱动问题解决
- vue.js:父组件和子组件