python：dataframe groupby后agg、apply、transfrom用法

import pandas as pd
data = pd.DataFrame({'name':['wencky','stany','barbio','barbio'],'age':[29,29,3,10],'gender':['w','m','m', 'w']})# 1 transform可用，agg和apply得到NaN。
data["a"] = data.groupby("gender")["age"].agg(lambda x: x.mean())
# 输出
name  age gender   a
0  wencky   29      w NaN
1   stany   29      m NaN
2  barbio    3      m NaN
3  barbio   10      w NaNdata["a"] = data.groupby("gender")["age"].apply(lambda x: x.mean())
# 输出
name  age gender   a
0  wencky   29      w NaN
1   stany   29      m NaN
2  barbio    3      m NaN
3  barbio   10      w NaNdata["a"] = data.groupby("gender")["age"].transform(lambda x: x.mean())
# 输出name  age gender     a
0  wencky   29      w  19.5
1   stany   29      m  16.0
2  barbio    3      m  16.0
3  barbio   10      w  19.5# 2
data= data.groupby("gender")["age"].agg(lambda x: x.mean())
# 输出
gender
m    16.0
w    19.5data= data.groupby("gender")["age"].apply(lambda x: x.mean())# 输出
gender
m    16.0
w    19.5data= data.groupby("gender")["age"].transform(lambda x: x.mean())
# 输出
0    19.5
1    16.0
2    16.0
3    19.5# 3
data = data.groupby("gender").agg(lambda x: x["age"].mean())
# 报错data = data.groupby("gender").apply(lambda x: x["age"].mean())
# 输出
gender
m    16.0
w    19.5data = data.groupby("gender").transform(lambda x: x["age"].mean())
# 报错# 4 该用法不可用
data["c"] = data.groupby("gender").agg(lambda x: x["age"].mean())
# 报错data["c"] = data.groupby("gender").apply(lambda x: x["age"].mean())
# 输出name  age gender   c
0  wencky   29      w NaN
1   stany   29      m NaN
2  barbio    3      m NaN
3  barbio   10      w NaNdata["c"] = data.groupby("gender").transform(lambda x: x["age"].mean())
# 报错# 以下5-8用法使用agg均报错：valueError: Must produce aggregated value# 5
data["b"]= data.groupby("gender")["age"].agg(lambda x: x+1)
# 输出
valueError: Must produce aggregated valuedata["b"]= data.groupby("gender")["age"].apply(lambda x: x+1)
# 输出name  age gender   b
0  wencky   29      w  30
1   stany   29      m  30
2  barbio    3      m   4
3  barbio   10      w  11data["b"]= data.groupby("gender")["age"].transform(lambda x: x+1)
# 输出name  age gender   b
0  wencky   29      w  30
1   stany   29      m  30
2  barbio    3      m   4
3  barbio   10      w  11# 6 两种用法结果一致
data = data.groupby("gender")["age"].apply(lambda x: x+1)
data = data.groupby("gender")["age"].transform(lambda x: x+1)
# 输出
0    30
1    30
2     4
3    11# 7
data = data.groupby("gender").apply(lambda x: x["age"]+1)
# 输出
gender
m       1    302     4
w       0    303    11data = data.groupby("gender").transform(lambda x: x["age"]+1)
# 报错# 8
data["d"] = data.groupby("gender").apply(lambda x: x["age"]+1)
# 报错data["d"] = data.groupby("gender"). transform (lambda x: x["age"]+1)
# 报错

python：dataframe groupby后agg、apply、transfrom用法相关推荐

分组统计 - DataFrame.groupby() 所见的各种用法 - Python代码
目录所见 1 :日常用法所见 2 :解决groupby.sum() 后层级索引levels上移的问题所见 3 :解决groupby.apply() 后层级索引levels上移的问题所见 4 : ...
Python DataFrame数据清洗后行索引不连续——reset_index
调用reset_index()即可解决: data1为索引不连续的表,data2为重置索引后索引连续的表. ----------------分割线---------------- 从今天开始,要写一些 ...
dataframe groupby_详解pandas中的map、apply、applymap、groupby、agg.
一.简介 pandas提供了很多方便简洁的方法,用于对单列.多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效率,也会使得你的代码更加地优雅简洁. 本文就将针对pandas中的 ...
python和R对dataframe的分组聚合操作：dplyr、groupby、agg、group_by、nunique、reset_index、rename、summarise、n_distinct
python和R对dataframe的分组聚合操作:dplyr.groupby.agg.group_by.nunique.reset_index.rename.summarise.n_distinct ...
python 数据分组后看每组多少个_【Python】分组统计GroupBy技术详解
摘要进行数据分析时,GroupBy分组统计是非常常用的操作,也是十分重要的操作之一.基本上大部分的数据分析都会用到该操作,本文将对Python的GroupBy分组统计操作进行讲解. 1.GroupB ...
pandas dataframe数据聚合groupby、agg、privot基于sum统计详解及实例
pandas dataframe数据聚合groupby.agg.privot基于sum统计详解及实例知道了sum.那么min.max.mean.median都是举一反三的事情了. 在日常的数据分析中 ...
DataFrame groupby+agg出现SpecificationError: nested renamer is not supported的错误
这个应该是pandas的版本问题 ,我的是v1.0.5,也会出现这个问题,如下面的代码所示: >>> import pandas as pd >>> data=pd ...
【Python 数据科学】聚合apply和agg
文章目录 apply agg import pandas as pd position=pd.read_csv('DataAnalyst.csv',encoding='gbk') company=pd ...
定量分析---频率分布直方图（groupby，agg，round具体用法）
对数据集"捞起生鱼片"做定量分析穿插pandas的cut,groupby,agg方法定量数据分布分析对于定量数据而言,选择组数与组宽是做评率分布分析时最主要的问题,步骤如下: ...

python：dataframe groupby后agg、apply、transfrom用法

python：dataframe groupby后agg、apply、transfrom用法相关推荐

最新文章

热门文章