python在多个组中选一组_python-使用 pandas 在每个groupby组的列中选择最大的N
我的df:
{'city1': {0: 'Chicago',
1: 'Chicago',
2: 'Chicago',
3: 'Chicago',
4: 'Miami',
5: 'Houston',
6: 'Austin'},
'city2': {0: 'Toronto',
1: 'Detroit',
2: 'St.Louis',
3: 'Miami',
4: 'Dallas',
5: 'Dallas',
6: 'Dallas'},
'p234_r_c': {0: 5.0, 1: 4.0, 2: 2.0, 3: 0.5, 4: 1.0, 5: 4.0, 6: 3.0},
'plant1_type': {0: 'COMBCYCL',
1: 'COMBCYCL',
2: 'NUKE',
3: 'COAL',
4: 'NUKE',
5: 'COMBCYCL',
6: 'COAL'},
'plant2_type': {0: 'COAL',
1: 'COAL',
2: 'COMBCYCL',
3: 'COMBCYCL',
4: 'COAL',
5: 'NUKE',
6: 'NUKE'}}
我想执行2个groupby操作,并使用列p234_r_c进行每个组中最大的1个操作.
第一分组= [‘plant1_type’,’plant2_type’,’city1′]
第二分组= [‘plant1_type’,’plant2_type’,’city2′]
因此,我将执行以下操作:
df.groupby(['plant1_type','plant2_type','city1'])['p234_r_c'].\
nlargest(1).reset_index()
plant1_type plant2_type city1 level_3 p234_r_c
0 COAL COMBCYCL Chicago 3 0.5
1 COAL NUKE Austin 6 3.0
2 COMBCYCL COAL Chicago 0 5.0
3 COMBCYCL NUKE Houston 5 4.0
4 NUKE COAL Miami 4 1.0
5 NUKE COMBCYCL Chicago 2 2.0
第一组的结果很有意义.但是,我对第二分组的结果感到困惑:
df.groupby(['plant1_type','plant2_type','city2'])['p234_r_c'].\
nlargest(1).reset_index()
index p234_r_c
0 0 5.0
1 1 4.0
2 2 2.0
3 3 0.5
4 4 1.0
5 5 4.0
6 6 3.0
结果中的列plant1_type,plant2_type和city2发生了什么?它们不应该像在第一个groupby的结果中出现plant1_type,plant2_type和city1一样出现在结果中吗?
python在多个组中选一组_python-使用 pandas 在每个groupby组的列中选择最大的N相关推荐
- python列表用来有序存放一组_python 列表 元组(自兴人工智能)
一:列表 列表的作用就是一次性存储多个数,存具有同样作用的数据,存储长度不定,数据类不限 特点: 1,有序数列,有下标,从0开始,单个查询快 2,列表元素可以为空 3,列表元素可以重复 语法: 1)声 ...
- python列表用来有序存放一组_python入门第二课------列表
1. 列表可以用来存储字符,数字等信息 在geany(文本编辑器也可以直接在python终端输入)里输入以下内容: equipment=['train','car','plane'] /* e ...
- python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...
- python 将excel文件转换为txt文件_python利用pandas将excel文件转换为txt文件的方法
python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...
- python清洗数据去除停用词_Python从pandas数据帧中删除停用词
我想从我的专栏"tweets"中删除停用词.如何迭代每一行和每个项目? pos_tweets = [('I love this car', 'positive'), ('This ...
- python给内置函数重命名_python – 以Pandas Groupby函数重命名列名
1).我有一个以下示例数据集: >>> df ID Region count 0 100 Asia 2 1 101 Europe 3 2 102 US 1 3 103 Africa ...
- python用字典统计单词出现次数_python - 如何使用字典理解来计算文档中每个单词的出现次数...
我有一个用python编写的列表,其中充满了文本.就像每个文档中的固定单词.所以对于每个文档,我都有一个列表,然后在列表中列出所有文档. 所有列表只包含唯一的单词.我的目的是计算完整文档中每个单词的出 ...
- python多个sheet数据透视表_python 用pandas实现数据透视表功能
透视表是一种可以对数据动态排布并且分类汇总的表格格式.对于熟练使用 excel 的伙伴来说,一定很是亲切! pd.pivot_table() 语法: pivot_table(data, # dataf ...
- python中奖号_Python输入数字并从预定义的lis中选择中奖号码
我昨天才开始学习Python,这是我第一次接触编程语言,我注意到我通过做一些事情比仅仅阅读来学习更好,所以我给自己分配了不同的任务,并不断地敲打自己的脑袋,直到我成功地完成它们. 关于我的问题,我相信 ...
最新文章
- epoll 使用详解
- UML类图与类的关系详解【转】
- 洛谷p2704 炮兵阵地
- 通过Dapr实现一个简单的基于.net的微服务电商系统(七)——一步一步教你如何撸Dapr之服务限流...
- 带你了解C#每个版本新特性
- [vue] vue2.0不再支持v-html中使用过滤器了怎么办?
- 合并分ER图产生的冲突
- Swift 5 时代的机遇与挑战到底在哪里?
- 干货!看云原生时代阿里云的四个“最”
- 【elasticsearch系列】双击elasticsearch.bat闪退,日志排查报错信息
- 计算机游戏动漫制作自我鉴定,动漫设计专业自我鉴定
- javq接口_java 接口详解
- VS同一个解决方案中不同项目相互引用问题
- 基于JAVA+SpringBoot+Mybatis+MYSQL的相册管理系统
- 学大伟业:2019年物理竞赛学习方法
- ini 文件 使用说明
- python爬虫实践之爬取豆瓣高评分电影
- 视网膜血管分割方法整理
- jzoj5990. 【北大2019冬令营模拟2019.1.6】Bear (状压dp)
- Adobe Photoshop 2020 21.2.2.289 中文版 — 图像处理工具
热门文章
- 【CComPtr】CComPtr和CComQIPtr的区别
- 在Visual C++中用ADO进行数据库编程(上)
- java的servlet是干嘛的_Servlet能够做什么?
- OpenCV掩码、blending、改变对比度和亮度、随机发生器和绘图
- Nature Milestones | 近20年人类癌症研究领域14项里程碑式进展!
- 聚类分析(一)基本思想
- ae多线程渲染工具:BG Renderer MAX for Mac(AE插件)
- 如何使用iToolab FixGo for mac修复iPhone/iPad的系统问题
- Mac上的一位数密码你知道吗
- macos server 恢复安装_如何通过 macOS 恢复功能重新安装 macOS