我的df:

{'city1': {0: 'Chicago',

1: 'Chicago',

2: 'Chicago',

3: 'Chicago',

4: 'Miami',

5: 'Houston',

6: 'Austin'},

'city2': {0: 'Toronto',

1: 'Detroit',

2: 'St.Louis',

3: 'Miami',

4: 'Dallas',

5: 'Dallas',

6: 'Dallas'},

'p234_r_c': {0: 5.0, 1: 4.0, 2: 2.0, 3: 0.5, 4: 1.0, 5: 4.0, 6: 3.0},

'plant1_type': {0: 'COMBCYCL',

1: 'COMBCYCL',

2: 'NUKE',

3: 'COAL',

4: 'NUKE',

5: 'COMBCYCL',

6: 'COAL'},

'plant2_type': {0: 'COAL',

1: 'COAL',

2: 'COMBCYCL',

3: 'COMBCYCL',

4: 'COAL',

5: 'NUKE',

6: 'NUKE'}}

我想执行2个groupby操作,并使用列p234_r_c进行每个组中最大的1个操作.

第一分组= [‘plant1_type’,’plant2_type’,’city1′]

第二分组= [‘plant1_type’,’plant2_type’,’city2′]

因此,我将执行以下操作:

df.groupby(['plant1_type','plant2_type','city1'])['p234_r_c'].\

nlargest(1).reset_index()

plant1_type plant2_type city1 level_3 p234_r_c

0 COAL COMBCYCL Chicago 3 0.5

1 COAL NUKE Austin 6 3.0

2 COMBCYCL COAL Chicago 0 5.0

3 COMBCYCL NUKE Houston 5 4.0

4 NUKE COAL Miami 4 1.0

5 NUKE COMBCYCL Chicago 2 2.0

第一组的结果很有意义.但是,我对第二分组的结果感到困惑:

df.groupby(['plant1_type','plant2_type','city2'])['p234_r_c'].\

nlargest(1).reset_index()

index p234_r_c

0 0 5.0

1 1 4.0

2 2 2.0

3 3 0.5

4 4 1.0

5 5 4.0

6 6 3.0

结果中的列plant1_type,plant2_type和city2发生了什么?它们不应该像在第一个groupby的结果中出现plant1_type,plant2_type和city1一样出现在结果中吗?

python在多个组中选一组_python-使用 pandas 在每个groupby组的列中选择最大的N相关推荐

  1. python列表用来有序存放一组_python 列表 元组(自兴人工智能)

    一:列表 列表的作用就是一次性存储多个数,存具有同样作用的数据,存储长度不定,数据类不限 特点: 1,有序数列,有下标,从0开始,单个查询快 2,列表元素可以为空 3,列表元素可以重复 语法: 1)声 ...

  2. python列表用来有序存放一组_python入门第二课------列表

    1. 列表可以用来存储字符,数字等信息 在geany(文本编辑器也可以直接在python终端输入)里输入以下内容: equipment=['train','car','plane']     /* e ...

  3. python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例

    功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...

  4. python 将excel文件转换为txt文件_python利用pandas将excel文件转换为txt文件的方法

    python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...

  5. python清洗数据去除停用词_Python从pandas数据帧中删除停用词

    我想从我的专栏"tweets"中删除停用词.如何迭代每一行和每个项目? pos_tweets = [('I love this car', 'positive'), ('This ...

  6. python给内置函数重命名_python – 以Pandas Groupby函数重命名列名

    1).我有一个以下示例数据集: >>> df ID Region count 0 100 Asia 2 1 101 Europe 3 2 102 US 1 3 103 Africa ...

  7. python用字典统计单词出现次数_python - 如何使用字典理解来计算文档中每个单词的出现次数...

    我有一个用python编写的列表,其中充满了文本.就像每个文档中的固定单词.所以对于每个文档,我都有一个列表,然后在列表中列出所有文档. 所有列表只包含唯一的单词.我的目的是计算完整文档中每个单词的出 ...

  8. python多个sheet数据透视表_python 用pandas实现数据透视表功能

    透视表是一种可以对数据动态排布并且分类汇总的表格格式.对于熟练使用 excel 的伙伴来说,一定很是亲切! pd.pivot_table() 语法: pivot_table(data, # dataf ...

  9. python中奖号_Python输入数字并从预定义的lis中选择中奖号码

    我昨天才开始学习Python,这是我第一次接触编程语言,我注意到我通过做一些事情比仅仅阅读来学习更好,所以我给自己分配了不同的任务,并不断地敲打自己的脑袋,直到我成功地完成它们. 关于我的问题,我相信 ...

最新文章

  1. epoll 使用详解
  2. UML类图与类的关系详解【转】
  3. 洛谷p2704 炮兵阵地
  4. 通过Dapr实现一个简单的基于.net的微服务电商系统(七)——一步一步教你如何撸Dapr之服务限流...
  5. 带你了解C#每个版本新特性
  6. [vue] vue2.0不再支持v-html中使用过滤器了怎么办?
  7. 合并分ER图产生的冲突
  8. Swift 5 时代的机遇与挑战到底在哪里?
  9. 干货!看云原生时代阿里云的四个“最”
  10. 【elasticsearch系列】双击elasticsearch.bat闪退,日志排查报错信息
  11. 计算机游戏动漫制作自我鉴定,动漫设计专业自我鉴定
  12. javq接口_java 接口详解
  13. VS同一个解决方案中不同项目相互引用问题
  14. 基于JAVA+SpringBoot+Mybatis+MYSQL的相册管理系统
  15. 学大伟业:2019年物理竞赛学习方法
  16. ini 文件 使用说明
  17. python爬虫实践之爬取豆瓣高评分电影
  18. 视网膜血管分割方法整理
  19. jzoj5990. 【北大2019冬令营模拟2019.1.6】Bear (状压dp)
  20. Adobe Photoshop 2020 21.2.2.289 中文版 — 图像处理工具

热门文章

  1. 【CComPtr】CComPtr和CComQIPtr的区别
  2. 在Visual C++中用ADO进行数据库编程(上)
  3. java的servlet是干嘛的_Servlet能够做什么?
  4. OpenCV掩码、blending、改变对比度和亮度、随机发生器和绘图
  5. Nature Milestones | 近20年人类癌症研究领域14项里程碑式进展!
  6. 聚类分析(一)基本思想
  7. ae多线程渲染工具:BG Renderer MAX for Mac(AE插件)
  8. 如何使用iToolab FixGo for mac修复iPhone/iPad的系统问题
  9. Mac上的一位数密码你知道吗
  10. macos server 恢复安装_如何通过 macOS 恢复功能重新安装 macOS