pandas—groupby如何得到分组里的数据

有的时候csv文件过大,利用循环时间消耗大,因此可以通过分组。
原数据如下:
想把link和future特征为基准,把current整合起来放在一列。
在利用groupby分组时,有时并不想对分组统计处理,而是希望得到分组后其他项里的具体数据。搜了一下不知道是自己搜索关键词不对,还是怎样。试了好久终于自己试出来了。有啥好的方法也希望大家能够告诉我。

import pandas as pd
import numpy as np
#读取文件
df1=pd.read_csv(r'C:\Users\chl\Desktop\csv\20190702.csv',encoding='utf-8',low_memory=False,usecols=['link','current_slice_id','future_slice_id'])
df3=pd.read_csv(r'C:\Users\chl\Desktop\space.csv')
#根据link和futu特征进行分组
group=df1.groupby(['link','future_slice_id'])
list1=[]
list2=[]
#得到分组后每个组中的数据
for each in group:df=each[1]list1.append(df['current_slice_id'].values.tolist())list2.append(list1)list1=[]print('*')
#将得到的数据作为新的dataframe
df4=pd.DataFrame(list2)
df4.to_csv(r'C:\Users\chl\Desktop\test.csv')

each in group中print(each)后如图所示,它是一个元组,元组中的第二个元素才是我们需要的分组后的dataframe。然后按照dataframe的语法继续操作就好了。
我这里先把分类结果写入,追加的current列。效果如下。

pandas—groupby如何得到分组里的数据相关推荐

  1. pandas编写自定义函数计算多个数据列的加和(sum)、使用groupby函数和apply函数聚合计算分组内多个数据列的加和

    pandas编写自定义函数计算多个数据列的加和(sum).使用groupby函数和apply函数聚合计算分组内多个数据列的加和 目录

  2. pandas使用groupby函数计算dataframe每个分组对应的数据行的个数(size of each group in dataframe, rows count of group)

    pandas使用groupby函数计算dataframe每个分组对应的数据行的个数(size of each group in dataframe, rows count of group) 目录

  3. pandas groupby count_数据分析14-利用pandas进行数据分组

    目标: 学会利⽤pandas对数据进⾏分组 知道如何提取分组后的数据 可以按多列进⾏分组 能够对分组后数据进⾏统计计算 测试数据集: 链接:https://pan.baidu.com/s/1QvY-Q ...

  4. php groupby后找最大时间,pandas获取groupby分组里最大值所在的行方法

    下面为大家分享一篇pandas获取groupby分组里最大值所在的行方法,具有很好的参考价值,希望对大家有所帮助.一起过来看看吧 pandas获取groupby分组里最大值所在的行方法 如下面这个Da ...

  5. 用pandas批量分组处理excel数据

    用pandas批量分组处理excel数据 需求比较简单,按照指定字段分组,计算指定字段的和或均值. 用SQL处理的话就一个groupby,可是没有数据库环境,只好用python(比起SQL真的是一点也 ...

  6. 数据分析三、pandas库 分组聚合与数据可视化

    分组聚合与数据可视化 一.分组聚合 1.1.单层分组聚合:df.groupby(by)['列索引'].mean(). 1.1.1单层分组:df.groupby(by) 1.1.2聚合操作:['列索引' ...

  7. pandas python groupby_pandas之分组groupby()的使用整理与总结

    前言 在使用pandas的时候,有些场景需要对数据内部进行分组处理,如一组全校学生成绩的数据,我们想通过班级进行分组,或者再对班级分组后的性别进行分组来进行分析,这时通过pandas下的groupby ...

  8. 【Python】Pandas groupby加速处理数据

    在使用pandas的时候,经常会用到groupby这个函数来对数据进行分组统计,同时可以使用 apply函数很方便的对分组之后的数据进行处理. def data_process(x):# proces ...

  9. pandas访问分组里面的数据_实战用pandas+PyQt5制作一款数据分组透视处理工具

    早起导读:pandas是Python数据处理的利器,如果每天都要使用pandas执行同样的操作,如何制作一个有界面的软件更高效的完成?本文提供了一种基于PyQt5的实现思路. 关键词:pandas P ...

最新文章

  1. [CVPR 2020] RandLA-Net:大场景三维点云语义分割新框架(已开源)
  2. python快速自学方式-Python怎样自学?
  3. 简述ie_apache_php_mysql的关系?,apache +php + mysql
  4. 【WebGL】《WebGL编程指南》读书笔记——第2章
  5. Ubuntu18.0.1 安装 anaconda conda cudnn pytorch-gpu
  6. 源码分析Android Handler是如何实现线程间通信的
  7. [20171107]dbms_shared_pool.pin.txt
  8. pytorch tensor 梯度
  9. R语言 相关分析和典型相关分析
  10. linux vi只写入1个字节,关于linux命令的说明(这是一个命令集)
  11. 数学建模matlab案例,数学建模案例matlab实用程序百例
  12. Idea设置全白色 背景
  13. 深度学习数学基础 熵?
  14. 微信小程序分析送积分功能如何实现_微信小程序如何建立积分系统?
  15. js版梅森旋转生成随机数
  16. 目前最经典有效的“阅读方法”——SQ3R阅读法
  17. 低代码开发平台建设步骤及思考
  18. python变量与赋值教学视频_Python第一课:print()函数、变量与赋值
  19. 爬取电影资源之网页爬取篇(python)
  20. defer script

热门文章

  1. Chrome 的7大缺陷以及相关解决方案
  2. STM32F103ZET6学习记录-串口通信部分
  3. 时间复杂度中的log(n)底数到底是多少?
  4. 检测到磁盘可能为uefi引导_如何用uefi引导安装win7
  5. [536]python将1张图片分割成9张
  6. 用Python自动生成数据分析报告!
  7. Anyproxy的安装和使用
  8. ROS话题通信自定义msg实现发送接收(六)c++、python
  9. MES系统具有哪些优势
  10. js 时间戳转成正常时间