pandas—groupby如何得到分组里的数据
pandas—groupby如何得到分组里的数据
有的时候csv文件过大,利用循环时间消耗大,因此可以通过分组。
原数据如下:
想把link和future特征为基准,把current整合起来放在一列。
在利用groupby分组时,有时并不想对分组统计处理,而是希望得到分组后其他项里的具体数据。搜了一下不知道是自己搜索关键词不对,还是怎样。试了好久终于自己试出来了。有啥好的方法也希望大家能够告诉我。
import pandas as pd
import numpy as np
#读取文件
df1=pd.read_csv(r'C:\Users\chl\Desktop\csv\20190702.csv',encoding='utf-8',low_memory=False,usecols=['link','current_slice_id','future_slice_id'])
df3=pd.read_csv(r'C:\Users\chl\Desktop\space.csv')
#根据link和futu特征进行分组
group=df1.groupby(['link','future_slice_id'])
list1=[]
list2=[]
#得到分组后每个组中的数据
for each in group:df=each[1]list1.append(df['current_slice_id'].values.tolist())list2.append(list1)list1=[]print('*')
#将得到的数据作为新的dataframe
df4=pd.DataFrame(list2)
df4.to_csv(r'C:\Users\chl\Desktop\test.csv')
each in group中print(each)后如图所示,它是一个元组,元组中的第二个元素才是我们需要的分组后的dataframe。然后按照dataframe的语法继续操作就好了。
我这里先把分类结果写入,追加的current列。效果如下。
pandas—groupby如何得到分组里的数据相关推荐
- pandas编写自定义函数计算多个数据列的加和(sum)、使用groupby函数和apply函数聚合计算分组内多个数据列的加和
pandas编写自定义函数计算多个数据列的加和(sum).使用groupby函数和apply函数聚合计算分组内多个数据列的加和 目录
- pandas使用groupby函数计算dataframe每个分组对应的数据行的个数(size of each group in dataframe, rows count of group)
pandas使用groupby函数计算dataframe每个分组对应的数据行的个数(size of each group in dataframe, rows count of group) 目录
- pandas groupby count_数据分析14-利用pandas进行数据分组
目标: 学会利⽤pandas对数据进⾏分组 知道如何提取分组后的数据 可以按多列进⾏分组 能够对分组后数据进⾏统计计算 测试数据集: 链接:https://pan.baidu.com/s/1QvY-Q ...
- php groupby后找最大时间,pandas获取groupby分组里最大值所在的行方法
下面为大家分享一篇pandas获取groupby分组里最大值所在的行方法,具有很好的参考价值,希望对大家有所帮助.一起过来看看吧 pandas获取groupby分组里最大值所在的行方法 如下面这个Da ...
- 用pandas批量分组处理excel数据
用pandas批量分组处理excel数据 需求比较简单,按照指定字段分组,计算指定字段的和或均值. 用SQL处理的话就一个groupby,可是没有数据库环境,只好用python(比起SQL真的是一点也 ...
- 数据分析三、pandas库 分组聚合与数据可视化
分组聚合与数据可视化 一.分组聚合 1.1.单层分组聚合:df.groupby(by)['列索引'].mean(). 1.1.1单层分组:df.groupby(by) 1.1.2聚合操作:['列索引' ...
- pandas python groupby_pandas之分组groupby()的使用整理与总结
前言 在使用pandas的时候,有些场景需要对数据内部进行分组处理,如一组全校学生成绩的数据,我们想通过班级进行分组,或者再对班级分组后的性别进行分组来进行分析,这时通过pandas下的groupby ...
- 【Python】Pandas groupby加速处理数据
在使用pandas的时候,经常会用到groupby这个函数来对数据进行分组统计,同时可以使用 apply函数很方便的对分组之后的数据进行处理. def data_process(x):# proces ...
- pandas访问分组里面的数据_实战用pandas+PyQt5制作一款数据分组透视处理工具
早起导读:pandas是Python数据处理的利器,如果每天都要使用pandas执行同样的操作,如何制作一个有界面的软件更高效的完成?本文提供了一种基于PyQt5的实现思路. 关键词:pandas P ...
最新文章
- [CVPR 2020] RandLA-Net:大场景三维点云语义分割新框架(已开源)
- python快速自学方式-Python怎样自学?
- 简述ie_apache_php_mysql的关系?,apache +php + mysql
- 【WebGL】《WebGL编程指南》读书笔记——第2章
- Ubuntu18.0.1 安装 anaconda conda cudnn pytorch-gpu
- 源码分析Android Handler是如何实现线程间通信的
- [20171107]dbms_shared_pool.pin.txt
- pytorch tensor 梯度
- R语言 相关分析和典型相关分析
- linux vi只写入1个字节,关于linux命令的说明(这是一个命令集)
- 数学建模matlab案例,数学建模案例matlab实用程序百例
- Idea设置全白色 背景
- 深度学习数学基础 熵?
- 微信小程序分析送积分功能如何实现_微信小程序如何建立积分系统?
- js版梅森旋转生成随机数
- 目前最经典有效的“阅读方法”——SQ3R阅读法
- 低代码开发平台建设步骤及思考
- python变量与赋值教学视频_Python第一课:print()函数、变量与赋值
- 爬取电影资源之网页爬取篇(python)
- defer script