pandas处理数据代码:分组聚合、保留重复行、删除重复行
txt转csv
import numpy as np
import pandas as pdtxt=np.loadtxt('1216.txt')txtDF=pDataFrame(txt)
txtDF.to_csv('1216.csv',index=False)
删除重复行 (删除所有、保留第一次出现的重复行、保留最后一次出现的重复行)
df1=pd.read_csv('1216gg.csv')
df1=df1.astype(str)
df1.drop_duplicates(subset=['0','1','2','3','4','5','6','7','8','9'],keep='first',inplace=True)
df1.to_csv('1216ggg.csv',index=False)//subset可自定义查看哪几列重复
保留重复行
道理很简单 :对一个csv文件df 首先去重 保留第一次出现的重复行 得到 df1其次 去除所有重复行 得到 df2df1.append(df2)
再对df1去除所有重复行 便得到df1中原来的重复行
每隔n行取一行
data = pd.read_csv('lcy.csv')df = pd.DataFrame(data)a=[]for i in range(0,len(df),10):##每隔20行取数据a.append(i)file = df.iloc[a]f = pd.DataFrame(file)f.to_csv(r'lcy112.csv', index=False,encoding='utf_8_sig')print('ok')
分组聚合 示例为分组求平均
df1=pd.read_csv('1216gg.csv')f=df1.groupby(['1','2','3','4','5','6','7','8','9']).transform(lambda x:x.mean())f.to_csv('1216aaa.csv',index=False)
总结:pandas真的很强大 本来想实现的目的,没想到pandas里都能实现
pandas处理数据代码:分组聚合、保留重复行、删除重复行相关推荐
- 如何使用agg函数对数据进行分组聚合
转载自知乎:侦探L 如何使用agg函数对数据进行分组聚合 - 知乎 在上篇文章中,我们详细地介绍了如何使用groupby函数对数据进行分组.而在python的数据分组中,除了groupby函数之外, ...
- pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)
pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...
- pandas对数据进行分组统计
pandas对数据进行分组统计 文章目录 pandas对数据进行分组统计 前言 一.分组后进行sum操作 二.分组后进行迭代操作 三.分组后进行聚合agg操作 四.使用自定义函数进行统计 五.使用di ...
- stream 多个字段分组_Python Pandas对Excel数据的分组聚合和数据透视
使用Excel进行商业数据分析的时候,最重要的就是两个手段就是vlookup函数和数据透视表.本章就讲解一下与数据透视功能相关的分组聚合和数据透视.其实分组聚合和数据透视两者基本是等价的,但由于使用的 ...
- 2021-03-05 pandas(合并_分组聚合_复合索引)
数据合并 join 默认情况下他是把行索引相同的数据合并到一起,以调用对象的行为准 调用对象不存在的行数不合并,调用对象存在但合并对象无数据的索引位置出现NaN In [1]: import pand ...
- 利用 Pandas 将数据集中的某列文本拆分为多行
背景 手头的项目要求用 Tableau 创建一个 story,数据集是摩拜上海城区用户使用数据.其中有一个维度的数据处理起来有点棘手. 数据格式 注意 track 这个维度的数据,它表示的是在订单时间 ...
- mysql 4.0 删除重复_mysql删除重复数据
最近遇到删除重复数据的问题,先分享一下解决办法,如有不完善之处还望包涵! 举例如下: mysql> select * from table03; +----+------+--------+ | ...
- 【shell】笔记|去重复行|删除匹配行|反选删除|反向显示|加减乘除
目录 配置 bash Shell忽略命令大小写 |按"上"键显示该命令的历史 shell 删除匹配行 shell 获取结果中的第n列,第n行 grep过滤 shell 注释块 Li ...
- SQL查询重复记录,删除重复记录
1.查找表中多余的重复记录,重复记录是根据单个字段(DocId)来判断 select * from TableNamewhere DocId in (select DocId from TableNa ...
最新文章
- [心跳] 使用心跳机制实现CS架构下多客户端的在线状态实时更新以及掉线自动重连...
- Docker容器通过独立IP暴露给局域网的方法
- react过渡动画效果的实现,react-transition-group
- Angular CLI创建的项目文件用途一栏
- 【静态站点(二)】之 Gridsome 基础
- 后缀的形容词_玩转英语词汇-词汇策略之形容词后缀
- python3.5安装教程linux_Linux下安装python3.6和第三方库的教程详解
- 物以类聚:对象也有生命
- python计算两个正整数的和差积商_已知两个正整数的和与积求这两个数
- 标准C程序设计七---05
- 股票软件c++源代码
- 推荐几个优秀的微信小程序UI组件库
- APP版本更新通知流程图
- 图片转Excel表格 文字识别 表格识别
- 俄罗斯方块Tetris(C基础,Linux终端)
- phpmywind 教程之多语言版本 面包屑导航之GetPosStr();
- LR字符串截取lr_save_var
- 三大运营商充话费送手机,里面的套路太深
- 360浏览器默认极速
- 新风医疗集团就私有化交易达成最终合并协议;​康泰生物成功分离新冠德尔塔变异株 | 医药健闻...
热门文章
- 维度――Beijing Openparty2010年8月清雨榕香后记
- 建筑行业搭建BI数据可视化平台,已成为大势所趋
- 基于SpringBoot+ Spring Data Jpa的后台管理系统【源码开源】
- 一篇文章可以多平台发表吗?2022年文章多平台发布教程
- MySQL| MySQL分组函数
- %.2f自动四舍五入
- 外国教授在 B 站当 UP 主上课,网友直呼好家伙:滑铁卢大学《差分隐私》课程上线
- 一个游戏程序员的学习资料【转载】
- 联想液晶显示器暴力拆解
- iphone8 html5检测,判断iPhone 8屏幕是否原装的巧妙方法,只需检查这个选项就可以了...