pandas concat_pandas合并几百个csv只需要一分钟?(含代码,拿去即可用)
数据分析免不了遇到很多个数据结构完全一样,就是数量太多,几十个,多则上千个,如何快速的合并文件一直是一个头疼的问题,在我学习了pandas的cocat后我写了一个小程序,运行后几百个文件都可以快速的合并完成,下面一起来看看如何实现:
本文涉及的知识点:
- tkinter的初步了解
- panads的concat
知识点回顾:
concat:
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
keys=None, levels=None, names=None, verify_integrity=False,
copy=True)
合并csv需要以下几个参数:
- objs:DataFrame的列表
- ignore_index=False:是否忽略原先的索引
代码实例讲解:
首先导入需要的库:
#ecoding:utf-8# Created by Administrator at 2018-8-27import pandas as pdimport osfrom tkinter.filedialog import askdirectoryimport tkinter as tkfrom tkinter import filedialog
第二步:因为文档经常涉及到中文,所以重点讲解在gbk编码下的实现过程:
想要实现批量合并,1、首先需要拿到文件的路径,根据路径实现循环。2、每个数据导入pandas后的数据名列表
1、获取文件名列表
print("请选择文件:")root = tk.Tk()root.withdraw()file_path = filedialog.askopenfilenames()
2、读取数据
file_list = []#定义一个列表用来放合并的文件名num=0for each in file_path: num+=1 print('正在读取:',each) each=d.read_csv(each,encoding='gbk') file_list.append(each)
3、合并数据
print('正在合并数据,请稍等...')result=pd.concat(file_list,ingone=True)
4、导出数据
print("请选择输出文件路径:")root = tk.Tk()root.withdraw()file_out=askdirectory()print('正在导出...')result.to_csv(file_out + '' + '合并结果' + '.csv', header=1, index=0)print('合并完成!',“共合并文件%s"%num)
如果你是utf编码的文件:
将步骤2中:encoding改为“utf-8”
"df%s"% num=d.read_csv(each,encoding='gbk')
pandas concat_pandas合并几百个csv只需要一分钟?(含代码,拿去即可用)相关推荐
- Python pandas库|任凭弱水三千,我只取一瓢饮(7)
上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(6)_Hann Yang的博客-CSDN博客 to_系列函数:22个 (12~22) Function12 to_numpy(s ...
- 【Python】图解Pandas数据合并:concat、join、append
公众号:尤而小屋 作者:Peter 编辑:Peter 图解pandas数据合并:concat+join+append 在上一篇文章中介绍过pandas中最为常用的一个合并函数merge的使用,本文中介 ...
- Pandas知识点-合并操作join
Pandas知识点-合并操作join 在Pandas中,join()方法也可以用于实现合并操作,本文介绍join()方法的具体用法. 一.基础合并操作 join(other): 将一个或多个DataF ...
- Pandas知识点-合并操作merge
Pandas知识点-合并操作merge merge()方法是Pandas中的合并操作,在数据处理过程中很常用,本文介绍merge()方法的具体用法. 一.基础合并操作 merge(left, righ ...
- Python pandas库|任凭弱水三千,我只取一瓢饮(4)
上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(3)_Hann Yang的博客-CSDN博客 R(read_系列2): Function36~45 Types['Funct ...
- Python pandas库|任凭弱水三千,我只取一瓢饮(6)
上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(5)_Hann Yang的博客-CSDN博客 DataFrame 类方法(211个,其中包含18个子类.2个子模块) >& ...
- Python pandas库|任凭弱水三千,我只取一瓢饮(3)
上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(2)_Hann Yang的博客-CSDN博客 R(read_系列1): Function26~35 Types['Functi ...
- pandas数据合并:concat、join、append
公众号:尤而小屋 作者:Peter 编辑:Peter 大家好,我是Peter~ 图解pandas数据合并:concat+join+append 在上一篇文章中介绍过pandas中最为常用的一个合并函数 ...
- pandas纵向合并数据
pandas纵向合并数据
最新文章
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制...
- 编程之美3.7 队列中最大值问题
- leetcode算法题--只有两个键的键盘
- 上传文件 微信小程序input_快速上手微信小程序UI框架
- MySQL存储过程和函数示例
- php 高级特性,PHP对象、模式与实践之高级特性分析
- 更改centos 7 的默认启动为命令界面
- 93后阿里P7晒出工资单:原来是狠补了这个~真香
- matlab浮点数求绝对值_MATLAB仿真阵列天线切比雪夫综合法(附代码)
- Codeforces Round #693 (Div. 3) G. Moving to the Capital dp + 思维
- python 类变量(属性)和实例变量(属性
- Linux C文件编译
- 算法与数据中台:网约车业务实践
- JAVA后端开发的一些工作经验
- 合理使用AutoHotKey+StrokeIt
- Android Studio实现多媒体播放器,音乐视频一体化
- python打九九乘法表上三角下三角_python经典练习题之九九乘法表、打印菱形、打印对顶三角形、斐波拉契数列、素数......
- What are Triangulation, Trilateration, and Multilateration?
- python简单的接口测试实例
- 阅文集团 php,阅文集团 梁晨 - TARS-PHP