数据分析免不了遇到很多个数据结构完全一样,就是数量太多,几十个,多则上千个,如何快速的合并文件一直是一个头疼的问题,在我学习了pandas的cocat后我写了一个小程序,运行后几百个文件都可以快速的合并完成,下面一起来看看如何实现:

本文涉及的知识点:

  • tkinter的初步了解
  • panads的concat

知识点回顾:

concat:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,

keys=None, levels=None, names=None, verify_integrity=False,

copy=True)

合并csv需要以下几个参数:

  • objs:DataFrame的列表
  • ignore_index=False:是否忽略原先的索引

代码实例讲解:

首先导入需要的库:

#ecoding:utf-8# Created by Administrator at 2018-8-27import pandas as pdimport osfrom tkinter.filedialog import askdirectoryimport tkinter as tkfrom tkinter import filedialog

第二步:因为文档经常涉及到中文,所以重点讲解在gbk编码下的实现过程:

想要实现批量合并,1、首先需要拿到文件的路径,根据路径实现循环。2、每个数据导入pandas后的数据名列表

1、获取文件名列表

print("请选择文件:")root = tk.Tk()root.withdraw()file_path = filedialog.askopenfilenames()

2、读取数据

file_list = []#定义一个列表用来放合并的文件名num=0for each in file_path: num+=1 print('正在读取:',each) each=d.read_csv(each,encoding='gbk') file_list.append(each)

3、合并数据

print('正在合并数据,请稍等...')result=pd.concat(file_list,ingone=True)

4、导出数据

print("请选择输出文件路径:")root = tk.Tk()root.withdraw()file_out=askdirectory()print('正在导出...')result.to_csv(file_out + '' + '合并结果' + '.csv', header=1, index=0)print('合并完成!',“共合并文件%s"%num)

如果你是utf编码的文件:

将步骤2中:encoding改为“utf-8”

 "df%s"% num=d.read_csv(each,encoding='gbk')

pandas concat_pandas合并几百个csv只需要一分钟?(含代码,拿去即可用)相关推荐

  1. Python pandas库|任凭弱水三千,我只取一瓢饮(7)

    上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(6)_Hann Yang的博客-CSDN博客 to_系列函数:22个 (12~22) Function12 to_numpy(s ...

  2. 【Python】图解Pandas数据合并:concat、join、append

    公众号:尤而小屋 作者:Peter 编辑:Peter 图解pandas数据合并:concat+join+append 在上一篇文章中介绍过pandas中最为常用的一个合并函数merge的使用,本文中介 ...

  3. Pandas知识点-合并操作join

    Pandas知识点-合并操作join 在Pandas中,join()方法也可以用于实现合并操作,本文介绍join()方法的具体用法. 一.基础合并操作 join(other): 将一个或多个DataF ...

  4. Pandas知识点-合并操作merge

    Pandas知识点-合并操作merge merge()方法是Pandas中的合并操作,在数据处理过程中很常用,本文介绍merge()方法的具体用法. 一.基础合并操作 merge(left, righ ...

  5. Python pandas库|任凭弱水三千,我只取一瓢饮(4)

    上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(3)_Hann Yang的博客-CSDN博客  R(read_系列2):  Function36~45 Types['Funct ...

  6. Python pandas库|任凭弱水三千,我只取一瓢饮(6)

    上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(5)_Hann Yang的博客-CSDN博客 DataFrame 类方法(211个,其中包含18个子类.2个子模块) >& ...

  7. Python pandas库|任凭弱水三千,我只取一瓢饮(3)

    上一篇链接: Python pandas库|任凭弱水三千,我只取一瓢饮(2)_Hann Yang的博客-CSDN博客 R(read_系列1):  Function26~35 Types['Functi ...

  8. pandas数据合并:concat、join、append

    公众号:尤而小屋 作者:Peter 编辑:Peter 大家好,我是Peter~ 图解pandas数据合并:concat+join+append 在上一篇文章中介绍过pandas中最为常用的一个合并函数 ...

  9. pandas纵向合并数据

    pandas纵向合并数据

最新文章

  1. SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制...
  2. 编程之美3.7 队列中最大值问题
  3. leetcode算法题--只有两个键的键盘
  4. 上传文件 微信小程序input_快速上手微信小程序UI框架
  5. MySQL存储过程和函数示例
  6. php 高级特性,PHP对象、模式与实践之高级特性分析
  7. 更改centos 7 的默认启动为命令界面
  8. 93后阿里P7晒出工资单:原来是狠补了这个~真香
  9. matlab浮点数求绝对值_MATLAB仿真阵列天线切比雪夫综合法(附代码)
  10. Codeforces Round #693 (Div. 3) G. Moving to the Capital dp + 思维
  11. python 类变量(属性)和实例变量(属性
  12. Linux C文件编译
  13. 算法与数据中台:网约车业务实践
  14. JAVA后端开发的一些工作经验
  15. 合理使用AutoHotKey+StrokeIt
  16. Android Studio实现多媒体播放器,音乐视频一体化
  17. python打九九乘法表上三角下三角_python经典练习题之九九乘法表、打印菱形、打印对顶三角形、斐波拉契数列、素数......
  18. What are Triangulation, Trilateration, and Multilateration?
  19. python简单的接口测试实例
  20. 阅文集团 php,阅文集团 梁晨 - TARS-PHP

热门文章

  1. Python-day06-2018.7.9_编码以及小知识点补充
  2. eclipse恢复界面默认设置
  3. 常用的cmd快捷命令
  4. UVA11825: Hackers' Crackdown (状压dp)
  5. Java程序编译和运行的过程
  6. centos6.4 搭建knowlededgeroot-1.0.4知识库平台
  7. Mac的控制台命令行报错:command not found
  8. C# MD5加密解密帮助类
  9. MySQL自增字段并发插入导致死锁
  10. 阿里天猫、蚂蚁最全一百多道面试题以及阿里P8架构技能树分享(含答案解析)