目录

1.用concat方法合并csv

2.glob模块批量合并csv


1.用concat方法合并csv

将两个相同的csv文件进行数据合并,通过pandas的read_csv和to_csv来完成,即采用concat方法:

#加载第三方库
import pandas as pd
import numpy as np
#读取文件
df1 = pd.read_csv("文件-1.csv")
df2 = pd.read_csv("文件-2.csv")
#合并
df = pd.concat([df1,df2])
df.drop_duplicates()  #数据去重
#保存合并后的文件
df.to_csv('文件.csv',encoding = 'utf-8')

也可以增加一列标签,以区别两个合并后的数据:

#加载第三方库
import pandas as pd
import numpy as np
#读取文件
df1 = pd.read_csv("文件-1.csv")
df1["来自文件"] = "文件-1"
df2 = pd.read_csv("文件-2.csv")
df2["来自文件"] = "文件-2"
#合并
df = pd.concat([df1,df2])
df.drop_duplicates()  #数据去重
#保存合并后的文件
df.to_csv('文件.csv',encoding = 'utf-8')

2.glob模块批量合并csv

在利用合并少量文件时,可以使用上面的concat方法。但是遇到大量的相同文件需要合并,此时应该进行批量合并,这可以减少工作量,提高操作效率。

利用Python批量合并csv,这里介绍使用的方法是引入glob模块。

glob模块是最简单的模块之一,内容少,它可以查找符合特定规则的文件路径名。

通过glob方法遍历所有文件,读取数据并追加保存到文件中。

import numpy as np
import pandas as pd
import glob
import recsv_list = glob.glob('*.csv')
print('共发现%s个CSV文件'% len(csv_list))
print('正在处理............')
for i in csv_list:fr = open(i,'r',encoding='utf-8').read()with open('文件合集.csv','a',encoding='utf-8') as f:f.write(fr)
print('合并完毕!')

以上方法是合并csv文件,要合并excel文件同理。

利用python合并csv文件相关推荐

  1. [转载] 利用python对csv文件进行简单的数据分析

    参考链接: Python中的探索性数据分析 利用python对csv文件进行简单的数据分析 在通过爬虫爬取数据后,将数据放到csv文件里,为了方便观察,可以对数据进行简单的分析.下面我将对爬取的51j ...

  2. 利用MTurk和Qualtrics发放问卷与数据分析,设置survey code,使用vlookup或python合并csv文件

    目录 问卷制作 问卷发布 数据下载 数据处理 ​​​​​​​ 问卷制作 据说MTurk自带的问卷不是很好用,所以我们选择在Qualtrics制作问卷. 新建project创建新问卷: 左侧有很多格式与 ...

  3. python合并csv文件、并利用结果进行计算_python合并csv文件

    学一点总结一点,积少成多^_^ 需求:有两个csv文件,需要按列合并.举例如下: a.csv: column1    column2    column3 a1               a21 a ...

  4. python合并csv文件_PYTHON合并CSV文件的实践

    最近尝试使用PYTHON处理CSV数据,由于CSV文件有好几个,需要提前拼接,然后再处理,因此遇到了PYTHON对文件进行合并的问题.此次尝试了两种方法:一是调用CMD命令处理:二是使用PYTHON写 ...

  5. 说说如何利用 Python 处理 CSV 文件

    CSV 表示 "Comma-Separated Values (逗号分隔的值) " , CSV 文件是简化的电子表格,实际为纯文本文件. 一个 CSV 文件,格式是这样的: 因为 ...

  6. python计算csv列平均值_利用Python读取CSV文件并计算某一列的均值和方差

    近日需要对excel的csv文件进行处理,求取某银行历年股价的均值方差等一系列数据 文件的构成很简单,部分如下所示 总共有接近七千行数据,主要的工作就是将其中的股价数据提取出来,放入一个数组之中,然后 ...

  7. python合并csv文件_Python学习——pandas 合并csv文件

    import pandas as pd import os import re import numpy as np Folder_Path = r'C:/Users/Cable-Ching\Desk ...

  8. python读取csv求平均数_利用Python读取CSV文件并计算某一列的均值和方差

    近日需要对excel的csv文件进行处理,求取某银行历年股价的均值方差等一系列数据 文件的构成很简单,部分如下所示 总共有接近七千行数据,主要的工作就是将其中的股价数据提取出来,放入一个数组之中,然后 ...

  9. 利用python读取csv文件中url并下载

    这是天池竞赛中数据集下载的csv文件,在这里当然也可以用wget在linux中进行下载,但这样感觉不太cool. 写了个python程序,文件夹栏 import pandas as pd import ...

  10. 利用Python将csv文件按照某列分成小csv

    需求:网上下载的csv文件,包含的几十万的数据,想要根据MMSI的值分为不同的csv文件 主要步骤: read_csv:读取存放所有数据的csv文件 drop_duplicates:去掉重复的数据(默 ...

最新文章

  1. 常用的JQuery数字类型验证正则表达式
  2. Linux文件查找工具的探索
  3. angular 注入器配置_angular依赖注入
  4. (Pwn)CTF工具 ROPgadget 的安装与使用介绍
  5. 关于网络编程的一些问题
  6. Qt::WA_NoMousePropagation用法
  7. JBoss 4.2.x Spring 3 JPA Hibernate教程
  8. qtable sorting enable中文是按照什么顺序_作为雅思过来人,你有什么话想告诫雅思小白的?...
  9. 通俗易懂的MonteCarlo积分方法(六)
  10. 语音信号的LPC特征提取
  11. Java 拾遗补阙 ----- Switch case语句
  12. 4246. 【五校联考6day2】san (Standard IO)
  13. vss问题:客户端提示Sourcesafe cannot find a default database.Would you like to select one?
  14. localtime和localtime_r
  15. 使用Linux Deploy在android手机上部署Ubuntu
  16. 花滑三周连跳_花滑未来能有人做五周跳吗 专家:四周半或是极限
  17. 马化腾罕见点评马云和李彦宏,BAT大佬思维谁更胜一筹?
  18. 学习java的第十三天,回顾方法的定义及调用,以及面向对象构造器、类与对象的关系等基础
  19. altera DCFIFO IP核 功能仿真
  20. QFP PQFP LQFP TQFP封装形式及PCB详解!

热门文章

  1. html设置尖角,CSS为div添加尖角样式
  2. 计算机关闭多重网络协议,Win7多重网络问题
  3. 利用神经网络识别12306验证码——(四)数据增广以及训练集、验证集的划分
  4. Python爬虫入门教程:豆瓣Top电影爬取
  5. 计算机脚本发生错误,我的电脑开机后显示当前页面的脚本发生错误?
  6. 让生如夏花之绚烂 死如秋叶之静美 (全诗)
  7. java 数字转换字母大写_大写字母或小写字母转换为数字
  8. qq说说时间轴php实现,qq空间时间轴PHP实现时间轴函数代码
  9. java根据身份证号或生日计算年龄
  10. nginx+uWSGI+django+virtualenv+supervisor发布web服务器流程