前言

在网上找了很多Python处理Excel的方法和代码,都不是很尽人意,所以自己综合网上各位大佬的方法,自己进行了优化,具体的代码如下。

博主也是新手一枚,代码肯定有很多需要优化的地方,欢迎各位大佬提出建议~

代码我自己已经用了一段时间,可以直接拿去用

主要功能

按行合并 ,即保留固定的表头(如前几行),实现多个Excel相同格式相同名字的表单按纵轴合并;

按列合并。 即保留固定的首列,实现多个Excel相同格式相同名字的表单按横轴合并;

表单集成 ,实现不同Excel中相同sheet的集成(即不汇总,仅集成到同一个新的Excel中)。此处的代码稍微改一下即可实现不同Excel中所有sheet的集成;

自动检测所需合并的sheet名称是否出现在所有的目标文件中,如果不是则予以提示 ;

sheet选择、表头选择、功能选择界面实现可视化;

合并后进行简单的缺省值处理、格式处理

解决MacOS系统下文件目录中出现.DS_Store隐藏文件导致程序出错的bug。

用到的库

pandas 、tkinter 、 pathlib、os 、 xlrd

代码

import pandas as pd

import tkinter as tk

from tkinter import filedialog

import pathlib

import os

import xlrd

# 选择文件夹对话框,窗口交互,打开选择窗口

filedirectory = filedialog.askdirectory()

p1 = pathlib.Path(filedirectory) # 该部分主要为了获取目标路径下的文件名

print(p1)

bookname1 = os.listdir(p1) # 返回目标文件夹下的所有文件名

if ".DS_Store" in bookname1:

bookname1.remove('.DS_Store')

# 删除文件名里的.xlsx

bookname = []

for n in bookname1:

n1 = list(n) # 把字符变成列表

for i in range(5): # 因为去除的是.XSLX,5个字符,可以根据实际需要修改

n1.pop() # 依次删除最后一个元素

n2 = ''.join(n1) # 把列表变成字符

bookname.append(n2)

excles = p1.rglob('*.xlsx') # 类似于os.work,能够返回目标路径下的文件路径,并且可以添加条件

excelarr = []

for eachexcel in excles:

excelarr.append(eachexcel) # 创建目标路径下特定文件名的列表

# 建立一个交互窗口

windows = tk.Tk()

windows.title('请提供如下信息') # 设置文本框的标题

windows.geometry('1000x300') # 设置界面的大小

# tk.Label(windows, text='你好!this is Tkinter', bg='green', font=('Arial', 12), width=30, height=2)

# 说明:bg为背景,font为字体,width为长,height为高,这里的长和高是字符的长和高,比如height=2,就是标签有2个字符这么高)

tk.Label(windows, text='请输入想要合并的sheet名称:').grid(row=0, column=0) # label用来显示不可编辑的文本和图标(提示性文字)

tk.Label(windows, text='请输入想要确定的表头行数:').grid(row=1, column=0)

tk.Label(windows, text='请输入您想实现的功能,1为按行合并sheet,2为按列合并sheet,3为sheet汇总:').grid(row=2, column=0)

# Listbox(dict={}) # 创建可选下拉框

e1 = tk.Entry(windows) # 创建输入框

e2 = tk.Entry(windows) # 创建第2个输入框

e3 = tk.Entry(windows)

e1.grid(row=0, column=1, padx=10, pady=5)

e2.grid(row=1, column=1, padx=10, pady=5)

e3.grid(row=2, column=1, padx=10, pady=5)

tk.Button(windows, text='点击继续', width=10, command=windows.quit) \

.grid(row=4, column=1, sticky=tk.E, padx=10, pady=5) # sticky表示方位,NSWE为上下左右

tk.mainloop() # 结束循环

# 为变量赋值

word = str(e1.get())

number = int(e2.get()) - 1

choice = int(e3.get())

# 检查想要处理的sheet是否在所有的目标文件中

file_list = os.listdir(p1)

file_list.remove('.DS_Store') # 移除Mac系统自动生成的文件

for file in file_list: # 循环遍历列出所有文件名称

file_name = os.path.join(p1, file) # 因os.listdir工具返回的是目标文件夹里文件的名字,然而打开文件需要文件路径+名字,故通过此工具获取完整的文件名

workbook = xlrd.open_workbook(file_name) # 打开遍历的文件

if word in workbook.sheet_names():

continue

else:

print(str(file) + '中不存在想要合并的sheet')

if choice == 2:

p1 = pd.ExcelFile(excelarr[0]) # 读取获取到的第一个文件名对应的文件

mergedata1 = p1.parse(header=number, sheet_name=word).iloc[:, 0] # 设置索引为第一行,如果为index_col,则索引为第一列 iloc为取特定的列

p2 = []

for i in range(0, len(excelarr)):

tmp = pd.ExcelFile(excelarr[i]) # 读取文件

currentdata = tmp.parse(header=number, sheet_name=word).iloc[:, [1, 2, 3, 4]] # 读取特定的列

mergedata1 = pd.concat([mergedata1, currentdata], axis=1) # concat连接函数,唯一必须的参数是参与连接的对象的列表或字典。axis=1,表示可以按照纵轴来合并

n = currentdata.shape[1] # 返回Dataframe的行数,1为返回列数

p2.append(n) # 获取读取文件的行数列表

name_list = []

i = 0

# 获取应插入的文件名的列表

for a1 in bookname:

for x in range(p2[i]):

name_list.append(a1)

i = i + 1

name_list.insert(0, '来自表格')

mergedata1.loc[-1] = name_list # 按行插入

if choice == 1:

p1 = pd.ExcelFile(excelarr[0]) # 读取获取到的第一个文件名对应的文件

mergedata1 = p1.parse(header=number, sheet_name=word) # 设置索引为第一行,如果为index_col,则索引为第一列

p2 = []

p2.append(mergedata1.shape[0])

for i in range(1, len(excelarr)):

tmp = pd.ExcelFile(excelarr[i]) # 读取文件

currentdata = tmp.parse(header=number, sheet_name=word) # 读取特定的表

mergedata1 = pd.concat([mergedata1, currentdata]) # concat连接函数,唯一必须的参数是参与连接的对象的列表或字典。axis=1,表示可以按照纵轴来合并

n = currentdata.shape[0] # 返回Dataframe的行数,1为返回列数

p2.append(n) # 获取读取文件的行数列表

name_list = []

i = 0

# 获取应插入的文件名的列表

for a1 in bookname:

for x in range(p2[i]):

name_list.append(a1)

i = i + 1

mergedata1.insert(0, '来自表格', name_list) # 插入第一列,作为表格数据来源的注释

if choice == 3:

i = 0

fname = tk.filedialog.asksaveasfilename(title=u'保存文件', filetypes=[("excel", ".xlsx")])

# fideialog的一个方法,可以实现数据储存是要保存的名字

writerExcel = pd.ExcelWriter(fname+'.xlsx') # 写入到一个新的Excel,并且命名为上一步骤确认的名字

for name in bookname:

p1 = pd.ExcelFile(excelarr[i])

mergedata1 = p1.parse(header=number, sheet_name=word) # 设置索引为第一行,如果为index_col,则索引为第一列

# mergedata1.dropna(thresh=4, inplace=True) # 必须使用inplace才可以使数据库记住删除的单元格

# mergedata1.dropna(axis='columns', how='all') # 删除全是缺失值的列

mergedata1.fillna('0') # 将所有缺失值填充为0

mergedata1.to_excel(writerExcel, sheet_name=name, index=False) # 新建一个sheet储存信息

i = i + 1

if choice != 3:

# 数据清理

mergedata1.dropna(thresh=4, inplace=True) # 必须使用inplace才可以使数据库记住删除的单元格

mergedata1.dropna(axis='columns', how='all') # 删除全是缺失值的列

mergedata1.fillna('0') # 将所有缺失值填充为0

# 保存至excel

fname = tk.filedialog.asksaveasfilename(title=u'保存文件',

filetypes=[("excel", ".xlsx")]) # fideialog的一个方法,可以实现数据储存是要保存的名字

writerExcel = pd.ExcelWriter(fname + '.xlsx') # 写入到一个新的Excel,并且命名为上一步骤确认的名字

mergedata1.to_excel(writerExcel, sheet_name='汇总表', index=False) # 将之前汇总的farmdate数据通过to excel写入到Excel中

# 设置格式

sheetname = writerExcel.sheets

workbook = writerExcel.book

for sheets in sheetname:

worksheet = writerExcel.sheets[sheets]

format1 = workbook.add_format({'num_format': '###,##0.00', })

# 通过xlsxwriter模块命名format1的格式,对于数字内容,每三位进行一个分隔符,并且保留两位小数。#.00%为保留两位小数的百分数.border为边框。最后为文本换行和居中

# format2 = workbook.add_format({'bold': True, 'italic': True}) # 加粗、斜体

worksheet.set_column('A:ZZ', 16, format1) # 将上述定义的格式应用到具体的单元格

# worksheet.set_row(0, 16, format2) # 将特定格式用于表头

writerExcel.save() # 保存Excel

print('success')

总结

到此这篇关于利用Python pandas对Excel进行合并的文章就介绍到这了,更多相关Python pandas对Excel合并内容请搜索随便开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持随便开发网!

python利用pandas合并excel表格代码_利用Python pandas对Excel进行合并的方法示例相关推荐

  1. python做excel表格代码_[宜配屋]听图阁

    安装两个库:pip install xlrd.pip install xlwt 1.python读excel--xlrd 2.python写excel--xlwt 1.读excel数据,包括日期等数据 ...

  2. 随机数写excel java代码_基于python实现在excel中读取与生成随机数写入excel中

    搜索热词 具体要求是:在一份已知的excel表格中读取学生的学号与姓名,再将这些数据放到新的excel表中的第一列与第二列,最后再生成随机数作为学生的考试成绩. 首先要用到的数据库有:xlwt,xlr ...

  3. java填充excel表格中_填充导出Java导出excel表格

    近期朋友几篇文章介绍了改填充导出的文章. 关联文章的地址 之前做项目的时候需要数据库导出excel格式,由于项目赶没实现,现在分享下如何用java导出excel.话不多说案例如下: 首先要做的是导入一 ...

  4. JSP设置Excel表格换行_外企大公司的 Excel 表格,都是这样设置隐藏的

    Excel表格中不需要显示的行或列,我们都是隐藏起来,需要时再取消隐藏. 小编接触过很多外企大公司,他们的表格中是这样设置隐藏的: 是不是比隐藏更方便.它是使用了Excel中的组合功能( 数据 - 创 ...

  5. python删除数据库的数据完整代码_利用python操作小程序云数据库实现简单的增删改查...

    不止python,你可以利用任何语言那实现通过http请求来操作你自己的小程序云数据库了 背景 也是在最近吧,小程序更新了云开发 HTTP API 文档,提供了小程序外访问云开发资源的能力,使用 HT ...

  6. python身份证号掩盖出生日期的代码_利用Python制作全国身份证号验证及查询系统!就问你吊不吊!...

    大家好哇,又是一个愉快的周末,今天本鸟给大家分享1个有趣的实战项目,用python制作"全国身份证号验证及查询系统",成品界面如下图: 本系统可以实现身份证号真伪验证,年龄.性别及 ...

  7. python做excel表格柱状图_用python处理excel数据(八)实现excel表中柱状图功能

    实现excel表中柱状图的功能,并按金额排序. 引入matplotlib.pyplot模块. 下面是用pandas画的图,excel中出现中文可能会出现报错. import pandas as pd ...

  8. python自制简易二维码代码_用python把自己的二维码制作成动态码,一行代码即可搞定!敲简单!...

    分享一个比较有意思的项目,只需要一行Python代码就可以快捷方便生成普通二维码.艺术二维码(黑白/彩色)和动态GIF二维码. 用法比较简单,直接通过pip安装即可. pip3 install myq ...

  9. python画圆弧组成的花瓣代码_用Python绘制个花朵代码示例

    用Python绘制个花朵代码示例及解析 #导入turtle模块 import turtle window=turtle.Screen() #创建一个新窗口用于绘图 babbage=turtle.Tur ...

最新文章

  1. 【Ubuntu】ubuntu webqq桌面版pywebqq
  2. SEO之网站页面优化策略
  3. Python_基础_1
  4. MySQL查看表结构的实际操作命令简介
  5. 上学路线 (Standard IO)
  6. python自增_关于 python 的自增运算
  7. arduino无源蜂鸣器歌曲编码_Arduino与无源蜂鸣器
  8. python email模块详解_python模块之email: 电子邮件编码解码 (一、解码邮件)
  9. 解决Eclipse java build path中Web App Libraries无法自动找到WEB-INF的lib目录
  10. Linux 字符集 en_us,Linux语言环境:en_US.UTF-8 vs en_US
  11. mysql中游标能不能更新数据库_MySQL与MariaDB中游标的使用
  12. 洛谷P1127 词链 欧拉路问题
  13. [转载] python中异常处理的四个句子_Python学习笔记总结(四)异常处理
  14. 「小程序JAVA实战」小程序页面的上拉下拉刷新(50)
  15. Android学习笔记(十二)——使用意图传递数据的几种方式
  16. 建立书签链接的html语言,书签链接
  17. [NLP论文阅读]Learned in Translation: Contextualized Word Vectors
  18. 关于 python ImportError: No module named 的问题及解决办法
  19. 工信部新规本月底施行 未经用户同意发送商业短信将被罚款
  20. 基本共射极放大电路电路分析

热门文章

  1. 个人pkm软件 pim软件_个人申请软件著作权需要走哪些流程
  2. 矩阵分析理论在实际工程中的应用_【顶管技术在市政给排水工程中的应用分析】...
  3. php页面不断弹出值_电脑自动弹出网页怎么办
  4. 阿里云 ecs mysql搭建_使用ECS和mysql搭建mysql服务器-阿里云开发者社区
  5. 人脸识别错误代码437是什么意思_lol手游repeat ready check fails什么意思 解决攻略大全...
  6. cv2 imwrite中文路径_python3下使用cv2.imwrite存储带有中文路径图片的方法
  7. brew php7 intl_brew安装php7
  8. 如何将单机版的Eureka服务改为集群版Eureka服务
  9. linux 离线安装中文,linux离线安装及配置redis-Go语言中文社区
  10. java+的数组分割符_Java:使用分隔符连接基元数组