三张表格数据(上万条)需要比对,看是否有重复存在,使用excel自身进行数据核对显然数据量比较庞大,所以考虑使用python脚本来实现。

from openpyxl import load_workbook, Workbookwb1 = load_workbook('/Users/Mike/Downloads/ceshi/employee1.xlsx')
wb2 = load_workbook('/Users/Mike/Downloads/ceshi/employee2.xlsx')
wb3 = load_workbook('/Users/Mike/Downloads/ceshi/employee3.xlsx')a_wb = wb1['employee']
b_wb = wb2['employee']
c_wb = wb3['employee']a_wb_max_row = len(a_wb['B'])
b_wb_max_row = len(b_wb['B'])
c_wb_max_row = len(c_wb['B'])'''
# 提取姓名
for row in a_wb.iter_cols(min_row=1, max_row=a_wb_max_row, min_col=1, max_col=1, values_only=True):row1 = list(row)
print(row1)
for row in b_wb.iter_cols(min_row=1, max_row=b_wb_max_row, min_col=1, max_col=1, values_only=True):row2 = list(row)
# print(row2)
for row in c_wb.iter_cols(min_row=1, max_row=c_wb_max_row, min_col=1, max_col=1, values_only=True):row3 = list(row)
'''# 提取邮箱
for row in a_wb.iter_cols(min_row=2, max_row=a_wb_max_row, min_col=2, max_col=2, values_only=True):row1 = list(row)
# print(row1)
for row in b_wb.iter_cols(min_row=2, max_row=b_wb_max_row, min_col=2, max_col=2, values_only=True):row2 = list(row)
# print(row2)
for row in c_wb.iter_cols(min_row=2, max_row=c_wb_max_row, min_col=2, max_col=2, values_only=True):row3 = list(row)# print(row3)# 同时存在三张数据表格中
c = []
for i in row1:if i in row2:if i in row3:c.append(i)
for i in c:if i == None:c.remove(i)
print(c)wb3 = Workbook()
d_wb = wb3.activefor i in range(len(c)):d = [c[i]]d_wb.append(d)wb3.save('/Users/Mike/Downloads/mynewdata1.xlsx')# 1表v2表v3表不存在的数据
e = []
for i in row1:if i not in row2:if i not in row3:e.append(i)
for i in e:if i == None:e.remove(i)
print(e)wb4 = Workbook()
e_wb = wb4.activefor i in range(len(e)):f = [e[i]]e_wb.append(f)wb4.save('/Users/Mike/Downloads/mynewdata2.xlsx')# 2表v3表不存在的数据
f = []
for i in row2:if i not in row3:f.append(i)
for i in f:if i == None:f.remove(i)
print(f)wb5 = Workbook()
f_wb = wb5.activefor i in range(len(f)):g = [f[i]]f_wb.append(g)wb5.save('/Users/Mike/Downloads/mynewdata3.xlsx')# 1表v2表不存在的数据
g = []
for i in row1:if i not in row2:g.append(i)
for i in g:if i == None:g.remove(i)
print(g)wb6 = Workbook()
h_wb = wb6.active
for i in range(len(g)):h = [g[i]]h_wb.append(h)wb6.save('/Users/Mike/Downloads/mynewdata4.xlsx')

python多找表格进行数据对比相关推荐

  1. python读取csv表格的数据并用matplotlib画曲线图

    前言 python读取csv表格的数据并用matplotlib回曲线图 1.导入相关库 import matplotlib.pyplot as plt import pandas as pd impo ...

  2. python 显示表格数据_python显示excel表格数据-怎么用python读取excel表格的数据

    怎么用python读取excel表格的数据 #导入包 import xlrd #设置路径 path='C:\\Users\\jyjh\\Desktop\\datap.xlsx' #打开 data=xl ...

  3. 用 Python 对 Excel 表格内数据进行去重、分类,标记异常及分析

    Python与Excel表格综合实例四:对 Excel 表格内数据进行去重.分类,异常处理及分析 前言: 主要实现代码及思路: 1.主要思路: 2.读取数据函数: 3.数据去重函数: 4.数据分类函数 ...

  4. python两个表格相同数据筛选_python如何统计所有文本文件的行数 如何用python实现两个文件重复数据筛选并统计...

    如何用python统计文本中重复行的数目? python比较txt文档中每行文本之间重复词的个数不想面对他离开,逃避不是一个好方法,但却是唯一的办法. 每一行弄成一个集合,分享两个集合之间的交集,计算 ...

  5. 基于Python读取Excel表格文件数据并转换为字典dict格式

      有时我们需要将一个Excel表格文件中的全部或一部分数据导入到Python并转换为字典格式,如何实现呢?   我们以如下所示的一个表格(.xlsx格式)作为简单的示例.其中,表格共有两列,第一列为 ...

  6. python提取word表格中数据

    程序分析 今天文章介绍一个实战案例,与自动化办公相关:案例思想是源于前两天帮读者做了一个 demo ,需求大致将一上百个 word 中表格内容提取出来(所有word 中表格样式一样),把提取到的内容自 ...

  7. Python读取excel表格人员数据同时批量写入多个excel个人登记表

    背景:驻村期间需要将1张含有200多人的人员记录数据写入人员信息登记表中,1条记录对应一个人员信息登记表.如果复制粘贴肯定比较慢,所以当然使用Python来解决.涉及的字段其实有23个,因涉及其他问题 ...

  8. python两个表格相同数据筛选_如何将多个表格中数据筛选汇总在一个表格里?

    谢邀,这是个非常常见的需求,解决起来也非常容易.下面用分别用excel和python演示一下如何操作. 先建立了一个和题主工作簿类似的甲乙两个excel文件,每个文件包含3个sheet,其实不管几个文 ...

  9. Python两个表格的数据相乘

    问题描述: 表1中有两列数据分别是开始时间和结束时间,表2中有两列数据分别是参数1和参数2,需求是通过result = he * Start + hst * End求出每一行数据的答案. 求解步骤: ...

  10. python读取前两列数据对比_使用Python的Dataframe取两列时间值相差一年的所有行方法...

    在使用Python处理数据时,经常需要对数据筛选. 这是在对时间筛选时,判断两列时间是否相差一年,如果是,则返回符合条件的所有列. data原始数据: data[map(lambda x:dateti ...

最新文章

  1. java定时器检测状态_实用代码| shell脚本实现定时检查应用状态
  2. 【转】误差矩阵(混淆矩阵)评价法
  3. 广告点击率(CTR)预测经典模型 GBDT + LR 理解与实践(附数据 + 代码)
  4. 【遥感物候】Hants NDVI时间序列谐波分析法数据重构,植被生长季曲线效果可佳(附Hants软件下载)
  5. Spring JPA数据+Hibernate+ MySQL + Maven
  6. gnss单频软件接收机应用与编程_GNSS/GPS RTK定位 (手机,无人车定位,无人驾驶,因子图优化)...
  7. 开机即启动Activity
  8. 运维监控软件 wgcloud 更新,v3.2.7 重构告警模块
  9. android核心系列--1,组件生命周期
  10. appium-滑动、拖动操作
  11. Mybatis使用关联查询由于表名字段重复导致的问题
  12. 英特尔显卡笔记本屏幕自动调光功能导致屏幕闪烁----笔记本显示器闪烁
  13. 用DirectX做2D游戏的三种方法
  14. 攻防世界misc高手进阶区刷题记录
  15. 七、HTMLTestRunner生成测试报告
  16. qpython3l安装包下载_python安装包 官方版
  17. python数字加千分符 逗号
  18. Linux发行版镜像地址
  19. 1071 小赌怡情 (15分)
  20. flex 联机游戏开发 - 四国军棋游戏:(一)引子

热门文章

  1. Vue中swiper的指向性跳转~轮播图与标题的互动
  2. 结果公示!400名博硕士获“优秀学位论文”奖!
  3. VRRP 网关冗余备份
  4. jetlinks之Thing(六)
  5. Android 图片文字识别
  6. 计算机mac地址怎么修改密码,苹果电脑怎么修改MAC地址|苹果电脑修改MAC地址的方法...
  7. iPad mini 6 评测:多功能升级,一手掌握的极佳手感,适合娱乐休闲
  8. python中fn是什么意思_Python fn
  9. Photoshop教程一:精细选择工具
  10. python 小世界网络