python多找表格进行数据对比
三张表格数据(上万条)需要比对,看是否有重复存在,使用excel自身进行数据核对显然数据量比较庞大,所以考虑使用python脚本来实现。
from openpyxl import load_workbook, Workbookwb1 = load_workbook('/Users/Mike/Downloads/ceshi/employee1.xlsx')
wb2 = load_workbook('/Users/Mike/Downloads/ceshi/employee2.xlsx')
wb3 = load_workbook('/Users/Mike/Downloads/ceshi/employee3.xlsx')a_wb = wb1['employee']
b_wb = wb2['employee']
c_wb = wb3['employee']a_wb_max_row = len(a_wb['B'])
b_wb_max_row = len(b_wb['B'])
c_wb_max_row = len(c_wb['B'])'''
# 提取姓名
for row in a_wb.iter_cols(min_row=1, max_row=a_wb_max_row, min_col=1, max_col=1, values_only=True):row1 = list(row)
print(row1)
for row in b_wb.iter_cols(min_row=1, max_row=b_wb_max_row, min_col=1, max_col=1, values_only=True):row2 = list(row)
# print(row2)
for row in c_wb.iter_cols(min_row=1, max_row=c_wb_max_row, min_col=1, max_col=1, values_only=True):row3 = list(row)
'''# 提取邮箱
for row in a_wb.iter_cols(min_row=2, max_row=a_wb_max_row, min_col=2, max_col=2, values_only=True):row1 = list(row)
# print(row1)
for row in b_wb.iter_cols(min_row=2, max_row=b_wb_max_row, min_col=2, max_col=2, values_only=True):row2 = list(row)
# print(row2)
for row in c_wb.iter_cols(min_row=2, max_row=c_wb_max_row, min_col=2, max_col=2, values_only=True):row3 = list(row)# print(row3)# 同时存在三张数据表格中
c = []
for i in row1:if i in row2:if i in row3:c.append(i)
for i in c:if i == None:c.remove(i)
print(c)wb3 = Workbook()
d_wb = wb3.activefor i in range(len(c)):d = [c[i]]d_wb.append(d)wb3.save('/Users/Mike/Downloads/mynewdata1.xlsx')# 1表v2表v3表不存在的数据
e = []
for i in row1:if i not in row2:if i not in row3:e.append(i)
for i in e:if i == None:e.remove(i)
print(e)wb4 = Workbook()
e_wb = wb4.activefor i in range(len(e)):f = [e[i]]e_wb.append(f)wb4.save('/Users/Mike/Downloads/mynewdata2.xlsx')# 2表v3表不存在的数据
f = []
for i in row2:if i not in row3:f.append(i)
for i in f:if i == None:f.remove(i)
print(f)wb5 = Workbook()
f_wb = wb5.activefor i in range(len(f)):g = [f[i]]f_wb.append(g)wb5.save('/Users/Mike/Downloads/mynewdata3.xlsx')# 1表v2表不存在的数据
g = []
for i in row1:if i not in row2:g.append(i)
for i in g:if i == None:g.remove(i)
print(g)wb6 = Workbook()
h_wb = wb6.active
for i in range(len(g)):h = [g[i]]h_wb.append(h)wb6.save('/Users/Mike/Downloads/mynewdata4.xlsx')
python多找表格进行数据对比相关推荐
- python读取csv表格的数据并用matplotlib画曲线图
前言 python读取csv表格的数据并用matplotlib回曲线图 1.导入相关库 import matplotlib.pyplot as plt import pandas as pd impo ...
- python 显示表格数据_python显示excel表格数据-怎么用python读取excel表格的数据
怎么用python读取excel表格的数据 #导入包 import xlrd #设置路径 path='C:\\Users\\jyjh\\Desktop\\datap.xlsx' #打开 data=xl ...
- 用 Python 对 Excel 表格内数据进行去重、分类,标记异常及分析
Python与Excel表格综合实例四:对 Excel 表格内数据进行去重.分类,异常处理及分析 前言: 主要实现代码及思路: 1.主要思路: 2.读取数据函数: 3.数据去重函数: 4.数据分类函数 ...
- python两个表格相同数据筛选_python如何统计所有文本文件的行数 如何用python实现两个文件重复数据筛选并统计...
如何用python统计文本中重复行的数目? python比较txt文档中每行文本之间重复词的个数不想面对他离开,逃避不是一个好方法,但却是唯一的办法. 每一行弄成一个集合,分享两个集合之间的交集,计算 ...
- 基于Python读取Excel表格文件数据并转换为字典dict格式
有时我们需要将一个Excel表格文件中的全部或一部分数据导入到Python并转换为字典格式,如何实现呢? 我们以如下所示的一个表格(.xlsx格式)作为简单的示例.其中,表格共有两列,第一列为 ...
- python提取word表格中数据
程序分析 今天文章介绍一个实战案例,与自动化办公相关:案例思想是源于前两天帮读者做了一个 demo ,需求大致将一上百个 word 中表格内容提取出来(所有word 中表格样式一样),把提取到的内容自 ...
- Python读取excel表格人员数据同时批量写入多个excel个人登记表
背景:驻村期间需要将1张含有200多人的人员记录数据写入人员信息登记表中,1条记录对应一个人员信息登记表.如果复制粘贴肯定比较慢,所以当然使用Python来解决.涉及的字段其实有23个,因涉及其他问题 ...
- python两个表格相同数据筛选_如何将多个表格中数据筛选汇总在一个表格里?
谢邀,这是个非常常见的需求,解决起来也非常容易.下面用分别用excel和python演示一下如何操作. 先建立了一个和题主工作簿类似的甲乙两个excel文件,每个文件包含3个sheet,其实不管几个文 ...
- Python两个表格的数据相乘
问题描述: 表1中有两列数据分别是开始时间和结束时间,表2中有两列数据分别是参数1和参数2,需求是通过result = he * Start + hst * End求出每一行数据的答案. 求解步骤: ...
- python读取前两列数据对比_使用Python的Dataframe取两列时间值相差一年的所有行方法...
在使用Python处理数据时,经常需要对数据筛选. 这是在对时间筛选时,判断两列时间是否相差一年,如果是,则返回符合条件的所有列. data原始数据: data[map(lambda x:dateti ...
最新文章
- java定时器检测状态_实用代码| shell脚本实现定时检查应用状态
- 【转】误差矩阵(混淆矩阵)评价法
- 广告点击率(CTR)预测经典模型 GBDT + LR 理解与实践(附数据 + 代码)
- 【遥感物候】Hants NDVI时间序列谐波分析法数据重构,植被生长季曲线效果可佳(附Hants软件下载)
- Spring JPA数据+Hibernate+ MySQL + Maven
- gnss单频软件接收机应用与编程_GNSS/GPS RTK定位 (手机,无人车定位,无人驾驶,因子图优化)...
- 开机即启动Activity
- 运维监控软件 wgcloud 更新,v3.2.7 重构告警模块
- android核心系列--1,组件生命周期
- appium-滑动、拖动操作
- Mybatis使用关联查询由于表名字段重复导致的问题
- 英特尔显卡笔记本屏幕自动调光功能导致屏幕闪烁----笔记本显示器闪烁
- 用DirectX做2D游戏的三种方法
- 攻防世界misc高手进阶区刷题记录
- 七、HTMLTestRunner生成测试报告
- qpython3l安装包下载_python安装包 官方版
- python数字加千分符 逗号
- Linux发行版镜像地址
- 1071 小赌怡情 (15分)
- flex 联机游戏开发 - 四国军棋游戏:(一)引子