python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出

import xlrd

def extract(inpath):

data = xlrd.open_workbook(inpath, encoding_override="utf-8")

table = data.sheets()[0] # 选定表

nrows = table.nrows # 获取行号

ncols = table.ncols # 获取列号

all_info =[]

teacher = getnew(inpathnew)

print(teacher)

# print(nrows)

for i in range(0, nrows): # 第0行为表头

if i == 10:

break

else:

alldata = table.row_values(i) # 循环输出excel表中每一行，即所有数据

result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] # 取出表中第二列数据

name = "刘诗诗"

data = name in result

if data:

index = i

same_name = name

#print(result)

def getnew(inpathnew):

data = xlrd.open_workbook(inpathnew, encoding_override="utf-8")

table = data.sheets()[0] # 选定表

nrows = table.nrows # 获取行号

ncols = table.ncols # 获取列号

all_info =[]

for i in range(1, nrows): # 第0行为表头

alldata = table.row_values(i) # 循环输出excel表中每一行，即所有数据

result = alldata

#result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] + "、" + alldata[5] # 取出表中第二列数据

all_info.append(result)

print(all_info)

#all_info = (2, 5, 8, 10, 8, 12, 23, 3, 2, 3, 5)

import itertools

original_list = all_info

new_merged_list = list(itertools.chain(*original_list))

print(new_merged_list)

arr = new_merged_list

print(arr)

n = len(arr)

for i in range(0, n):

for j in range(i + 1, n):

if (arr[i] == arr[j]):

print("%s,%s" % (arr[i], arr[j]))

# # 定义列表

# l = ["a", "b", "c", "a", "b", "c", "a"]

# # 获取第一个"a"的下标

# index_one = l.index("a")

# # 从第一个"a"的下一个位置开始查找, 所以加1

# print(l.index("a", index_one + 1))

#return all_info

inpath = ("111.xlsx") # excel文件所在路径

inpathnew = ("222.xlsx") # excel文件所在路径

#extract(inpath)

getnew(inpathnew)

python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出相关推荐

python爬虫表格table_Python基于pandas爬取网页表格数据
以网页表格为例:https://www.kuaidaili.com/free/ 该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不 ...
python热词关系图_Python 爬取热词并进行分类数据分析-[拓扑数据]
日期:2020.01.29 博客期:137 星期三 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] c.[拓扑数据](本期博客) d.[数 ...
python爬虫----网易云音乐歌曲爬取并存入Excel
因为数据要存入Excel中,所以首要目标是找个办法将数据能够存入excel中经过在网上一番搜索后,发现用python里的xlwt模块可以比较容易的解决一.准备工作 1.安装xlwt模块: 可以看h ...
Python无框架分布式爬虫，爬取范例：拼多多商品详情数据，拼多多商品列表数据
拼多多是中国领先的社交电商平台之一,是一家以"团购+折扣"为主要运营模式的电商平台.该平台上有海量的商品,对于商家和消费者来说都具有非常大的价值,因此,拼多多商品数据的采集技术非常 ...
教你轻松爬取全国40城5000+地铁站点数据！(附源码)
大家好,我是辰哥~ 今天介绍一种新的获取城市地铁站点数据的方法,而且不再只是北上广深四个城市,而是全国开通地铁的城市. 对了,你觉得全国有多少个城市开通了地铁? 文末附源码 ▶正文今天爬取数据 ...
小一教你轻松爬取全国40城5000+地铁站点数据！附源码和数据集
大家好,我是小一上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据有时候,爬虫爬到的数据是很珍贵.很稀缺,但是在实际项目最好还是多点谨慎,保证万无一失. 今天介绍一种新的 ...
爬虫实战—轻松爬取全国40城5000+地铁站点数据！附源码和数据集
原文链接:小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集大家好,我是小一上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据有时候,爬虫爬到的数据是很珍贵 ...
利用python爬虫(案例6+part14)--如何爬取科研数据
学习笔记文章目录 Ajax动态加载网站数据抓取动态加载的类型那么该如何抓取数据? 如何得到JSON文件的地址? 观察JSON文件URL地址的查询参数 JSON格式数据转换成python字典如何 ...
刚刚用python爬取一千个微信朋友圈数据，他们的秘密原来这么多。
当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界.你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样.近几日在学习 itchat,并且写了1个网络爬虫,扒 ...

python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出

python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出相关推荐

最新文章

热门文章