python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出
import xlrd
def extract(inpath):
data = xlrd.open_workbook(inpath, encoding_override="utf-8")
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
ncols = table.ncols # 获取列号
all_info =[]
teacher = getnew(inpathnew)
print(teacher)
# print(nrows)
for i in range(0, nrows): # 第0行为表头
if i == 10:
break
else:
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] # 取出表中第二列数据
name = "刘诗诗"
data = name in result
if data:
index = i
same_name = name
#print(result)
def getnew(inpathnew):
data = xlrd.open_workbook(inpathnew, encoding_override="utf-8")
table = data.sheets()[0] # 选定表
nrows = table.nrows # 获取行号
ncols = table.ncols # 获取列号
all_info =[]
for i in range(1, nrows): # 第0行为表头
alldata = table.row_values(i) # 循环输出excel表中每一行,即所有数据
result = alldata
#result = alldata[0] + "、" + alldata[1] + "、" + alldata[2] + "、" + alldata[3] + "、" + alldata[4] + "、" + alldata[5] # 取出表中第二列数据
all_info.append(result)
print(all_info)
#all_info = (2, 5, 8, 10, 8, 12, 23, 3, 2, 3, 5)
import itertools
original_list = all_info
new_merged_list = list(itertools.chain(*original_list))
print(new_merged_list)
arr = new_merged_list
print(arr)
n = len(arr)
for i in range(0, n):
for j in range(i + 1, n):
if (arr[i] == arr[j]):
print("%s,%s" % (arr[i], arr[j]))
# # 定义列表
# l = ["a", "b", "c", "a", "b", "c", "a"]
# # 获取第一个"a"的下标
# index_one = l.index("a")
# # 从第一个"a"的下一个位置开始查找, 所以加1
# print(l.index("a", index_one + 1))
#return all_info
inpath = ("111.xlsx") # excel文件所在路径
inpathnew = ("222.xlsx") # excel文件所在路径
#extract(inpath)
getnew(inpathnew)
python处理表格数据匹配-python爬取两个excel表里的相同数据并匹配输出相关推荐
- python爬虫表格table_Python基于pandas爬取网页表格数据
以网页表格为例:https://www.kuaidaili.com/free/ 该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不 ...
- python热词关系图_Python 爬取 热词并进行分类数据分析-[拓扑数据]
日期:2020.01.29 博客期:137 星期三 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] c.[拓扑数据](本期博客) d.[数 ...
- python爬虫----网易云音乐歌曲爬取并存入Excel
因为数据要存入Excel中,所以首要目标是找个办法将数据能够存入excel中 经过在网上一番搜索后,发现用python里的xlwt模块可以比较容易的解决 一.准备工作 1.安装xlwt模块: 可以看h ...
- Python无框架分布式爬虫,爬取范例:拼多多商品详情数据,拼多多商品列表数据
拼多多是中国领先的社交电商平台之一,是一家以"团购+折扣"为主要运营模式的电商平台.该平台上有海量的商品,对于商家和消费者来说都具有非常大的价值,因此,拼多多商品数据的采集技术非常 ...
- 教你轻松爬取全国40城5000+地铁站点数据!(附源码)
大家好,我是 辰哥~ 今天介绍一种新的 获取城市地铁站点数据的方法,而且不再只是北上广深四个城市,而是 全国开通地铁的城市. 对了,你觉得全国有多少个城市开通了地铁? 文末附源码 ▶正文 今天爬取数据 ...
- 小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集
大家好,我是小一 上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据 有时候,爬虫爬到的数据是很珍贵.很稀缺,但是在实际项目最好还是多点谨慎,保证万无一失. 今天介绍一种新的 ...
- 爬虫实战—轻松爬取全国40城5000+地铁站点数据!附源码和数据集
原文链接:小一教你轻松爬取全国40城5000+地铁站点数据!附源码和数据集 大家好,我是小一 上一篇文章讲了一个失败的数据分析案例,导致失败最最主要的原因就两个字:数据 有时候,爬虫爬到的数据是很珍贵 ...
- 利用python爬虫(案例6+part14)--如何爬取科研数据
学习笔记 文章目录 Ajax动态加载网站数据抓取 动态加载的类型 那么该如何抓取数据? 如何得到JSON文件的地址? 观察JSON文件URL地址的查询参数 JSON格式数据转换成python字典 如何 ...
- 刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。
当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界.你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样.近几日在学习 itchat,并且写了1个网络爬虫,扒 ...
最新文章
- GetWindowRect和GetClientRect(得到窗口坐标)
- 宝塔面板php日志在哪里,宝塔面板怎么查看网站日志?
- tomcat项目的ajax路径问题,Tomcat下ajax请求路径总结
- HDU 6631 line symmetric(枚举)
- 大三、研二的秋招备战路线(Java、大数据)
- 【ICCV2019】点云相关论文解析
- java中IO流详解
- 用css和jquery实现标签页效果(一)
- Android N 去电流程,【私人备忘录】Android P 去电代码流程
- 必看,Mac苹果电脑重装系统教程
- VSCode 摸鱼神器
- 0901 - 虽已马不停蹄,无奈时光飞逝
- 我的OpenBSD配置文件
- tp5.0 think-queue 消息队列
- 学生会计算机办公软件培训制度,学生干部办公软件技能培训
- 手机界面显示正常,点击输入框就放大,怎么破?看这里!
- 论文阅读《PatchMatch Stereo - Stereo Matching with Slanted Support Windows》(PMS-双目立体匹配)
- PHP empty()
- Android 开源项目及库汇总(2)
- Min-max theorem