python调用everything批量查找表格中的文件名在磁盘中是否存在
python调用everything批量查找表格中的文件名在磁盘中是否存在
- 介绍
- Everything 配置
- 使用openpyxl读写文件
- 读文件
- 写文件
- BeautifulSoup的使用
- 创建 beautifulsoup 对象
- soup.find_all的用法
- 完整代码
介绍
Everything的Http服务器提供了网页支持,我们通过解析网页获取查找信息,从而批量处理数据。
Everything 配置
首先需要打开Everthing 的Http服务器配置,只需要启动该配置并记住端口号即可,配置方式:打开everything-工具-选项-Http服务器,无需设置用户名和密码
输入网址:ip+:+端口号,能够打开everthing搜索即可
参考:https://www.voidtools.com/zh-cn/support/everything/http/
使用openpyxl读写文件
读文件
import openpyxl
wb = openpyxl.load_workbook('sample_file.xlsx')sheet = wb.activex1 = sheet['A1']x2 = sheet['A2']#using cell() functionx3 = sheet.cell(row=3, column=1)print("The first cell value:", x1.value)print("The second cell value:", x2.value)print("The third cell value:", x3.value)
写文件
from openpyxl import load_workbook
wb = load_workbook(r'C:\Users\DEVANSH SHARMA\Desktop\demo.xlsx')sheet = wb.activesheet['A1'] = 'Devansh Sharma'sheet.cell(row=2, column=2).value = 5wb.save(r'C:\Users\DEVANSH SHARMA\Desktop\demo.xlsx')
BeautifulSoup的使用
创建 beautifulsoup 对象
soup = BeautifulSoup(html,'lxml') #创建 beautifulsoup 对象
soup.find_all的用法
- 查找标签
soup.find_all('tag')
- 查找文本
soup.find_all(text='text')
- 根据id查找
soup.find_all(id='tag id')
- 使用正则
soup.find_all(text=re.compile('your re')), soup.find_all(id=re.compile('your re'))
- 指定属性查找标签
soup.find_all('tag', {'id': 'tag id', 'class': 'tag class'})
完整代码
import openpyxl
import requests
from bs4 import BeautifulSoupip='localhost'
wb = openpyxl.load_workbook(r"E:\zr\书籍.xlsx")sheet = wb.active
try:for row in range(2,245):title = sheet.cell(row, 1).value lookup = title.find('(')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find('(')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find(':')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find(':')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find('―')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find('—')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find(' ')title=title[0:lookup] if lookup!=-1 else title#print(title)request = requests.get("http://" + ip + "/?search=" + title)content = request.text#print(content)soup = BeautifulSoup(content,'html.parser')result=soup.find_all('p',{'class':'numresults'})txt = result[0].stringif(txt[0]=='0'):sheet.cell(row, 6).value='wu'else:sheet.cell(row, 6).value='you'
finally:wb.save('E:\zr\书籍.xlsx')
python调用everything批量查找表格中的文件名在磁盘中是否存在相关推荐
- python调用js批量爆破账号密码
python调用js批量爆破账号密码 前言 流程 爬取账号 爆破 参考文章 前言 在进行默认弱口令爆破的时候遇到了使用js对账号密码加密,而且加密算法写的比较复杂,如果用python重新写一个加密算法 ...
- 使用Python调用baidu翻译的接口,实现转换android stuido 中的values/strings.xml 解放生产力,自动翻译生成文件
调用baidu翻译的接口,实现转换android stuido 中的values/strings.xml 解放生产力,自动翻译生成文件 因为使用的是合法免费的接口,每秒只能请求一次,测试结果翻译330 ...
- python 调用vba 参数 保存表格_Jupyter Notebooks嵌入Excel并使用Python替代VBA宏
以前,Excel和Python Jupyter Notebook之间我们只能选择一个. 但是现在随着PyXLL-Jupyter软件包的推出,可以将两者一起使用. 在本文中,我将向你展示如何设置在Exc ...
- Python调用HEG批量转换hdf影像为tiff
目录 Python代码 注意 参考 Python代码 本文示例为处理MOD11_L2数据,提取数据中的QC和LST图层的代码: # -*- coding: utf-8 -*- "" ...
- Linux 命令行中的文件名/文件路径中使用通配符的说明
文章目录 支持通配符 通配符表达式示例 通配符使用限制 使用通配符表示的路径示例 带有空格的通配符或文件名必须加上引号 支持通配符 * 表示任意数量的任意字符 ? 表示任意单个字符 通配符表达式示例 ...
- 如何用迅雷下载python_用Python调用迅雷批量下载excel表内的链接,并同时对文件重命名(使用的是openpyxl)...
#首先把文件名放在excel表中的第一列,把对应的链接地址放在第二列 #为什么要用迅雷来下载,因为可以加速啊 #为什么你有这些链接啊,因为我用了八爪鱼爬虫啊 #为什么用八爪鱼爬虫啊,因为python学 ...
- 【Python 实战】---- 批量将图片转base64导出到excel中
1. 目标 学会将当前文件夹下的图片['jpg', 'png', 'jpeg', 'bmp'],转换成base64,保存到icon.xlsx的文件中: 学会读取图片文件,将文件转成 base64 的字 ...
- 【批量删除仓库】GitHub 如何使用Python调用接口批量删除GitHub仓库
(1)创建 repos.txt,里面写想删除的仓库(用户名/仓库名): (2)拿个有删除权限的token https://github.com/settings/tokens (3)把下面代码里的to ...
- python调用另一个类的返回值_python – 在OpenERP中调用另一个表单的方法返回值
以下是一个示例函数.也许对你有帮助 def open_popup(self, cr, uid, ids, context=None): mod_obj = self.pool.get('ir.mode ...
最新文章
- intellij idea 常见遇到的问题整理
- DFS求连通块数目(深搜)
- 使用Hexo 搭建 blog过程
- 10月21日下午PHP常用函数
- C/C++语言开发环境的搭建
- 深度学习面试的一些知识
- 基于heartbeat v1配置mysql和httpd的高可用双主模型
- 腾讯开源业内最大多标签图像数据集,附ResNet-101模型
- 【转载】 扫描二维码自动识别手机APP下载地址
- ThoughtWorks现代企业架构框架白皮书 笔记
- python免费程序-Python——免费观看全网视频小程序
- 计算机的ps快捷键,PHOTOSHOP常用快捷键大全
- [bzoj 5064]B-number
- 产品经理培训还好找工作吗?
- 计算机原理课堂,计算机原理课堂测验题集.ppt
- 怎样应对秋冬季出现的腹泻等肠胃疾病
- queue queen(误)
- iOS 编译器__Attribute__的入门指南
- 园区网典型组网架构及案例实践
- 猎豹极速wifi驱动 v3.0 官方版
热门文章
- 谈谈学习方法背后的原理
- 关于java用Quertz定时进行数据库同步的简单操作
- python实现模拟登录云课堂智慧职教并获取课程信息(2)
- ssh可以登录,但是scp不行,解决方案
- 微信小程序 - 超详细 “长按说话“ 实时语音录制与播放功能,仿微信发语音 “按住说话,松开取消“ 录音功能效果(详细示例源码,一键复制开箱即用!)
- Cadence Menus pulldown(下拉)菜单的建立
- 分子动力学(三)-非键相互作用
- 静态方法中注入bean对象
- 洁净室对讲电话机安装,一键免提洁净室sip对讲电话
- 神经网络核心问题有哪些,神经网络核心问题研究