python调用everything批量查找表格中的文件名在磁盘中是否存在

  • 介绍
  • Everything 配置
  • 使用openpyxl读写文件
    • 读文件
    • 写文件
  • BeautifulSoup的使用
    • 创建 beautifulsoup 对象
    • soup.find_all的用法
  • 完整代码

介绍

Everything的Http服务器提供了网页支持,我们通过解析网页获取查找信息,从而批量处理数据。

Everything 配置

首先需要打开Everthing 的Http服务器配置,只需要启动该配置并记住端口号即可,配置方式:打开everything-工具-选项-Http服务器,无需设置用户名和密码

输入网址:ip+:+端口号,能够打开everthing搜索即可


参考:https://www.voidtools.com/zh-cn/support/everything/http/

使用openpyxl读写文件

读文件

import openpyxl
wb = openpyxl.load_workbook('sample_file.xlsx')sheet = wb.activex1 = sheet['A1']x2 = sheet['A2']#using cell() functionx3 = sheet.cell(row=3, column=1)print("The first cell value:", x1.value)print("The second cell value:", x2.value)print("The third cell value:", x3.value)

写文件

from openpyxl import load_workbook
wb = load_workbook(r'C:\Users\DEVANSH SHARMA\Desktop\demo.xlsx')sheet = wb.activesheet['A1'] = 'Devansh Sharma'sheet.cell(row=2, column=2).value = 5wb.save(r'C:\Users\DEVANSH SHARMA\Desktop\demo.xlsx')

BeautifulSoup的使用

创建 beautifulsoup 对象

soup = BeautifulSoup(html,'lxml')  #创建 beautifulsoup 对象

soup.find_all的用法

  1. 查找标签
 soup.find_all('tag')
  1. 查找文本
 soup.find_all(text='text')
  1. 根据id查找
 soup.find_all(id='tag id')
  1. 使用正则
soup.find_all(text=re.compile('your re')), soup.find_all(id=re.compile('your re'))
  1. 指定属性查找标签
soup.find_all('tag', {'id': 'tag id', 'class': 'tag class'})

完整代码

import openpyxl
import requests
from bs4 import BeautifulSoupip='localhost'
wb = openpyxl.load_workbook(r"E:\zr\书籍.xlsx")sheet = wb.active
try:for row in range(2,245):title = sheet.cell(row, 1).value   lookup = title.find('(')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find('(')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find(':')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find(':')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find('―')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find('—')title=title[0:lookup] if lookup!=-1 else titlelookup = title.find(' ')title=title[0:lookup] if lookup!=-1 else title#print(title)request = requests.get("http://" + ip + "/?search=" + title)content = request.text#print(content)soup = BeautifulSoup(content,'html.parser')result=soup.find_all('p',{'class':'numresults'})txt = result[0].stringif(txt[0]=='0'):sheet.cell(row, 6).value='wu'else:sheet.cell(row, 6).value='you'
finally:wb.save('E:\zr\书籍.xlsx')

python调用everything批量查找表格中的文件名在磁盘中是否存在相关推荐

  1. python调用js批量爆破账号密码

    python调用js批量爆破账号密码 前言 流程 爬取账号 爆破 参考文章 前言 在进行默认弱口令爆破的时候遇到了使用js对账号密码加密,而且加密算法写的比较复杂,如果用python重新写一个加密算法 ...

  2. 使用Python调用baidu翻译的接口,实现转换android stuido 中的values/strings.xml 解放生产力,自动翻译生成文件

    调用baidu翻译的接口,实现转换android stuido 中的values/strings.xml 解放生产力,自动翻译生成文件 因为使用的是合法免费的接口,每秒只能请求一次,测试结果翻译330 ...

  3. python 调用vba 参数 保存表格_Jupyter Notebooks嵌入Excel并使用Python替代VBA宏

    以前,Excel和Python Jupyter Notebook之间我们只能选择一个. 但是现在随着PyXLL-Jupyter软件包的推出,可以将两者一起使用. 在本文中,我将向你展示如何设置在Exc ...

  4. Python调用HEG批量转换hdf影像为tiff

    目录 Python代码 注意 参考 Python代码 本文示例为处理MOD11_L2数据,提取数据中的QC和LST图层的代码: # -*- coding: utf-8 -*- "" ...

  5. Linux 命令行中的文件名/文件路径中使用通配符的说明

    文章目录 支持通配符 通配符表达式示例 通配符使用限制 使用通配符表示的路径示例 带有空格的通配符或文件名必须加上引号 支持通配符 * 表示任意数量的任意字符 ? 表示任意单个字符 通配符表达式示例 ...

  6. 如何用迅雷下载python_用Python调用迅雷批量下载excel表内的链接,并同时对文件重命名(使用的是openpyxl)...

    #首先把文件名放在excel表中的第一列,把对应的链接地址放在第二列 #为什么要用迅雷来下载,因为可以加速啊 #为什么你有这些链接啊,因为我用了八爪鱼爬虫啊 #为什么用八爪鱼爬虫啊,因为python学 ...

  7. 【Python 实战】---- 批量将图片转base64导出到excel中

    1. 目标 学会将当前文件夹下的图片['jpg', 'png', 'jpeg', 'bmp'],转换成base64,保存到icon.xlsx的文件中: 学会读取图片文件,将文件转成 base64 的字 ...

  8. 【批量删除仓库】GitHub 如何使用Python调用接口批量删除GitHub仓库

    (1)创建 repos.txt,里面写想删除的仓库(用户名/仓库名): (2)拿个有删除权限的token https://github.com/settings/tokens (3)把下面代码里的to ...

  9. python调用另一个类的返回值_python – 在OpenERP中调用另一个表单的方法返回值

    以下是一个示例函数.也许对你有帮助 def open_popup(self, cr, uid, ids, context=None): mod_obj = self.pool.get('ir.mode ...

最新文章

  1. intellij idea 常见遇到的问题整理
  2. DFS求连通块数目(深搜)
  3. 使用Hexo 搭建 blog过程
  4. 10月21日下午PHP常用函数
  5. C/C++语言开发环境的搭建
  6. 深度学习面试的一些知识
  7. 基于heartbeat v1配置mysql和httpd的高可用双主模型
  8. 腾讯开源业内最大多标签图像数据集,附ResNet-101模型
  9. 【转载】 扫描二维码自动识别手机APP下载地址
  10. ThoughtWorks现代企业架构框架白皮书 笔记
  11. python免费程序-Python——免费观看全网视频小程序
  12. 计算机的ps快捷键,PHOTOSHOP常用快捷键大全
  13. [bzoj 5064]B-number
  14. 产品经理培训还好找工作吗?
  15. 计算机原理课堂,计算机原理课堂测验题集.ppt
  16. 怎样应对秋冬季出现的腹泻等肠胃疾病
  17. queue queen(误)
  18. iOS 编译器__Attribute__的入门指南
  19. 园区网典型组网架构及案例实践
  20. 猎豹极速wifi驱动 v3.0 官方版

热门文章

  1. 谈谈学习方法背后的原理
  2. 关于java用Quertz定时进行数据库同步的简单操作
  3. python实现模拟登录云课堂智慧职教并获取课程信息(2)
  4. ssh可以登录,但是scp不行,解决方案
  5. 微信小程序 - 超详细 “长按说话“ 实时语音录制与播放功能,仿微信发语音 “按住说话,松开取消“ 录音功能效果(详细示例源码,一键复制开箱即用!)
  6. Cadence Menus pulldown(下拉)菜单的建立
  7. 分子动力学(三)-非键相互作用
  8. 静态方法中注入bean对象
  9. 洁净室对讲电话机安装,一键免提洁净室sip对讲电话
  10. 神经网络核心问题有哪些,神经网络核心问题研究