python爬取网站验证码并保存
from selenium import webdriver
from PIL import Image
import pytesseractdriver=webdriver.Firefox()
driver.get('网址')
driver.implicitly_wait(10)for i in range(0,10):driver.find_element_by_id('captchaImg').click()driver.save_screenshot(r'E:\code_full.png')href=driver.find_element_by_xpath('//*[@id="captchaImg"]')left = href.location['x']top = href.location['y']elementWidth = href.location['x'] + href.size['width']elementHeight = href.location['y'] + href.size['height']picture = Image.open(r'E:\code_full.png')picture = picture.crop((left, top, elementWidth, elementHeight))picture.save(r'E:\\'+str(i)+'.png')
注意xpath和id,name需要根据自己要爬的网站结构进行编写
python爬取网站验证码并保存相关推荐
- Python爬取网站图片并保存,超级简单
Python爬取网站图片并保存,超级简单 先看看结果吧,去bilibili上拿到的图片=-= 第一步,导入模块 import requests from bs4 import BeautifulSou ...
- python爬取网站图片链接并保存,Python爬取网站图片并保存的实现示例
先看看结果吧,去bilibili上拿到的图片=-= 第一步,导入模块 import requests from bs4 import BeautifulSoup requests用来请求html页面, ...
- #python学习笔记#使用python爬取网站数据并保存到数据库
上篇说到如何使用python通过提取网页元素抓取网站数据并导出到excel中,今天就来说说如何通过获取json爬取数据并且保存到mysql数据库中. 本文主要涉及到三个知识点: 1.通过抓包工具获取网 ...
- python爬取网站的图片
python爬取网站的图片 本次爬取图片所需要用到的库:Requests库,BeautifulSoup库,正则表达式,os库. 思路:先爬一张图片,再爬一个网站的图片 先爬一张图片: 首先要得到这张图 ...
- python爬取网站源代码+图片
python爬取网站源代码+图片 需求分析 基础知识 正则表达式 python网络请求 文件读写 实现 基本思路 具体实现 结果 总结 需求分析 大部分有志青年都想建立属于自己的个人网站,从零开始设计 ...
- Python爬取起点小说并保存到本地文件夹和MongoDB数据库中
Python爬取起点小说并保存到本地MongoDB数据库中 工具:Python3.7 + Mongo4.0 + Pycharm """ 爬取起点小说<诡秘之主> ...
- Python 爬取网页信息并保存到本地爬虫爬取网页第一步【简单易懂,注释超级全,代码可以直接运行】
Python 爬取网页信息并保存到本地[简单易懂,代码可以直接运行] 功能:给出一个关键词,根据关键词爬取程序,这是爬虫爬取网页的第一步 步骤: 1.确定url 2.确定请求头 3.发送请求 4.写入 ...
- Python爬取网站图片数据
Python爬取网站图片数据 找到需要爬取的网站地址 模拟网站http请求 根据调试模式获取的了解读取到真实的地址url,读取请求头数据和参数信息,模拟http请求调用 import requests ...
- python爬取网站时,一键获取headers、url等信息(真的是让我爬取网站时,省了不少力气,作为小秘密分享给大家喽)
python爬取网站时,一键获取headers.url等信息 (真的是让我爬取网站时,省了不少力气,作为小秘密分享给大家喽) 作为Python的使用者,我今天就和大家来分享分享我学习python的经验 ...
最新文章
- 【干货】百度联合清华大学发布国内首个基于AI实践的《产业智能化白皮书》(附报告全文)...
- 水很深,我还是下去了
- ACM-ICPC 2018 徐州赛区网络预赛 Features Track(STL二维map)
- 光纤传感器实验模块_飞秒激光制备异质光纤光栅的温度应变双参数传感器
- 自定义request链路跟踪
- python列表中item_del(item)与列表.删除(item)在python lis中
- 服务器内存超限问题_内存超限该怎么办?
- 微信终于良心一回,更新了语音识别功能可识别粤语,广东人有福了
- windows安装pip包
- Emacs设置侧边栏目录neotree
- 续上节,,基于App布局信息操作手机
- 让木桶没有短板,FISCO BCOS全面推进并行化改造
- 浅谈虚拟桌面上线推广的最佳时机
- Struts2-boobooke-概述
- 小程序apkg还原_如何禁用微信小程序(适合任何机型的完美解决方案)
- 怎么样减肥又快又好 达人推荐最有效的减肥方法
- 深入理解SD卡:协议
- 请输入星期几的第一个字母来判断一下是星期几
- Spring MVC项目启动时遇到的一些问题
- [转载]你有英文名字吗?给自己起一个吧
热门文章
- 单链表——指定结点的前插和后插
- 学计算机专业可以做施工员吗,建筑工程技术专业毕业只能做施工员?还有这些岗位可以做...
- python目前版本强势英雄_王者荣耀S11赛季哪些英雄比较强势?哪些英雄上分厉害?...
- Amazon强制下架高退货率产品
- DTOJ#4748. 钢镚
- java中折半查找思想_java折半查找法
- Vue中splice的使用
- JavaWeb学习-Tomcat系列-1-安装和启动
- “筑爱助残 亲近自然”与残友一起户外活动
- Arachni安全工具渗透漏扫检测