ocr.py / 阿里云市场
import base64
import json
import urllib.request
from urllib import parse
import ssl
ssl._create_default_https_context = ssl._create_unverified_contextdef get_code():#修改API说明修改接口地址host = 'https://imgurlocr.market.alicloudapi.com/urlimages'method = 'POST'appcode = 'c657ecb2f1cd4f779ff4f8bf3ebb0af1'querys = ''bodys = {}url = host# 组装本地需要识别的 图片fp = open('./code.jpg', 'rb')res = base64.b64encode(fp.read()).decode()bodys['image'] = 'data:image/jpeg;base64,' + respost_data = urllib.parse.urlencode(bodys).encode(encoding='UTF8')request = urllib.request.Request(url, post_data)#根据API的要求,定义相对应的Content-Typerequest.add_header('Content-Type', 'application/x-www-form-urlencoded; charset=UTF-8')request.add_header('Authorization', 'APPCODE ' + appcode)ctx = ssl.create_default_context()ctx.check_hostname = Falsectx.verify_mode = ssl.CERT_NONEresponse = urllib.request.urlopen(request, context=ctx)content = response.read()if content:res = json.loads(content.decode('UTF-8'))code = res['result'][0]['words']return code
模拟登陆
import timefrom selenium import webdriverfrom .ocr import get_codechrome_path = '/Users/apple/soft/chromedriver'driver = webdriver.Chrome(executable_path=chrome_path)driver.get('https://so.gushiwen.org/user/login.aspx?from=http://so.gushiwen.org/user/collect.aspx')driver.find_element_by_id('email').send_keys('290793992zb@163.com')
time.sleep(1)
driver.find_element_by_id('pwd').send_keys('python123_')
time.sleep(1)
driver.find_element_by_id('imgCode').screenshot('./code.jpg')
time.sleep(1)
# 通过接口 获取 验证码信息
code = get_code()# 填写验证码
driver.find_element_by_id('code').send_keys(code)
time.sleep(1)# 点击登陆
driver.find_element_by_id('denglu').click()

selenium 模拟登陆 古诗文网 含验证码相关推荐

  1. python爬虫之古诗文网中验证码的识别并登录----第三方平台

    目标网站:古诗文网 目标网址:http://so.gushiwen.org/user/collect.aspx 任务要求: (1)通过selenium的方式模拟该网站的登录,并成功输入用户名和密码: ...

  2. 爬虫day01(上午) 模拟登录古诗文网

    前言:今天是学习爬虫的第一天,因为看的教学视频比较老,所以很多案例都不能用了,于是我自己发挥动手操作,做了个比视频里更有含金量的练习,由于与视频案例大有不同,所以期间发生了点问题,经过探索现已解决,留 ...

  3. selenium模拟登陆去哪儿网

    序言 在模拟网页的表单登陆的时候,比较头疼的一个问题就是图片验证码的情况,碰到了验证码,比如像普通的文字图片类型的验证码,目前一个比较好的思路就是,通过selenium自身提供的截图功能,对指定的图片 ...

  4. python 裁判文书网_python - 用selenium模拟登陆裁判文书网,系统报错找不到元素。...

    问 题 from selenium import webdriver from selenium.webdriver.common.desired_capabilities import Desire ...

  5. 用python实现古诗文网个人主页爬取

    #coding=gbk #为了解决编码问题加入的coding=gbk from chaojiying import Chaojiying_Client import requests from lxm ...

  6. 用机器学习sklearn+opencv-python过古诗文网4位数字+字母混合验证码

    目录 获取验证码图片 用opencv-python处理图片 制作训练数据集 训练模型 识别验证码 编写古诗文网的登录爬虫代码 总结与提高 源码下载 在本节我们将使用sklearn和opencv-pyt ...

  7. python爬虫模拟登录古诗文网站

    爬取目标网站https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx?type=s 工具: ...

  8. Python使用网络抓包的方式,利用超级鹰平台识别验证码登录爬取古诗文网、上篇--识别验证码

    Python使用网络抓包的方式,利用超级鹰平台识别验证码登录,<爬取古诗文网>. 上篇–识别验证码 序言: 哈喽,各位小可爱们,我又来了,这次我新学习到的内容是python爬虫识别验证码. ...

  9. python爬虫-古诗文网验证码识别

    文章目录 一.前期准备 二.示例代码 一.前期准备 古诗文网验证码识别,是通过对古诗文网登陆界面的验证码图片进行识别的,利用专门的验证码识别网站,可以提取验证码图片中的验证码 网站推荐:超级鹰 注册登 ...

最新文章

  1. 例5.12 输入一串字符,字符个数不超过100,且以.结束。 (信息学奥赛一本通)...
  2. python 函数参数传递 格式_Python学习6.1_函数参数及参数传递
  3. 【tmos】SpringBoot登录拦截
  4. git 撤销提交的文件
  5. 成功解决r2_score函数输出值始终为0的情况
  6. 中粮国际对话国际农民丰收节贸易会 谋定国际农贸现代化
  7. zabbix mysql.status_Zabbix 监控 Mysql 状态
  8. SAP UI5 应用开发教程之三十九 - SAP UI5 应用出现白屏的一些常见错误和分析方法分享试读版
  9. 一步步学习SPD2010--词汇表
  10. Exchange2007使用POP3/SMTP协议收发邮件
  11. 高通宣称其语音识别系统准确率高达95%
  12. 学习使用Visual studio 时碰到的坑
  13. c语言程序设计 习题,2017年9月计算机二级C语言程序设计习题及答案
  14. 串口485接法图_RS485接线的正确原理图
  15. 各种泵的图形符号_常见液压系统中液压元件图形符号
  16. Fujitsu DPK8310Tax 打印机驱动
  17. 泰坦尼克号数据_泰坦尼克号数据可视化分析
  18. 【渝粤题库】陕西师范大学292251 公司金融学Ⅰ 作业(高起专)
  19. java登录注册功能怎么实现_使用Java代码实现登录注册功能
  20. 大数据系统及分析技术

热门文章

  1. spring篇(五)官封弼马温
  2. python之pypinyin
  3. 内存压力测试 memtester移植到STM32
  4. ueditor统计字数中文_UEditor编辑器 字符数统计和字符数限制 问题
  5. 【U8】禁止UU(UTU)随登陆账套启动(U8V11.0及其以上版本)
  6. H+4.9响应式后台主题UI框架源码带完整文档-免费下载
  7. BZOJ 1615: [Usaco2008 Mar]The Loathesome Hay Baler麻烦的干草打包机 bfs
  8. unicode 生僻字_生僻字打不出来怎么办?教你一招轻松应对!
  9. 删除GHOSTwin7桌面顽固IE图标
  10. 【设计模式】之适配器(Adapter)