Python模拟登陆古诗文网手动输入验证码显示验证码错误

import requests
from lxml import etree
session=requests.Session()
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36',}
url='https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx'
re=requests.get(url=url,headers=headers)
page_text=re.text
print(re.status_code)
print(page_text)
tree=etree.HTML(page_text)
code_image_src='https://so.gushiwen.cn'+tree.xpath('//*[@id="imgCode"]/@src')[0]
print(re.status_code)
#此处要用session请求验证码地址保存cookies后面输入验证码后才不会报错
img_data=session.get(url=code_image_src,headers=headers).contentwith open ('./code.jpg','wb',) as fp:fp.write(img_data)stri = input("请输入:")
login_url='https://so.gushiwen.cn/user/login.aspx?from=http%3a%2f%2fso.gushiwen.cn%2fuser%2fcollect.aspx'
data={'__VIEWSTATE': '/vwC0eOzmbm46rBwBLdueaU67+W8RzMKuEHilr4oCRcLMYJcZqHUZEApf3/nuViOvwzPI2t2hArtxhP3wAGIJ6m+btN2s+2eHJ8MyRCZayIHrnAhyeqzn4JmyNQ=',
'__VIEWSTATEGENERATOR': 'C93BE1AE',
'from': 'http://so.gushiwen.cn/user/collect.aspx',
'email': '17xxxx66827',
'pwd': '2022waxxxxx.',
'code': stri,
'denglu': '登录'}
login_page_text=session.post(url=login_url,headers=headers,data=data).text
with open ('gushiwen.html','w',encoding='utf-8') as fp:fp.write(login_page_text)

获取验证码时需要保存cookie,输入验证码重新请求时才不会出现刷新验证码,验证码错误的情况,最终的网页源码保存在本地,以浏览器形式打开
验证码错误页面

登陆成功后的显示界面:

Python模拟登陆古诗文网手动输入验证码显示验证码错误相关推荐

  1. selenium 模拟登陆 古诗文网 含验证码

    ocr.py / 阿里云市场 import base64 import json import urllib.request from urllib import parse import ssl s ...

  2. Python使用网络抓包的方式,利用超级鹰平台识别验证码登录爬取古诗文网、上篇--识别验证码

    Python使用网络抓包的方式,利用超级鹰平台识别验证码登录,<爬取古诗文网>. 上篇–识别验证码 序言: 哈喽,各位小可爱们,我又来了,这次我新学习到的内容是python爬虫识别验证码. ...

  3. python爬虫之古诗文网中验证码的识别并登录----第三方平台

    目标网站:古诗文网 目标网址:http://so.gushiwen.org/user/collect.aspx 任务要求: (1)通过selenium的方式模拟该网站的登录,并成功输入用户名和密码: ...

  4. 爬虫day01(上午) 模拟登录古诗文网

    前言:今天是学习爬虫的第一天,因为看的教学视频比较老,所以很多案例都不能用了,于是我自己发挥动手操作,做了个比视频里更有含金量的练习,由于与视频案例大有不同,所以期间发生了点问题,经过探索现已解决,留 ...

  5. python项目之古诗文网

    目录 一.学习资源 二.分析 1.先找登录口,也就是什么情况下允许登录. 2.打开网页源码找参数 3.获取图片验证码 4.登录 (有坑) 5.成功登录 三.项目源码 一.学习资源 尚硅谷Python爬 ...

  6. 用python实现古诗文网个人主页爬取

    #coding=gbk #为了解决编码问题加入的coding=gbk from chaojiying import Chaojiying_Client import requests from lxm ...

  7. python爬虫-古诗文网验证码识别

    文章目录 一.前期准备 二.示例代码 一.前期准备 古诗文网验证码识别,是通过对古诗文网登陆界面的验证码图片进行识别的,利用专门的验证码识别网站,可以提取验证码图片中的验证码 网站推荐:超级鹰 注册登 ...

  8. python爬虫模拟登录古诗文网站

    爬取目标网站https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx?type=s 工具: ...

  9. 潜心专研Python模拟登陆专题,实现网易云音乐自动签到!这项目居然只值三百?

    前言: 时隔三周没有和大家见过面了,最近在研究python模拟登陆专题,话不多说,让我们愉快地开始实现模拟登陆实现网易云自动签到 开发工具 **Python****版本:**3.6.4 相关模块: D ...

  10. Python爬虫(一)——爬取古诗文网,初识什么是爬虫

    首先来说下什么是爬虫,按照百度百科的说法是:是一种按照一定规则,自动抓取万维网信息的程序或者脚本:首先它是程序,需要我们定义好规则,然后程序就会按照定义好的规则抓取网络上的信息,数据抓取下来了之后,需 ...

最新文章

  1. MFC获取系统当前时间
  2. iphone连上wifi却上不了网_如何解决联通物联卡上不了网问题
  3. 工业交换机有哪些功能?
  4. php qq接收不了,php imap接收qq邮件的问题
  5. 动态规划 —— 动态规划概述
  6. AVPlayer设置从哪儿开始播放
  7. java 定时凌晨_Java定时任务,每天凌晨1点执行
  8. Oracle JDE计划BOM应用
  9. 一招解决 Mac JD-JUI 打不开问题
  10. 双碳实力 | 谱尼成为上海市环境保护产业协会应对气候变化专委会成员单位
  11. 智能眼镜上可否能有“MIUI”?
  12. 计算机工程中级职称怎么考,以前中级职称是要考什么计算机-计算机软考中级职称哪个好考...
  13. Netty常用招式——ChannelHandler与编解码
  14. Windows xp开机时不显示用户名导致无法登录的错误处理方法
  15. win10无法登录到你的账户(已解决)
  16. excel文件中的多个工作表按名称排序
  17. 02.集线器,网桥,交换机
  18. BZOJ 小约翰的游戏John 反尼姆博弈
  19. LINUX 一键装机 PXE system-config-kickstart 资源 实现简单操作镜像装机
  20. js进阶实例,数字时钟

热门文章

  1. 【Git】clone项目push项目没反应,Cloning into...没下载
  2. 腐蚀rust服务器系统,腐蚀rust有哪些服务器命令 腐蚀rust服务器命令一览
  3. opboot怎么刷入固件_OPPO手机怎么进行系统(固件)升级?(附四种方法)
  4. 小白也能学引流技巧:如何利用微信群找到你的精准用户| 二维彩虹二维码生成器
  5. Ubuntu防火墙安装和配置
  6. C语言_结构体数组初始化
  7. 多个jdk共存与切换
  8. 关于AE(AfterEffect)安装QuickTime后无法渲染H.264,出现报错问题的解决!!错误代码(-1610153459)
  9. python xlrd 写入已有的excel并保留原excel格式
  10. 阻止第三方 cookie_如何在每个Web浏览器中阻止第三方Cookie