python模拟登陆 验证码el_8-python模拟登入(无验证码)
方式:
1.手动登入,获取cookie
2.使用cookielib库 和 HTTPCookieProcessor处理器
#_*_ coding: utf-8 _*_
‘‘‘
Created on 2018年7月13日
@author: sss
‘‘‘
import urllib.request
import urllib.request
import urllib.parse
import random
import ssl
# url = ‘https://www.ctguqmx.com/account/ajax/login_process/‘
url = "http://www.ctguqmx.com/people/%E4%BD%99%E6%9D%BE"
#表示忽视未经核实的ssl证书认证
context = ssl._create_unverified_context()
#user-agent列表,每次请求随机选一个:
ua_list = [
"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
"Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko",
"Mozilla/5.0 (X11; CrOS i686 2268.111.0)like Gecko",
"Mozilla/5.0 (Macintosh; U; PPC Mac OS X ",
"Mozilla/5.0 (Macintosh; Intel Mac OS "
]
user_agent = random.choice(ua_list)
headers = {
‘User_Agent‘ : user_agent,
‘Cookie‘: ‘mcb__Session=giq2h72grr3643fcobi88el8t4; Hm_lvt_bad1d0a80942d2554f202adea54e0555=1530434463,1530703915,1531411239,1531451926; mcb__user_login=2M7Kkb9knW5lU51m2dae05ejlZ6Vw45dR-3NFgP1gm2Q1cem1bDVqJWQv2SZlZyTmWiVaJWeZ2SbkWRmyZuTZZXHx2XGncyYaWqbnA..; Hm_lpvt_bad1d0a80942d2554f202adea54e0555=1531452044If-Modified-Since: Fri, 13 Jul 2018 03:39:06 GMT‘
}
formdata = {
"user_name" : "name",
"password" : "password"
}
data = urllib.parse.urlencode(formdata).encode(encoding=‘utf_8‘)
request = urllib.request.Request(url, headers = headers, data = data)
response = urllib.request.urlopen(request, context = context)
print(response.read())
print(‘finish!‘)
#_*_ coding: utf-8 _*_
‘‘‘
Created on 2018年7月14日
@author: sss
function: 用账号登入qmx,爬去个人页面
‘‘‘
import urllib
import http.cookiejar
#构建一个CookieJar对象实例来保存cookie
cookiejar = http.cookiejar.CookieJar()
#使用HTTPCookieProcessor()来创建cookie处理器对象,参数为CookieJar()对象的值
Handler = urllib.request.HTTPCookieProcessor(cookiejar)
#构建opener
opener = urllib.request.build_opener(Handler)
#addheaders 接受一个列表,里面每个元素都是一个headers信息的元组,opener将附带headers信息
opener.addheaders = [(‘User-Agent‘, "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36")]
#需要登入密码和账户
data = {
"user_name" : "name",
"password" : "password"
}
#data转码
postdata = urllib.parse.urlencode(data).encode(encoding=‘utf_8‘)
#url
url = ‘https://www.ctguqmx.com/account/ajax/login_process/‘
#构建request请求对象,包含要发送的数据
request = urllib.request.Request(url, data = postdata)
#以get方法访问页面访问之后会自动保存cookie到cookiejar中
f = opener.open(request) #网址后面必须要有/
print(f.read().decode(‘utf-8‘))
print(‘访问登入后界面:‘)
#个人主页的urL
url = ‘https://www.ctguqmx.com/people/xxxxxxxx‘ #x换成自己的
#opener包含用户登入后的cookie值,可以直接访问登入后的页面
response = opener.open(url)
html = response.read()
with open(‘qmx_ys_person.html‘, ‘wb+‘) as f:
f.write(html)
# print(html)
print(‘个人界面下载完毕!‘)
response = opener.open(‘http://210.42.38.26:84/jwc_glxt/Login.aspx?xttc=1‘)
print(‘finish!‘)
python模拟登陆 验证码el_8-python模拟登入(无验证码)相关推荐
- python模拟哔哩哔哩滑块登入验证
python模拟哔哩哔哩滑块登入验证 准备工具 pip3 install PIL pip3 install opencv-python pip3 install numpy 谷歌驱动 建议指定清华源下 ...
- python github登陆_用Python模拟登陆GitHub并获取信息
最近在研究如何对搜狗搜索公众号文章进行爬取,由于需要用到Cookies,所以这回先了解下Cookies的相关知识. 搜狗的反爬有点厉害,即使我用了高匿代理,它还是会提醒我IP访问过于频繁,然后跳转验证 ...
- java模拟登陆教务系统_Java模拟登录高校教务系统
模拟登陆部分代码: 本次使用HttpClient 4.3进行开发, 该版本与之前的代码写法风格相差较大, 大家多留意下.需导入Jar包:commons-logging-1.1.3.jar / http ...
- python爬虫登陆教程_(python模拟登陆教程)python爬虫模拟登录是什么意思
python爬虫模拟登录是什么意思 网站需要登录后才能所需要的信息,此时可以设计爬虫进拟登录,原理是利用浏cookie. 一.浏览器访问服务器的过程: (1)浏览器(客户端)向Web服务器发出一个HT ...
- python github登陆_利用Python模拟GitHub登录!
最近学习了Fiddler抓包工具的简单使用,通过抓包,我们可以抓取到HTTP请求,并对其进行分析.现在我准备尝试着结合Python来模拟GitHub登录. Fiddler抓包分析 首先,我们想要模拟一 ...
- 百度云模拟登陆批量保存Python版(一)
开源地址: 老规矩,多说无益,直接亮成品 一.背景分析 相信做过爬虫的各位都会发现各大网站为了缓解自家服务器压力,而将我们需要的保存在云盘中,仅以分享分享链接的方式来分享文件.其中云盘分享又以百度云盘 ...
- python 搭建登陆系统,用Python连接操作MySQL数据库,做一个简单的用户登录注册系统...
我们可以很容易地用Python实现一个用户登录系统,相信这即使是对编程新手来说也是小菜一碟. 作为Python的小萌新,今天我想记录下来的是如何实现一个连接了MySQL数据库的用户登录注册系统,它的效 ...
- php 模拟登陆爬取_PHP模拟登录并获取数据
PHP模拟登录并获取数据 cURL 是一个功能强大的PHP库,使用PHP的cURL库可以简单和有效地抓取网页并采集内容,设置cookie完成模拟登录网页,curl提供了丰富的函数,开发者可以从PHP手 ...
- php模拟登陆青果教务系统,模拟登录 - php CURL模拟登陆正方教务系统
代码如下 $cookie_file = tempnam('./temp','cookie'); $login_url = 'http://211.64.47.129/default_ysdx.aspx ...
- c# 通过webView2模拟登陆小红书网页版,解析无水印视频图片,以及解决X-s,X-t签名验证【2023年4月29日】
一.c# WebView2简介 1.一开始使用WebBrowser,因为WebBrowser控件使用的是ie内核,经过修改注册表切换为Edge内核后, 发现Edge内核版本较低,加载一些视频网站提 ...
最新文章
- Linux之make的用法讲解
- 全面远程办公还有多远?用智办事很方便!
- 风之语.甲骨文裁员之我见
- ubuntu9.10硬盘安装记录一
- wpf绑定treeview 带查找_如何查找,修复和避免C#.NET中内存泄漏的8个最佳实践
- 社区团购如今进行得如火如荼
- django 集成个推_个推推送SDK集成过程及开发建议
- angularjs基础知识1
- paip.提高开发效率----自动数据库SQL备份
- java kindeditor ssh,typecho KindEditor插件
- (C语言) 用牛顿迭代法求方程2x^3 - 4x^2 + 3x - 6 = 0在1.5附近的根
- 前后端开发的心得体会_web前端学习心得体会
- [010] 百度地图API之根据经纬度查询地址信息(Android)
- Tampermonkey中文文档(部分)
- Python 画樱花树(樱花树下的约定)
- 大数据同步利器: 表格存储全增量一体消费通道 1
- 涅槃重生,字节人力荐大型分布式手册,凤凰架构让你浴火成神
- 服务器无法用u盘安装系统安装win7系统安装不了怎么办,为什么新电脑不支持安装Win7操作系统?...
- Chrome 升级成最新v33 造成开发上面诸多不便,赶紧回滚v32
- 【C语言入门】ZZULIOJ 1036-1040
热门文章
- anaconda安装sklearn_1. Sklearn —— 简介+安装
- c语言中的下标,c语言中数组的下标从什么入手下手?_后端开发
- 显示栅格数据的渲染器
- Mac IDEA解决Maven项目命令行报错:command not found: mvn
- Bytecoin节点搭建
- Python把list变为str
- 使用selenium爬取csdn博客
- 耦合式是什么意思_定向耦合器是如何工作的?能怎样应用?看完就全明白了
- 3904三极管是什么功能_什么是放大器。它有什么特性
- qt最大化和还原实现_从高被引研究论文来看电催化CO2还原研究进展