Python爬虫初学(4)登陆武汉理工大学教务处并转到成绩管理
cookie的问题捣鼓了好久,本来以为要用正则提取JSESSIONID跟Referer,
后来发现模拟点击成绩管理的按钮(就是链接啦)cookie会自己更新的。
但是问题又来了,测试的时候有时是可以进去到成绩目录,有时候似乎只什么都不显示,
可能是网速的问题,但是觉得cookie也有问题。
先贴代码
import urllib.parse,urllib.request,http.cookiejar,os
#by:Nonikka 2014.3.30
cookie = http.cookiejar.CookieJar()
cookieProc = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(cookieProc)
urllib.request.install_opener(opener)
#http://sso.jwc.whut.edu.cn/Certification/login.doname = input("输入学号")postdata=urllib.parse.urlencode({'systemId':'','xmlmsg':'','userName':name,'password':name,'type':'xs','imageField.x':'60','imageField.y':'19'
}).encode(encoding='UTF8')headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:28.0) Gecko/20100101 Firefox/28.0','Host':'sso.jwc.whut.edu.cn','Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8','Referer':'http://sso.jwc.whut.edu.cn/Certification/toLogin.do','Cookie':'','Connection':'keep=alive'
}req = urllib.request.Request(url = 'http://sso.jwc.whut.edu.cn/Certification/login.do',#这个是教务处登陆网址data = postdata,headers = headers
)result = urllib.request.urlopen(req).read().decode("utf-8")
print(result)
os.system('pause')#模拟点击,更新cookie
scorep = urllib.request.urlopen('http://202.114.90.180/Score/').read().decode("utf-8") #这个网址就是成绩管理print(scorep) #经常不显示 os.system('pause')lishiscore = urllib.request.urlopen('http://202.114.90.180/Score/lscjList.do').read().decode("utf-8") #成绩显示页面
print(lishiscore) #经常不显示 os.system('pause')
求指导啊,自学挺有意思但是也经常“走投无路”。
Python爬虫初学(4)登陆武汉理工大学教务处并转到成绩管理相关推荐
- python爬虫初学实战——免登录爬取easyicon里的vip图标(2)
python爬虫初学实战-免登录爬取easyicon里的vip图标(2) 实验日期:2020-08-09 tips:没看过前面(1)的可以康康,指路 -> 爬取easyicon里的png图标 成 ...
- python爬虫初学实战——免登录爬取easyicon里的vip图标(1)
python爬虫初学入门实战 --无需登录无需vip获得各种大小的png图标,爬取easyicon里的图标并储存 首先附上爬取的网址地址 实验环境 操作系统:windows 10 版本:python ...
- 使用python爬虫模拟12306登陆
使用python爬虫模拟12306登陆 需要用到requests库函数,下载requests库函数地方法:直接在命令行输入以下代码就可以了就可以了. pip install requests 模拟 ...
- 萌新python爬虫初学
前言:先声明本人是小菜鸡一枚,望大佬勿鄙视.就在今天总感觉有什么大事发生,心神不宁的,突然天空一声巨响,菜鸡萌生写博客的想法.(天啦!天啦!这是要翻天了,菜鸡都要写博客了)现在的初心是:方便自己整理学 ...
- Python爬虫初学一(爬虫基础)
目录 一.通用爬虫和聚焦爬虫 1.什么是网络爬虫? 1.通用爬虫 2.聚焦网络爬虫 二.HTTP和HTTPS 1.HTTP工作原理 1.浏览器发送HTTP请求的过程 三.客户端HTTP请求 1.请求方 ...
- Python爬虫初学二(网络数据采集)
目录 一.网络数据采集 1.什么是网络数据采集 2.网络数据采集的特点 二.网络数据采集之urllib库 三.网络数据采集之requests库 1.requests安装 2.request方法汇总 3 ...
- python爬虫(一):模拟登陆微博
最近花了不少时间来学python爬虫,觉得还是有很多问题的,比如说requests.get获得Pixiv的网页源代码,一直获取不到,不过我猜测大概是headers的问题,准备之后处理. 废话少说我们先 ...
- Python爬虫之模拟登陆
女神找我倾诉,实验室实验选不上,刚出来就被秒了,让我帮她选实验,我想我这万年单身的手速估计还是抢不过我这些师兄们,干脆写一个脚本吧,这样以后女神就找我选实验了,废话少说,切入主题,看这篇教程首先得保证 ...
- Python爬虫初学:报错1:UnicodeEncodeError: 'gbk' codec can't encode character '\xbb'……
大家好,我是庞老板咩,一名浙江大学动力工程20级推免生,最近开始自学Python.这是我的第一篇博客,很高兴可以在CSDN这个平台和大家分享交流^ ^ 首先,这是一段我初学爬虫时的代码: import ...
- Python爬虫教程——新浪微博登陆
一.前期准备: 编译环境:Python 3.4 Python库:requests.re.urllib.BeautifulSoup 二.实现分析: 尝试爬虫登陆网站时,会涉及到很多Javascript. ...
最新文章
- Docker入门六部曲——基本引导
- mac OS Sierra支持破解程序
- matplotlib画图中文显示问题
- 他总在逆风翻盘,绝地反击!最不爱钱却成了最有钱的人...
- mysql 断电 启动不了 start: Job failed to start
- 「PKUWC2018」Slay the Spire
- qt android 应用程序图标大小,vs+qt 设置应用程序图标
- 从sqlite 迁移 mysql_将 Ghost 从 SQLite3 数据库迁移到 MySQL 数据库
- Elasticsearch下安装ik分词器
- python while无限循环、人为终止_Python while while循环永远不会停止,即使它应该
- Spark RDD Action 简单用例(一)
- java 继承 this_java多重继承的this属于谁
- 解决Latex编译报错:Command `\Bbbk‘ already defined. ...ol{\Bbbk} {\mathord}{AMSb}{“7C}
- DB: 20 个数据库设计最佳实践
- canvas教程15-变形
- 中兴linux下载软件,最新中兴新支点操作系统v3.2.2 最新版下载地址电脑版-CC软件...
- sql server分组排序
- OpenCasCade与NURBS——B样条曲线
- Windows截图快捷键及自动保存路径
- ACC算法学习笔记(六):ASPICE开发流程
热门文章
- 2022-2028全球及中国薪酬管理系统行业研究及十四五规划分析报告
- SQL12 获取每个部门中当前员工薪水最高的相关信息
- WebSocket协议及聊天室的简易实现
- ssh 远程执行脚本(自己总结)
- 微信亲戚备注分组名称_【微信分组备注名称大全】qq分组备注名称大全
- python 操作excel排序_python操作excel[转]
- 云服务器初始化失败怎么办,提示交互式登录进程初始化失败是什么原因?解决方法步骤教程...
- 洛谷 P1069 细胞分裂 质因数分解
- 自媒体、新媒体、融媒体的区别是什么?
- 红黑树(四)之 C++的实现 http://www.cnblogs.com/skywang12345/p/3624291.html?utm_source=tuicoolutm_medium=refe