Python爬虫初学（4）登陆武汉理工大学教务处并转到成绩管理

cookie的问题捣鼓了好久，本来以为要用正则提取JSESSIONID跟Referer，

后来发现模拟点击成绩管理的按钮（就是链接啦）cookie会自己更新的。

但是问题又来了，测试的时候有时是可以进去到成绩目录，有时候似乎只什么都不显示，

可能是网速的问题，但是觉得cookie也有问题。

先贴代码

import urllib.parse,urllib.request,http.cookiejar,os

#by：Nonikka   2014.3.30
cookie = http.cookiejar.CookieJar()
cookieProc = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(cookieProc)
urllib.request.install_opener(opener)
#http://sso.jwc.whut.edu.cn/Certification/login.doname = input("输入学号")postdata=urllib.parse.urlencode({'systemId':'','xmlmsg':'','userName':name,'password':name,'type':'xs','imageField.x':'60','imageField.y':'19'
}).encode(encoding='UTF8')headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:28.0) Gecko/20100101 Firefox/28.0','Host':'sso.jwc.whut.edu.cn','Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8','Referer':'http://sso.jwc.whut.edu.cn/Certification/toLogin.do','Cookie':'','Connection':'keep=alive'
}req = urllib.request.Request(url = 'http://sso.jwc.whut.edu.cn/Certification/login.do',#这个是教务处登陆网址data = postdata,headers = headers
)result = urllib.request.urlopen(req).read().decode("utf-8")
print(result)
os.system('pause')#模拟点击，更新cookie
scorep = urllib.request.urlopen('http://202.114.90.180/Score/').read().decode("utf-8") #这个网址就是成绩管理print(scorep)         #经常不显示                          os.system('pause')lishiscore = urllib.request.urlopen('http://202.114.90.180/Score/lscjList.do').read().decode("utf-8")    #成绩显示页面
print(lishiscore)     #经常不显示   os.system('pause')

求指导啊，自学挺有意思但是也经常“走投无路”。

Python爬虫初学（4）登陆武汉理工大学教务处并转到成绩管理相关推荐

python爬虫初学实战——免登录爬取easyicon里的vip图标（2）
python爬虫初学实战-免登录爬取easyicon里的vip图标(2) 实验日期:2020-08-09 tips:没看过前面(1)的可以康康,指路 -> 爬取easyicon里的png图标成 ...
python爬虫初学实战——免登录爬取easyicon里的vip图标（1）
python爬虫初学入门实战 --无需登录无需vip获得各种大小的png图标,爬取easyicon里的图标并储存首先附上爬取的网址地址实验环境操作系统:windows 10 版本:python ...
使用python爬虫模拟12306登陆
使用python爬虫模拟12306登陆需要用到requests库函数,下载requests库函数地方法:直接在命令行输入以下代码就可以了就可以了. pip install requests 模拟 ...
萌新python爬虫初学
前言:先声明本人是小菜鸡一枚,望大佬勿鄙视.就在今天总感觉有什么大事发生,心神不宁的,突然天空一声巨响,菜鸡萌生写博客的想法.(天啦!天啦!这是要翻天了,菜鸡都要写博客了)现在的初心是:方便自己整理学 ...
Python爬虫初学一（爬虫基础）
目录一.通用爬虫和聚焦爬虫 1.什么是网络爬虫? 1.通用爬虫 2.聚焦网络爬虫二.HTTP和HTTPS 1.HTTP工作原理 1.浏览器发送HTTP请求的过程三.客户端HTTP请求 1.请求方 ...
Python爬虫初学二（网络数据采集）
目录一.网络数据采集 1.什么是网络数据采集 2.网络数据采集的特点二.网络数据采集之urllib库三.网络数据采集之requests库 1.requests安装 2.request方法汇总 3 ...
python爬虫(一):模拟登陆微博
最近花了不少时间来学python爬虫,觉得还是有很多问题的,比如说requests.get获得Pixiv的网页源代码,一直获取不到,不过我猜测大概是headers的问题,准备之后处理. 废话少说我们先 ...
Python爬虫之模拟登陆
女神找我倾诉,实验室实验选不上,刚出来就被秒了,让我帮她选实验,我想我这万年单身的手速估计还是抢不过我这些师兄们,干脆写一个脚本吧,这样以后女神就找我选实验了,废话少说,切入主题,看这篇教程首先得保证 ...
Python爬虫初学：报错1：UnicodeEncodeError: 'gbk' codec can't encode character '\xbb'……
大家好,我是庞老板咩,一名浙江大学动力工程20级推免生,最近开始自学Python.这是我的第一篇博客,很高兴可以在CSDN这个平台和大家分享交流^ ^ 首先,这是一段我初学爬虫时的代码: import ...
Python爬虫教程——新浪微博登陆
一.前期准备: 编译环境:Python 3.4 Python库:requests.re.urllib.BeautifulSoup 二.实现分析: 尝试爬虫登陆网站时,会涉及到很多Javascript. ...

Python爬虫初学（4）登陆武汉理工大学教务处并转到成绩管理

Python爬虫初学（4）登陆武汉理工大学教务处并转到成绩管理相关推荐

最新文章

热门文章