cookie的问题捣鼓了好久,本来以为要用正则提取JSESSIONID跟Referer,

后来发现模拟点击成绩管理的按钮(就是链接啦)cookie会自己更新的。

但是问题又来了,测试的时候有时是可以进去到成绩目录,有时候似乎只什么都不显示,

可能是网速的问题,但是觉得cookie也有问题。

先贴代码

import urllib.parse,urllib.request,http.cookiejar,os
#by:Nonikka   2014.3.30
cookie = http.cookiejar.CookieJar()
cookieProc = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(cookieProc)
urllib.request.install_opener(opener)
#http://sso.jwc.whut.edu.cn/Certification/login.doname = input("输入学号")postdata=urllib.parse.urlencode({'systemId':'','xmlmsg':'','userName':name,'password':name,'type':'xs','imageField.x':'60','imageField.y':'19'
}).encode(encoding='UTF8')headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:28.0) Gecko/20100101 Firefox/28.0','Host':'sso.jwc.whut.edu.cn','Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8','Referer':'http://sso.jwc.whut.edu.cn/Certification/toLogin.do','Cookie':'','Connection':'keep=alive'
}req = urllib.request.Request(url = 'http://sso.jwc.whut.edu.cn/Certification/login.do',#这个是教务处登陆网址data = postdata,headers = headers
)result = urllib.request.urlopen(req).read().decode("utf-8")
print(result)
os.system('pause')#模拟点击,更新cookie
scorep = urllib.request.urlopen('http://202.114.90.180/Score/').read().decode("utf-8") #这个网址就是成绩管理print(scorep)         #经常不显示                          os.system('pause')lishiscore = urllib.request.urlopen('http://202.114.90.180/Score/lscjList.do').read().decode("utf-8")    #成绩显示页面
print(lishiscore)     #经常不显示   os.system('pause')

求指导啊,自学挺有意思但是也经常“走投无路”。

Python爬虫初学(4)登陆武汉理工大学教务处并转到成绩管理相关推荐

  1. python爬虫初学实战——免登录爬取easyicon里的vip图标(2)

    python爬虫初学实战-免登录爬取easyicon里的vip图标(2) 实验日期:2020-08-09 tips:没看过前面(1)的可以康康,指路 -> 爬取easyicon里的png图标 成 ...

  2. python爬虫初学实战——免登录爬取easyicon里的vip图标(1)

    python爬虫初学入门实战 --无需登录无需vip获得各种大小的png图标,爬取easyicon里的图标并储存 首先附上爬取的网址地址 实验环境 操作系统:windows 10 版本:python ...

  3. 使用python爬虫模拟12306登陆

    使用python爬虫模拟12306登陆   需要用到requests库函数,下载requests库函数地方法:直接在命令行输入以下代码就可以了就可以了. pip install requests 模拟 ...

  4. 萌新python爬虫初学

    前言:先声明本人是小菜鸡一枚,望大佬勿鄙视.就在今天总感觉有什么大事发生,心神不宁的,突然天空一声巨响,菜鸡萌生写博客的想法.(天啦!天啦!这是要翻天了,菜鸡都要写博客了)现在的初心是:方便自己整理学 ...

  5. Python爬虫初学一(爬虫基础)

    目录 一.通用爬虫和聚焦爬虫 1.什么是网络爬虫? 1.通用爬虫 2.聚焦网络爬虫 二.HTTP和HTTPS 1.HTTP工作原理 1.浏览器发送HTTP请求的过程 三.客户端HTTP请求 1.请求方 ...

  6. Python爬虫初学二(网络数据采集)

    目录 一.网络数据采集 1.什么是网络数据采集 2.网络数据采集的特点 二.网络数据采集之urllib库 三.网络数据采集之requests库 1.requests安装 2.request方法汇总 3 ...

  7. python爬虫(一):模拟登陆微博

    最近花了不少时间来学python爬虫,觉得还是有很多问题的,比如说requests.get获得Pixiv的网页源代码,一直获取不到,不过我猜测大概是headers的问题,准备之后处理. 废话少说我们先 ...

  8. Python爬虫之模拟登陆

    女神找我倾诉,实验室实验选不上,刚出来就被秒了,让我帮她选实验,我想我这万年单身的手速估计还是抢不过我这些师兄们,干脆写一个脚本吧,这样以后女神就找我选实验了,废话少说,切入主题,看这篇教程首先得保证 ...

  9. Python爬虫初学:报错1:UnicodeEncodeError: 'gbk' codec can't encode character '\xbb'……

    大家好,我是庞老板咩,一名浙江大学动力工程20级推免生,最近开始自学Python.这是我的第一篇博客,很高兴可以在CSDN这个平台和大家分享交流^ ^ 首先,这是一段我初学爬虫时的代码: import ...

  10. Python爬虫教程——新浪微博登陆

    一.前期准备: 编译环境:Python 3.4 Python库:requests.re.urllib.BeautifulSoup 二.实现分析: 尝试爬虫登陆网站时,会涉及到很多Javascript. ...

最新文章

  1. Docker入门六部曲——基本引导
  2. mac OS Sierra支持破解程序
  3. matplotlib画图中文显示问题
  4. 他总在逆风翻盘,绝地反击!最不爱钱却成了最有钱的人...
  5. mysql 断电 启动不了 start: Job failed to start
  6. 「PKUWC2018」Slay the Spire
  7. qt android 应用程序图标大小,vs+qt 设置应用程序图标
  8. 从sqlite 迁移 mysql_将 Ghost 从 SQLite3 数据库迁移到 MySQL 数据库
  9. Elasticsearch下安装ik分词器
  10. python while无限循环、人为终止_Python while while循环永远不会停止,即使它应该
  11. Spark RDD Action 简单用例(一)
  12. java 继承 this_java多重继承的this属于谁
  13. 解决Latex编译报错:Command `\Bbbk‘ already defined. ...ol{\Bbbk} {\mathord}{AMSb}{“7C}
  14. DB: 20 个数据库设计最佳实践
  15. canvas教程15-变形
  16. 中兴linux下载软件,最新中兴新支点操作系统v3.2.2 最新版下载地址电脑版-CC软件...
  17. sql server分组排序
  18. OpenCasCade与NURBS——B样条曲线
  19. Windows截图快捷键及自动保存路径
  20. ACC算法学习笔记(六):ASPICE开发流程

热门文章

  1. 2022-2028全球及中国薪酬管理系统行业研究及十四五规划分析报告
  2. SQL12 获取每个部门中当前员工薪水最高的相关信息
  3. WebSocket协议及聊天室的简易实现
  4. ssh 远程执行脚本(自己总结)
  5. 微信亲戚备注分组名称_【微信分组备注名称大全】qq分组备注名称大全
  6. python 操作excel排序_python操作excel[转]
  7. 云服务器初始化失败怎么办,提示交互式登录进程初始化失败是什么原因?解决方法步骤教程...
  8. 洛谷 P1069 细胞分裂 质因数分解
  9. 自媒体、新媒体、融媒体的区别是什么?
  10. 红黑树(四)之 C++的实现 http://www.cnblogs.com/skywang12345/p/3624291.html?utm_source=tuicoolutm_medium=refe