最近搞到了一个学校教务系统可以查询全校成绩的账号,恰逢申请奖学金之际,就想用python写个脚本把年级里的绩点排名给爬下来,可是就在写登录的时候发现还是要处理验证码登录的问题,为了避免麻烦,就没使用类似pytester的识别库,使用了一个比较讨巧的方法:

Cookies:

cookies是用户在登录之后登录网站发送给浏览器的一小段文本,其中记录着你的登录信息,不过不用担心安全问题,浏览器一般会帮你把cookies保护起来而且这段文本是经过加密,平常人看来就是一堆乱码。比如这样:

当然,学过前端的朋友应该都是知道的,不过cookies一般是被浏览器给保护起来不让看的(比如说Safari...) 这时候我们就要利用抓包的方法把cookies给抓下来了:

对于用Win朋友来说可以直接用Chrome然后按F12打开Internet,在登录后刷新页面,寻找cookies,但是Chrome对于一些网站的兼容性比较差,所以建议用Firefox浏览器安装Firebug插件来查询,安装完插件之后登录完网站,然后单击右上角的插件就发现可以找到cookies信息了:

Like this

接下来就是代码的具体实现了,只有使用cookies登录的部分,不涉及其他脚本代码:

基于Python2.X的代码

最后:

使用cookies登录简直是要比传统的写用户名密码登录的方法爽了不知多少,基于这个方法自己写的选课脚本也是代码量骤减,最后要注意cookies是有一定时间限制的,这算是一个比较讨巧的方法,用过一次之后就知道有多方便啦~

python登录网站 爬虫_Python爬虫如何使用Cookies登录网站相关推荐

  1. python爬视频网站数据_python爬虫基础应用----爬取无反爬视频网站

    一.爬虫简单介绍 爬虫是什么? 爬虫是首先使用模拟浏览器访问网站获取数据,然后通过解析过滤获得有价值的信息,最后保存到到自己库中的程序. 爬虫程序包括哪些模块? python中的爬虫程序主要包括,re ...

  2. python成绩查询系统_Python爬虫实战:登录教务系统查成绩

    本文记录我用Python登录教务系统查询成绩的过程.手动输入验证码,简单获取成绩页面.后续将可能更新自动识别验证码登录查询 前期准备 本爬虫用到了Python的Requests库和BeautifulS ...

  3. python获取网站代码_python爬虫1——获取网站源代码(豆瓣图书top250信息)

    # -*- coding: utf-8 -*- import requests import re import sys reload(sys) sys.setdefaultencoding('utf ...

  4. 爬虫python下载网站所有图片_python爬虫(4):多页图片批量下载-澎湃网信息图...

    澎湃网文章的质量不错,它的"美数课"栏目的信息图做得也很好.图片干货多还能带来ppt和图表制作的技巧.为了更方便浏览所有文章图片,通过分析Ajax爬取栏目至今所有信息图的图片. 但 ...

  5. python模拟登录页面下载_Python爬虫实战入门四:使用Cookie模拟登录——获取电子书下载链接...

    在实际情况中,很多网站的内容都是需要登录之后才能看到,如此我们就需要进行模拟登录,使用登录后的状态进行爬取.这里就需要使用到Cookie. 现在大多数的网站都是使用Cookie跟踪用户的登录状态,一旦 ...

  6. python爬去音乐_Python爬虫——分析酷我音乐网站,并爬取歌曲-Go语言中文社区

    前言: 爬取数据,我们都先必须了解开发者工具的使用和网页的源代码,即Python导入第三方库的步骤. 开发者工具使用步骤: 使用F12或者Ctrl+Shirt+i打开开发者工具 说明: 1)先检查HT ...

  7. hadoop 爬虫_python爬虫知识点梳理:带你全面入门python爬虫

    今天主要跟大家谈谈爬虫,尤其是刚入门的伙伴,少走弯路!文末附全套的视频版Python学习教程,含爬虫教程!希望大家能够把文字部分看完!做一个梳理! 在学习爬虫之前我们需要明白的一个问题: 爬虫能做什么 ...

  8. python谷歌网页爬虫_python爬虫入门01:教你在 Chrome 浏览器轻松抓包

    通过 python爬虫入门:什么是爬虫,怎么玩爬虫? 我们知道了什么是爬虫 也知道了爬虫的具体流程 那么在我们要对某个网站进行爬取的时候 要对其数据进行分析 就要知道应该怎么请求 就要知道获取的数据是 ...

  9. python爬取网页内容_Python爬虫原理解析

    笔者公众号:技术杂学铺 笔者网站:mwhitelab.com 本文将从何为爬虫.网页结构.python代码实现等方面逐步解析网络爬虫. 1. 何为爬虫 如今互联网上存储着大量的信息. 作为普通网民,我 ...

最新文章

  1. java boolean 按位或_布尔运算符与按位运算符
  2. 万词霸屏的本质是什么?
  3. sqlserver2008中如何用右键可视化的设置外键
  4. Java开发微信之菜单不显示
  5. 提交Form表单,submit之前做js判断处理
  6. 前端学习(1991)vue之电商管理系统电商系统之实现商品的分页功能
  7. struts2 中文乱码问题,自定义过滤器通用解决方法
  8. 又拍云php表单,又拍云的表单api提交
  9. java面向对象的理解_java胜于C语言,却又静态面向对象,简单?
  10. 线性筛法 欧拉筛c语言,[洛谷P3383][模板]线性筛素数-欧拉筛法
  11. 基于协同过滤,NMF和Baseline的推荐算法
  12. 计算机绘图中级,计算机绘图(中级)
  13. Gdevops峰会北京站归来
  14. 基于量化交易回测的金融股票案例基础知识
  15. 计算机英语趣味知识竞赛题库,2019年小学四年级英语趣味知识竞赛试题
  16. 视觉心理物理学(2)matlab与ptb3
  17. 5G步入规模化商用关键期
  18. 关于现今发现最早北洋底标年代和史料不同的疑惑
  19. 推荐一个轻松搞定数据加密解密神器!
  20. 个人注册PowerBI账号申请

热门文章

  1. 巧做辅助线计算三角形角的度数
  2. SAP 电商云 UI 持续集成里 docker 的使用场景一例
  3. SAP Cloud for Customer的前世今生
  4. Angular jasmine单元测试框架spec的运行时数据结构
  5. Angular单元测试里pipe的mock设计
  6. SAP Spartacus ProductCarouselComponent
  7. Angular reducer第一次被框架调用的单步调试细节
  8. 微软Azure storage account的path值代表什么含义
  9. 使用SAP Cloud for Customer Product OData服务读取产品主数据和其图片信息
  10. SAP gateway standard mode和compatible mode的区别