python登录网站 爬虫_Python爬虫如何使用Cookies登录网站
最近搞到了一个学校教务系统可以查询全校成绩的账号,恰逢申请奖学金之际,就想用python写个脚本把年级里的绩点排名给爬下来,可是就在写登录的时候发现还是要处理验证码登录的问题,为了避免麻烦,就没使用类似pytester的识别库,使用了一个比较讨巧的方法:
Cookies:
cookies是用户在登录之后登录网站发送给浏览器的一小段文本,其中记录着你的登录信息,不过不用担心安全问题,浏览器一般会帮你把cookies保护起来而且这段文本是经过加密,平常人看来就是一堆乱码。比如这样:
当然,学过前端的朋友应该都是知道的,不过cookies一般是被浏览器给保护起来不让看的(比如说Safari...) 这时候我们就要利用抓包的方法把cookies给抓下来了:
对于用Win朋友来说可以直接用Chrome然后按F12打开Internet,在登录后刷新页面,寻找cookies,但是Chrome对于一些网站的兼容性比较差,所以建议用Firefox浏览器安装Firebug插件来查询,安装完插件之后登录完网站,然后单击右上角的插件就发现可以找到cookies信息了:
Like this
接下来就是代码的具体实现了,只有使用cookies登录的部分,不涉及其他脚本代码:
基于Python2.X的代码
最后:
使用cookies登录简直是要比传统的写用户名密码登录的方法爽了不知多少,基于这个方法自己写的选课脚本也是代码量骤减,最后要注意cookies是有一定时间限制的,这算是一个比较讨巧的方法,用过一次之后就知道有多方便啦~
python登录网站 爬虫_Python爬虫如何使用Cookies登录网站相关推荐
- python爬视频网站数据_python爬虫基础应用----爬取无反爬视频网站
一.爬虫简单介绍 爬虫是什么? 爬虫是首先使用模拟浏览器访问网站获取数据,然后通过解析过滤获得有价值的信息,最后保存到到自己库中的程序. 爬虫程序包括哪些模块? python中的爬虫程序主要包括,re ...
- python成绩查询系统_Python爬虫实战:登录教务系统查成绩
本文记录我用Python登录教务系统查询成绩的过程.手动输入验证码,简单获取成绩页面.后续将可能更新自动识别验证码登录查询 前期准备 本爬虫用到了Python的Requests库和BeautifulS ...
- python获取网站代码_python爬虫1——获取网站源代码(豆瓣图书top250信息)
# -*- coding: utf-8 -*- import requests import re import sys reload(sys) sys.setdefaultencoding('utf ...
- 爬虫python下载网站所有图片_python爬虫(4):多页图片批量下载-澎湃网信息图...
澎湃网文章的质量不错,它的"美数课"栏目的信息图做得也很好.图片干货多还能带来ppt和图表制作的技巧.为了更方便浏览所有文章图片,通过分析Ajax爬取栏目至今所有信息图的图片. 但 ...
- python模拟登录页面下载_Python爬虫实战入门四:使用Cookie模拟登录——获取电子书下载链接...
在实际情况中,很多网站的内容都是需要登录之后才能看到,如此我们就需要进行模拟登录,使用登录后的状态进行爬取.这里就需要使用到Cookie. 现在大多数的网站都是使用Cookie跟踪用户的登录状态,一旦 ...
- python爬去音乐_Python爬虫——分析酷我音乐网站,并爬取歌曲-Go语言中文社区
前言: 爬取数据,我们都先必须了解开发者工具的使用和网页的源代码,即Python导入第三方库的步骤. 开发者工具使用步骤: 使用F12或者Ctrl+Shirt+i打开开发者工具 说明: 1)先检查HT ...
- hadoop 爬虫_python爬虫知识点梳理:带你全面入门python爬虫
今天主要跟大家谈谈爬虫,尤其是刚入门的伙伴,少走弯路!文末附全套的视频版Python学习教程,含爬虫教程!希望大家能够把文字部分看完!做一个梳理! 在学习爬虫之前我们需要明白的一个问题: 爬虫能做什么 ...
- python谷歌网页爬虫_python爬虫入门01:教你在 Chrome 浏览器轻松抓包
通过 python爬虫入门:什么是爬虫,怎么玩爬虫? 我们知道了什么是爬虫 也知道了爬虫的具体流程 那么在我们要对某个网站进行爬取的时候 要对其数据进行分析 就要知道应该怎么请求 就要知道获取的数据是 ...
- python爬取网页内容_Python爬虫原理解析
笔者公众号:技术杂学铺 笔者网站:mwhitelab.com 本文将从何为爬虫.网页结构.python代码实现等方面逐步解析网络爬虫. 1. 何为爬虫 如今互联网上存储着大量的信息. 作为普通网民,我 ...
最新文章
- java boolean 按位或_布尔运算符与按位运算符
- 万词霸屏的本质是什么?
- sqlserver2008中如何用右键可视化的设置外键
- Java开发微信之菜单不显示
- 提交Form表单,submit之前做js判断处理
- 前端学习(1991)vue之电商管理系统电商系统之实现商品的分页功能
- struts2 中文乱码问题,自定义过滤器通用解决方法
- 又拍云php表单,又拍云的表单api提交
- java面向对象的理解_java胜于C语言,却又静态面向对象,简单?
- 线性筛法 欧拉筛c语言,[洛谷P3383][模板]线性筛素数-欧拉筛法
- 基于协同过滤,NMF和Baseline的推荐算法
- 计算机绘图中级,计算机绘图(中级)
- Gdevops峰会北京站归来
- 基于量化交易回测的金融股票案例基础知识
- 计算机英语趣味知识竞赛题库,2019年小学四年级英语趣味知识竞赛试题
- 视觉心理物理学(2)matlab与ptb3
- 5G步入规模化商用关键期
- 关于现今发现最早北洋底标年代和史料不同的疑惑
- 推荐一个轻松搞定数据加密解密神器!
- 个人注册PowerBI账号申请
热门文章
- 巧做辅助线计算三角形角的度数
- SAP 电商云 UI 持续集成里 docker 的使用场景一例
- SAP Cloud for Customer的前世今生
- Angular jasmine单元测试框架spec的运行时数据结构
- Angular单元测试里pipe的mock设计
- SAP Spartacus ProductCarouselComponent
- Angular reducer第一次被框架调用的单步调试细节
- 微软Azure storage account的path值代表什么含义
- 使用SAP Cloud for Customer Product OData服务读取产品主数据和其图片信息
- SAP gateway standard mode和compatible mode的区别