详细内容

Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容,登陆前与登陆后是不同的,或者不允许的。

在python中它为我们提供了cookiejar模块,它位于http包中,用于对Cookie的支持。通过它我们能捕获cookie并在后续连接请求时重新发送,比如可以实现模拟登录功能。该模块主要的对象有CookieJar、FileCookieJar、MozillaCookieJar、LWPCookieJar。

cookie的获取方法## cookie的获取

# -*- coding: UTF-8 -*-

from urllib import request

from http import cookiejar

if __name__ == '__main__':

#声明一个CookieJar对象实例来保存cookie

cookie = cookiejar.CookieJar()

#利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler

handler=request.HTTPCookieProcessor(cookie)

#通过CookieHandler创建opener

opener = request.build_opener(handler)

#此处的open方法打开网页

response = opener.open('http://www.baidu.com')

#打印cookie信息

for item in cookie:

print('Name = %s' % item.name)

print('Value = %s' % item.value)

更多Python相关技术文章,请访问Python教程栏目进行学习!

python爬虫cookie_python爬虫怎么获取cookie相关推荐

  1. python cookies是什么_Python获取cookie有什么用

    cookie是什么? Cookie,指某些网站为了辨别用户身份.进行session跟踪而储存在用户本地终端上的数据(通常经过加密).在web开发中,经常需要对会话进行跟踪.因为http请求是无状态协议 ...

  2. python接口自动化:自动获取cookie

    session是什么: 用户登录后(发送登录请求后,或者说用户和服务器建立会话),服务器把用户的身份信息,存储在数据库中,这就是session. 其中该身份信息的标识字段就是sessionID,各个系 ...

  3. Scrapy爬虫+Selenium自动获取cookie爬取网易云音乐个人喜爱歌单

    此货很干,跟上脚步!!! Cookie cookie是什么东西? 小饼干?能吃吗? 简单来说就是你第一次用账号密码访问服务器 服务器在你本机硬盘上设置一个身份识别的会员卡(cookie) 下次再去访问 ...

  4. 登陆一次b站获取cookie免登陆登陆b站

    selenium模块练习,爬虫初学. 先获取cookie保存到cookies.txt文件中: from selenium import webdriver from selenium.webdrive ...

  5. python爬虫(十四)selenium(select、17素材网、模拟登录豆瓣和QQ空间、获取cookie、行为链)

    selenium介绍(下) 不管页面是动态加载还是静态加载出来的,只要是elements中能找到的,都能用selenium来获取数据,selenium获取数据的方式是以页面最终渲染后的前端为基础的,不 ...

  6. python打开浏览器后带cookie_Python爬虫使用浏览器的cookies:browsercookie

    很多用Python的人可能都写过网络爬虫,自动化获取网络数据确实是一件令人愉悦的事情,而Python很好的帮助我们达到这种愉悦.然而,爬虫经常要碰到各种登录.验证的阻挠,让人灰心丧气(网站:天天碰到各 ...

  7. python网络爬虫系列教程——python中urllib、urllib2、cookie模块应用全解

    全栈工程师开发手册 (作者:栾鹏) python教程全解 python数据挖掘库urllib.urllib2.cookie知识全解.本文使用python2.7环境,如果需要使用python3的环境只需 ...

  8. python爬虫处理js混淆加密_Python爬虫—破解JS加密的Cookie

    專 欄 ❈Jerry,Python中文社区专栏作者. blog:https://my.oschina.net/jhao104/blog github:https://github.com/jhao10 ...

  9. python爬虫小说代码示例-Python从零开始写爬虫-4 解析HTML获取小说正文

    Python从零开始写爬虫-4 解析HTML获取小说正文 在上一节中, 我们已经学会如何获取小说的目录, 这一节我们将学习如何通过正则表达式(在第二节学习过)来获取小说正文. 首先, 先随便选择一个章 ...

最新文章

  1. 第十六届智能车竞赛广东省线上比赛成绩汇总
  2. window.postMessage实现网页间通信
  3. android-ndk-r15c libncurses.so.5
  4. 无线传感网3-2.高效率目标物监控
  5. leetcode 566. 重塑矩阵(Java版,坐标转换)
  6. 关于数据运营的一点小思考
  7. wpf 按钮样式_键盘 | 01.在程序集间引用样式
  8. 常识分析 | 为什么 CPU 访问硬盘很慢
  9. 应用宝认领应用签名_腾讯应用宝认领应用步骤
  10. HTML5拖放API(代码展示)
  11. PHP -- Traits新特性
  12. 某绒面试的病毒分析(一)
  13. 黑客都使用什么编程语言?
  14. HTTP请求方法及幂等性
  15. LayoutLM: Pre-training of Text and Layout for Document Image Understanding
  16. 数据结构 --- c语言实现双向循环链表
  17. SAP中通过放大成本核算批量的方式解决由采购金额过小导致的”成本构成分解为零”的问题
  18. WordPress强大多功能主题模板The7 v9.16.0 已激活版本完全兼容大多数插件
  19. linux通过修改/etc/hosts文件 添加IP地址与域名的映射
  20. kafka streams 中streams.errors.StreamsException: java.nio.file.DirectoryNotEmptyException

热门文章

  1. 二叉树中序遍历习题引发的时间空间复杂度思考:内存角度
  2. matlab如何制作振型动画_求用matlab制作简单动画实例
  3. 漫画:动态规划系列 第一讲
  4. DEVOPS架构师 -- 02Kubernetes落地实践之旅
  5. 魅族android 10内测答案,魅族宣布在中国招募Android 10内测版
  6. visio画图保存去白边,不失真
  7. 争夺2nm芯片王冠!台积电即将建厂量产,「牙膏厂」英特尔发布5年计划
  8. 骁龙8+和骁龙888plus哪个好 骁龙8+gen1和骁龙888plus功耗
  9. 安装好eVC4后,打开eVC时提示:Microsoft eMbedded Visual C++ has discovered no CE platform SDK installed on the d
  10. 安装docker时出现以下错误:Package ‘docker-ce‘ has no installation candidate