我们在使用爬虫的时候,经常会用到cookie进行模拟登陆和访问。在使用urllib库做爬虫,我们需要借助http.cookiejar库中的CookieJar来实现。

cookiejar怎么样

CookieJar类有一些子类,分别是FileCookieJar,MozillaCookieJar,LWPCookieJar。

CookieJar:管理HTTPcookie值、存储HTTP请求生成的cookie、向传出的HTTP请求添加cookie的对象。整个cookie都存储在内存中,对CookieJar实例进行垃圾回收后cookie也将丢失。

FileCookieJar(filename,delayload=None,policy=None):从CookieJar派生而来,用来创建FileCookieJar实例,检索cookie信息并将cookie存储到文件中。filename是存储cookie的文件名。delayload为True时支持延迟访问访问文件,即只有在需要时才读取文件或在文件中存储数据。

MozillaCookieJar(filename,delayload=None,policy=None):从FileCookieJar派生而来,创建与Mozilla浏览器cookies.txt兼容的FileCookieJar实例。

LWPCookieJar(filename,delayload=None,policy=None):从FileCookieJar派生而来,创建与libwww-perl标准的Set-Cookie3文件格式兼容的FileCookieJar实例。

其实大多数情况下,我们只用CookieJar(),如果需要和本地文件交互,就用MozillaCookjar()或LWPCookieJar()。

当然,如果我们对cookie有定制的需要,那么我们也要借助HTTPCookieProcess处理器来处理。具体看下面代码。

使用CookieJar获取cookie值

代码如下:

if__name__=='__main__':

url='http://www.baidu.com/'

headers={

'User-Agent':'Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/53.0.2785.104Safari/537.36Core/1.53.3427.400QQBrowser/9.6.12513.400'

}

总之,cookiejar给大家简单的介绍了一些,希望大家多看看。

cookiejar包_cookiejar的用法 | 学步园相关推荐

  1. cookiejar包_cookiejar的用法

    我们在使用爬虫的时候,经常会用到cookie进行模拟登陆和访问.在使用urllib库做爬虫,我们需要借助http.cookiejar库中的CookieJar来实现. cookiejar怎么样 Cook ...

  2. matlab clabel函数用法,CLabel的用法 | 学步园

    DDX_Control(pDX, IDC_STATIC_CONNSTATE, m_labConnState); IDC_STATIC_CONNSTATE  是某静态控件的ID,设置这个静态控件的控制变 ...

  3. java swing removeall_java中JFrame中函数removeAll的用法 | 学步园

    用baidu搜了半天搜不出来,用google一下就出来了~~~ 下面用自己的代码来解释下removeAll()的用法 注意一定要在getContentPane()中用removeAll(): impo ...

  4. java 反斜杠_java反斜杠\的用法 | 学步园

    java反斜杠\的用法比较怪异,分为两种场景: 1. 正则表达式 匹配点(.) 或  {.[.(.?.$.^ .+和 * 这些特殊符号要要前加双斜框,表示字符类的时候也是用双斜杠譬如(\\s[空白符] ...

  5. ear包目录_EAR包的组成结构 | 学步园

    EAR文件结构在J2EE标准定义了所有的EJB classes 都应该打包成一个JAR 文件. 所有的web 组件(JSPs, static pages, Servlets, gifs)都应该打包在一 ...

  6. java biginteger使用_java中的BigInteger的基本用法 | 学步园

    注 : 为了更好的理解BigInteger类,特提供了一篇关于BigInteger的题目及本人的解答,感兴趣的朋友可以到我的博客看一下 import java.math.BigInteger; pub ...

  7. java的startswith_java startsWith和endsWith的用法 | 学步园

    public class StringDemo{ public static void main(String args[]){ String s1="this is my original ...

  8. mysql函数match_Mysql全文搜索match…against的用法 | 学步园

    全文检索在 MySQL 中就是一个 FULLTEXT 类型索引.FULLTEXT 索引用于   MyISAM 表,可以在 CREATE TABLE 时或之后使用 ALTER TABLE 或 CREAT ...

  9. vector用法 java equals_java泛型vector的用法 | 学步园

    java.util  类 Vector boolean add(E o) 将指定元素追加到此向量的末尾. void add(int index, E element) 在此向量的指定位置插入指定的元素 ...

最新文章

  1. arcgis下的python编程-面向ArcGIS的Python脚本编程
  2. 怎么自学python编程-如何自学Python编程呢?老男孩Python学习方法
  3. 【HDU 1576】 A/B
  4. 在EO中获取某字段基于表的列名
  5. 精彩十年(2)——阴沟里也翻船
  6. PowerDesigner 常用配置修改
  7. Linux之rm命令
  8. Dialog对话框全解
  9. Chapter.13 Copy Constructor
  10. 我的团长我的团第二十四集
  11. feign调用是否会经过网关
  12. 计算机导论(1—6章)笔记
  13. 安卓sqlite的使用
  14. 子组件改变父组件的两种方式
  15. 带界面的程序化交易软件-从今天开始
  16. 自学Python第九天- 模块、包、编码、文件操作、OS 模块、打包
  17. [linux学习]centos下mysql的简单使用教程
  18. 通过配置环境变量解锁win+r新玩法
  19. 浅析 - 被歧视的小众需求
  20. AIX AIO, DIO, CIO

热门文章

  1. 10月第2周安全回顾 Web安全认证架构成型 PDF阅读器存漏洞
  2. 三层架构 - 表现层(界面层、Web层 - MVC)、业务逻辑层(Service)、数据访问层(DAO)
  3. 【汇正财经】什么是证券监管?
  4. [转]想象五年之后的你
  5. 2022年金属非金属矿山(小型露天采石场)主要负责人操作证考试题及模拟考试
  6. idea开发工具右侧没有maven工具栏
  7. 项目部署到centos7服务器验证码乱码
  8. VS Code新建VUE项目
  9. 为什么NFC读卡芯片的性价比可以做到这么好,DS522给国产RC522上了一课
  10. Linux 中安装 JDK(rpm包安装)