chrome浏览器使用方法介绍

学习目标
  1. 了解 新建隐身窗口的目的
  2. 了解 chrome中network的使用
  3. 了解 寻找登录接口的方法

1 新建隐身窗口

浏览器中直接打开网站,会自动带上之前网站时保存的cookie,但是在爬虫中首次获取页面是没有携带cookie的,这种情况如何解决呢?

使用隐身窗口,首次打开网站,不会带上cookie,能够观察页面的获取情况,包括对方服务器如何设置cookie在本地

2 chrome中network的更多功能

2.1 Perserve log

默认情况下,页面发生跳转之后,之前的请求url地址等信息都会消失,勾选perserve log后之前的请求都会被保留

2.2 filter过滤

在url地址很多的时候,可以在filter中输入部分url地址,对所有的url地址起到一定的过滤效果,具体位置在上面第二幅图中的2的位置

2.3 观察特定种类的请求

在上面第二幅图中的3的位置,有很多选项,默认是选择的all,即会观察到所有种类的请求

很多时候处于自己的目的可以选择all右边的其他选项,比如常见的选项:

  • XHR:大部分情况表示ajax请求
  • JS:js请求
  • CSS:css请求

但是很多时候我们并不能保证我们需要的请求是什么类型,特别是我们不清楚一个请求是否为ajax请求的时候,直接选择all,从前往后观察即可,其中js,css,图片等不去观察即可

不要被浏览器中的一堆请求吓到了,这些请求中除了js,css,图片的请求外,其他的请求并没有多少个

3 寻找登录接口

回顾之前人人网的爬虫我们找到了一个登陆接口,那么这个接口从哪里找到的呢?

http://www.renren.com

3.1 寻找action对的url地址

可以发现,这个地址就是在登录的form表单中action对应的url地址,回顾前端的知识点,可以发现就是进行表单提交的地址,对应的,提交的数据,仅仅需要:用户名的input标签中,name的值作为键,用户名作为值,密码的input标签中,name的值作为键,密码作为值即可

思考:

如果action对应的没有url地址的时候可以怎么做?

3.2 通过抓包寻找登录的url地址

通过抓包可以发现,在这个url地址和请求体中均有参数,比如uniqueTimestamprkey以及加密之后的password

这个时候我们可以观察手机版的登录接口,是否也是一样的

可以发现在手机版中,依然有参数,但是参数的个数少一些,这个时候,我们可以使用手机版作为参考,下一节来学习如何分析js


小结

  1. 使用隐身窗口的主要目的是为了避免首次打开网站携带cookie的问题
  2. chrome的network中,perserve log选项能够在页面发生跳转之后任然能够观察之前的请求
  3. 确定登录的地址有两种方法:
    • 寻找from表单action的url地址
    • 通过抓包获取

python网络爬虫系列(十)——chrome在爬虫中的使用相关推荐

  1. python网络爬虫系列教程_Python网络爬虫系列教程连载 ----长期更新中,敬请关注!...

    感谢大家长期对Python爱好者社区的支持,后期Python爱好者社区推出Python网络爬虫系列教程.欢迎大家关注.以下系列教程大纲,欢迎大家补充.视频长期连载更新中 --------------- ...

  2. python网络爬虫系列(0)——爬虫概述 http协议复习

    一.爬虫概述 知识点: 了解 爬虫的概念 了解 爬虫的作用 了解 爬虫的分类 掌握 爬虫的流程 1. 爬虫的概念 模拟浏览器,发送请求,获取响应 网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟客户端 ...

  3. python爬虫常见报错_Python爬虫系列之什么是爬虫

    时间过的总是那么快,特别是对于一个有拖延症的人来说,例如我...早就想出一个关于爬虫的系列教程,但总是被自己的拖延症和一系列的杂碎事情打断.最近终于将自己的所有事情以及自己最真实的想法捋顺了,所以决定 ...

  4. Python视频学习(十九、爬虫基础)

    目录 0. 安装python模块的方法 1. 爬虫的基础知识 1.1 爬虫的分类 1.2 爬虫工作流程 a. 通用搜索引擎的局限性 b. robots协议 1.3 HTTP和HTTPS a. HTTP ...

  5. python爬虫动态数据获取_爬虫系列(9)爬虫的多线程理论以及动态数据的获取方法。...

    NO·1 爬虫之多线程 1. 引入我们之前写的爬虫都是单个线程的?这怎么够?一旦一个地方卡到不动了,那不就永远等待下去了?为此我们可以使用多线程或者多进程来处理. 不建议你用这个,不过还是介绍下了,如 ...

  6. Python网络数据采集系列-------概述

    这是一个正在准备中的系列文章,主要参考的是<Web Scraping with Python_Collecting Data from the Modern Web-O'Reilly(2015) ...

  7. 爬虫系列之百度云爬虫

    项目地址:GitHub - gudegg/yunSpider: 百度云网盘爬虫 百度云爬虫 安装使用 安装go与设置gopath clone项目到gopath目录 安装依赖 go get github ...

  8. python网络编程系列

    计算机基础 网络基础 套接字 socket模块 TCP协议和UDP协议 struct 模块简介 struct 模块解决 TCP黏包问题 socket 客户端的认证 socketserver模块初识 客 ...

  9. python cv2 matchtemplate_OpenCV-Python系列十:模板匹配

    模板匹配应用的场景非常多,OCR(字符识别),目标检测.定位等等.OpenCV中,你可以使用cv2.matchTemplate()来完成.对于其中的计算原理,可参考如下博客: cv2.matchTem ...

  10. python网络编程编码和解码_python编程中的编码和解码问题

    在编程中,对编码和解码感到困惑,经常会莫名其妙的出现一些问题,根据需要解决的问题,有以下几种情形: 1.在python2.7以下版本中,unicode和string的转换问题.对于一个变量v,是不是因 ...

最新文章

  1. 聊聊Service Mesh:linkerd
  2. 人脸识别技术商用再加速 安企步履坚定
  3. C++工程中初步使用QML
  4. Windows XP时代终结:假设你还在用它怎么办
  5. Linux安装cx_Oracles
  6. Linux系统信息查看命令大全
  7. Django中ajax发送post请求,报403错误CSRF验证失败解决办法
  8. C# 中? 和 ?? 在变量中的使用
  9. oracle profile为何被修改了,【图片】快被oracle玩死了,谁能告诉我为啥插入条数不同结果差别这么大!【java吧】_百度贴吧...
  10. github访问慢解决办法
  11. 微信上如何发送GIF动图
  12. Python量化基础:时间序列的平稳性检验
  13. 101-150的质数
  14. 用spss进行数据的标准化处理_用spss怎样对数据进行标准化
  15. 如何用PowerPoint压缩ppt文件大小
  16. [算法]Fibonacci数列O(n)和O(lgn)的解法
  17. 李福攀:Kata安全容器在蚂蚁集团的应用实践
  18. 西部数据硬盘 篇一:绿盘、红盘、蓝盘、紫盘、黑盘和金盘的区别
  19. svg中元素的层级关系
  20. Maven传递依赖的时候,同名包不同版本的包均会下载,但是编译的时候,只会加载一个高版本的。

热门文章

  1. fib函数用python编写_Python中利用函数装饰器实现备忘功能
  2. Linux监控命令之 top
  3. oracle并发执行max,跪求大量并发执行insert into select语句的方案
  4. vuex的命名空间有哪些_Vuex在vue路由器中访问命名空间模块的getter
  5. 本地音频播放,使用AVFoundation.framework中的AVAudioPlayer来实现
  6. 包r语言_R语言入门之寻找你的R包
  7. layer ajax 用法,layer加载遮罩层使用 Ajax Loading Demo
  8. 学会拒绝别人的6个技巧_多少人败在不懂拒绝上!牢记10个高情商拒绝技巧,人生越来越顺...
  9. tornado框架基础11-tornado异步
  10. CSS导入使用及引用的两种方法