今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {

#'authority': 'developer.mozilla.org',

#'pragma': 'no-cache',

#'cache-control': 'no-cache',

#'upgrade-insecure-requests': '1',

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',

#'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',

#'accept-encoding': 'gzip, deflate, br',

#'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',

#'cookie': 你的cookie,

}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?

这里给大家介绍两个:

网站在线转换

Postman

实战演练

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

4,生成代码如下图

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

4,点击 send,模拟网络请求,下方可查看源代码

5,确保源代码正常后,点击 code

6,左上角可以选择编程语言,右上角复制到剪贴板

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

python在线爬虫_Python爬虫偷懒神器!快速一键生成Python爬虫请求头相关推荐

  1. 生成的头_Python爬虫偷懒神器!快速一键生成Python爬虫请求头

    今天介绍个神奇的网站!堪称爬虫偷懒的神器! 我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的: 一般来说,我们只要添加 us ...

  2. gif制作动态图怎么做?教你快速一键生成

    ​​1.gif制作动态图怎么做? 如果你想要制作一个动态gif图像,那么你可以使用一些简单的工具来完成. 首先,你需要准备一些图像,这些图像可以是照片.视频或者任何其他你想要使用的内容.然后,你可以使 ...

  3. python 爬虫 请求网页内容不一致_Python爬虫偷懒神器 — 快速构造请求头!

    点击"Python编程与实战",选择"置顶公众号" 第一时间获取 Python 技术干货! 我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ...

  4. Python爬虫偷懒神器 — 快速构造请求头!

    我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ),一般来说,我们只要添加 user-agent 就能满足绝大部分需求了 但这并不是绝对的,有些请求单单添加一个 user-age ...

  5. 添加请求头 retrofit_Python爬虫偷懒神器 — 快速构造请求头!

    我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ),一般来说,我们只要添加 user-agent 就能满足绝大部分需求了 但这并不是绝对的,有些请求单单添加一个 user-age ...

  6. linux c语 curl代码_偷懒必备工具——一键生成爬虫代码

    我们在构建网络请求的时候,不可避免地要添加请求头(headers),以mdn学习区为例(https://developer.mozilla.org/zh-CN/docs/learn),我们的请求头是这 ...

  7. python excelwriter保存路径_python管理文件神器 os.walk

    点击上方"机器学习与生成对抗网络",关注"星标" 获取有趣.好玩的前沿干货! 来源:诡途 https://blog.csdn.net/qq_35866846/a ...

  8. python setup用法_python之setup.py快速了解和使用

    最近写了个超级简陋的 pypi 源管理工具,学习了一波setup.py文件的撰写 介绍 python开发者们习惯使用 pip 来安装一些第三方模块,这个安装过程之所以简单,是因为模块开发者写好了模块的 ...

  9. python金融编程入门_【量化小讲堂- Python、pandas技巧系列】如何快速上手使用Python进行金融数据分析...

    如何快速上手使用Python进行金融数据分析 引言: 本系列帖子"量化小讲堂",通过实际案例教初学者使用python.pandas进行金融数据处理,希望能对大家有帮助. [必读文章 ...

最新文章

  1. 大型互联网大型分布式架构演进之路
  2. 实现一个网易云音乐的 BottomSheetDialog
  3. SQL alter 的几种用法
  4. JAVA——System.in作为控制台输入时结束输入(输入EOF)解决方案
  5. .NET手记-JS获取Url参数
  6. 虚拟主机TOMCAT配置
  7. C8-2 圆的周长和面积 (100/100 分数)
  8. SQL手工注入入门级笔记(更新中)
  9. Jetson TX2板载相机opencv调用打开
  10. 从零开始学前端:字符串和数组的方法 --- 今天你学习了吗?(JS:Day10)
  11. java输入框1-100_Java开发笔记(一百三十九)JavaFX的输入框
  12. 从矩阵分解到FM的演进、FM如何用于召回和排序以及实现说明
  13. 基本数据类型与引用数据类型
  14. relocation R_X86_64_PC32 against symbol can not be used when making a shared object recompile with
  15. java并发包是谁编写的_0.Java并发包系列开篇
  16. jsp网页视频播放器
  17. 《Linux内核设计与实现》读书笔记(四)- 进程的调度
  18. Docker架构与工作流程
  19. 荷池堪作镜,盈盈可鉴心。(递推
  20. 远程网络教学系统参与者用例图

热门文章

  1. linux运行倩女,在Linux下可用Wine安装和运行新倩女幽魂、迷你世界
  2. 通用feeds组件封装技巧
  3. 2016JavaScript之星
  4. CNN模型预测股票涨跌的始末过程——(一)股票数据的获取
  5. 简单介绍一些关于 Kaggle 比赛的知识
  6. 品赏第一行“Android代码“---Hello World
  7. SSIS中刷新Power BI数据集
  8. PHP接口开发签名验证原理详解
  9. 华为HG522无线路由猫破解开启路由功能
  10. spring注解有哪些