今天介绍个神奇的网站!堪称爬虫偷懒的神器!

我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的:

一般来说,我们只要添加 user-agent 就能满足绝大部分需求了,Python 代码如下:

import requests

headers = {

#'authority': 'developer.mozilla.org',

#'pragma': 'no-cache',

#'cache-control': 'no-cache',

#'upgrade-insecure-requests': '1',

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',

#'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',

#'accept-encoding': 'gzip, deflate, br',

#'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',

#'cookie': 你的cookie,

}

response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些请求,我们要把特定的 headers 参数添加上才能获得正确的网络响应,不知道哪个参数是必要的情况下,就要先把所有参数都添加上,再逐个排除。

但是手动复制粘贴 headers 字典里的每一个键值对太费事了

一个不那么方便的解决方案:

用正则表达式或者直接字符串替换,把 headers 字符串直接转化为字典,封装成函数方便以后反复调用。

有的人喜欢用这种方法,每次复制headers信息,然后调用自己封装好的函数,但我觉得还是挺麻烦的。

那么还有没有快速一键生成 Python 爬虫请求头的方法呢?

这里给大家介绍两个:网站在线转换

Postman

实战演练

网站在线转换

1,Chrome 打开开发者选项( f12 )---> network 选项卡 ---> 刷新页面,获取请求 ---> 找到页面信息对应的请求 (通过请求的名称、后缀和 response 内容来判断)

2,右键,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

3,打开网站,https://curl.trillworks.com/,粘贴 cURL (bash) 到左边 curl command,右边会自动出 Python 代码

4,生成代码如下图

5,print ( response.text ) 就可以直接打印网页源代码啦!

Postman

1,下载 postman ( Chrome 也有个 postman 的插件,操作应该差不多)

2,打开 postman,弹出的界面可以直接关掉

3,import --> paste raw text,在 Chrome 里复制 curl (bash),粘贴到下面的对话框里,点击 import 按钮

4,点击 send,模拟网络请求,下方可查看源代码

5,确保源代码正常后,点击 code

6,左上角可以选择编程语言,右上角复制到剪贴板

大功告成!

其实我本人平时都是用第一种,网站比较稳定,基本没出现过异常;有了这个神器就不用自己再构造请求头了,先一键生成,然后再根据需求调一调就好了,几秒钟就搞定了。

python快速入门神器 知乎_Python爬虫偷懒神器!快速一键生成Python爬虫请求头相关推荐

  1. 生成的头_Python爬虫偷懒神器!快速一键生成Python爬虫请求头

    今天介绍个神奇的网站!堪称爬虫偷懒的神器! 我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的: 一般来说,我们只要添加 us ...

  2. python在线爬虫_Python爬虫偷懒神器!快速一键生成Python爬虫请求头

    今天介绍个神奇的网站!堪称爬虫偷懒的神器! 我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的: 一般来说,我们只要添加 us ...

  3. python如何请求curl_Python爬虫偷懒神器 —— 一键构造请求头!

    今天介绍个神奇的网站!堪称爬虫偷懒的神器! 我们在写爬虫,构建网络请求的时候,不可避免地要添加请求头( headers ),以 mdn 学习区为例,我们的请求头是这样的: Python资源共享群:48 ...

  4. python从入门到精通pdf百度云下载-跟老齐学Python从入门到精通 电子版(pdf格式)...

    跟老齐学python从入门到精通是一款由老齐写作的Python电子书籍.书籍讲述了零基础读者的Python入门教程,内容涵盖了Python的基础知识和初步应用,需要的赶紧在巴士下载站下载吧! 目录: ...

  5. 【Python】【PyQt5实战】【从零开始】 制作一个“一键生成”计算题的GUI程序【自适应全屏】

    [Python][PyQt5实战][从零开始] 制作一个"一键生成"计算题的GUI程序[自适应全屏] 施法前摇 第三方库准备 IDE配置 UI设计 交互设计 打包成exe文件 更多 ...

  6. python 爬虫 请求网页内容不一致_Python爬虫偷懒神器 — 快速构造请求头!

    点击"Python编程与实战",选择"置顶公众号" 第一时间获取 Python 技术干货! 我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ...

  7. Python爬虫偷懒神器 — 快速构造请求头!

    我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ),一般来说,我们只要添加 user-agent 就能满足绝大部分需求了 但这并不是绝对的,有些请求单单添加一个 user-age ...

  8. python和c语言的对比_Python与C语言基础对比(Python快速入门)

    原博文 2019-07-05 09:23 − > 代码较长,建议使用电脑阅读本文. # 10分钟入门Python `本文中使用的是Python3` 如果你曾经学过C语言,阅读此文,相信你能迅速发 ...

  9. 添加请求头 retrofit_Python爬虫偷懒神器 — 快速构造请求头!

    我们在写爬虫构建请求的时候,不可避免地要添加请求头( headers ),一般来说,我们只要添加 user-agent 就能满足绝大部分需求了 但这并不是绝对的,有些请求单单添加一个 user-age ...

  10. python从入门到实践学习笔记_Python编程从入门到实践:学习笔记1(第二章)

    开通博客我用的理由是:读书学习时记笔记,一方面为了回顾,一方面为了督促自己.fighting! 学习Python,我买了Python编程从入门到实践. 我将从第二章开始记录我认为我以后会忘记以及重要的 ...

最新文章

  1. 深入体验c语言项目开发 光盘,深入体验C语言项目开发
  2. 2018深度学习引用数最高的十大论文
  3. 用Navicat连接Oracle数据库时报错ORA-28547:connection to server failed, probable Oracle Net admin error...
  4. matlab 形态学 颗粒_数字图像处理Matlab-形态学图像处理(附代码)
  5. mybatis学习(9):mybatis连接mysql数据库
  6. c语言中日期间的天数怎么计算,关于计算两个日期间天数的代码,大家来看看...
  7. SyntaxError: ‘return‘ outside function 在python里面的报错问题
  8. c语言 socket 断开自动连接,如何优雅地断开TCP连接?
  9. Python可以这样学(第四季:数据分析与科学计算可视化)-董付国-专题视频课程...
  10. jquery 左右移动 以及使用layer.js弹出框呈现在页面上
  11. STM32学习:按键控制LED
  12. 给自定义tabBar的按钮添加点击放大缩小的动画
  13. java调用数据库的基本步骤_java数据库操作基本流程和技巧
  14. mac电脑如何装双系统Linux,苹果电脑双系统怎么装【详细教程分享】
  15. Linux磁盘阵列(RAID0、RAID1、RADI5、 RAID6、RAID1+0)
  16. webrtc QOS方法四(Sender Side BWE)
  17. 华为血压表WATCH D测量血压的数据可靠吗
  18. Royal TSX安装使用
  19. JZOJ 1403.渡河
  20. 关于平面战机射击游戏的一点小结

热门文章

  1. 关于embedding的理解,2020-7-30
  2. Python_基于statsmodel包画Bland altman plot (Mean Difference Plot)用于预测结果分析
  3. 基于line2d算法的模板匹配
  4. arbotix导入出错
  5. Windows10 如何删掉内置的 skype ?
  6. LeetCode 要记得一些小trick
  7. JavaScript实现模糊推荐的input框(类似百度搜索框)
  8. 【转】缺少servlet-api.jar包
  9. 用OpenCV检测图像中的长方形画布或纸张并提取图像内容
  10. cvCloneImage()内存泄漏解决方法, cvCloneImage()和cvCopy()的区别