在使用requests爬取网页代码的时候,通常要设置浏览器头部才能获取到正确的网页代码,在这里分享常用的浏览器头部,及浏览器头部的设置方式。

import random
user_agent = [ "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)", "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; Acoo Browser; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)", "Mozilla/4.0 (compatible; MSIE 7.0; AOL 9.5; AOLBuild 4337.35; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)", "Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US)", "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)", "Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 1.0.3705; .NET CLR 1.1.4322)", "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.04506.30)", "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/523.15 (KHTML, like Gecko, Safari/419.3) Arora/0.3 (Change: 287 c9dfb30)", "Mozilla/5.0 (X11; U; Linux; en-US) AppleWebKit/527+ (KHTML, like Gecko, Safari/419.3) Arora/0.6", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2pre) Gecko/20070215 K-Ninja/2.1.1", "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9) Gecko/20080705 Firefox/3.0 Kapiko/3.0", "Mozilla/5.0 (X11; Linux i686; U;) Gecko/20070322 Kazehakase/0.4.5", "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.8) Gecko Fedora/1.9.0.8-1.fc10 Kazehakase/0.5.6", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/535.20 (KHTML, like Gecko) Chrome/19.0.1036.7 Safari/535.20", "Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; fr) Presto/2.9.168 Version/11.52"
] HEADER = {
'User-Agent': random.choice(user_agent),  # 浏览器头部
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', # 客户端能够接收的内容类型
'Accept-Language': 'en-US,en;q=0.5', # 浏览器可接受的语言
'Connection': 'keep-alive', # 表示是否需要持久连接
} 

转载自:https://www.aliyun.com/jiaocheng/441444.html

Python requests常用的浏览器头部相关推荐

  1. python批量请求url_使用Python Requests伪装成浏览器请求百度360获取关键词批量排名...

    使用Python Requests伪装成浏览器请求百度360获取关键词批量排名 #!/usr/local/python/bin/python3.7 import requests,re,time,ra ...

  2. python requests 重定向_认识Python最最最常用语重要的库Requests

    Requests库是Python爬虫中最最最最最最重要与常见的库,一定要熟练掌握它.下面我们来认识这个库 Requests requests是Python最为常用的http请求库,也是极其简单的.使用 ...

  3. python requests模块_Python 爬虫教程 requests 模块

    经过 前边文章<简单Python爬虫教程 (一)>.简单Python爬虫教程 (二)两篇文章的学习,能写一些比较简单的爬虫了,但是还不够,这一篇文章主要介绍Requests模块,reque ...

  4. python+requests接口测试

    第一章 HTTP网络协议 在接口的测试过程中,所有的数据交互都是基于网络协议来进行交互的.目前业内最为主流的是HTTP网络协议.占据有90%左右比例 在系统的交互过程中,HTTP网络协议是如何实现交互 ...

  5. python requests是什么_python requests库学习

    Requests python的request库官方介绍就是让HTTP服务人类,所以从这点我们就可以知道request库是为了让我们更加方便的进行http相关的各种操作 我们学习request有什么用 ...

  6. python爬虫 - python requests网络请求简洁之道

    转自:python爬虫 - python requests网络请求简洁之道 requests简介 requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到 ...

  7. 刚安装的python如何使用-Python requests的安装与简单运用

    强烈推荐!requests官方文档已有了中文版,请见http://cn.python-requests.org/zh_CN/latest/ . requests是python的一个HTTP客户端库,跟 ...

  8. python requests的安装与简单运用

    强烈推荐!requests官方文档已有了中文版,请见http://cn.python-requests.org/en/latest/. requests是python的一个HTTP客户端库,跟urll ...

  9. 数据采集与清洗基础习题(二)Python爬虫常用模块,头歌参考答案

    数据采集习题参考答案,会持续更新,点个关注防丢失.为了方便查找,已按照头歌重新排版,朋友们按照头歌所属门类查找实训哦,该篇为Python爬虫常用模块. 创作不易,一键三连给博主一个支持呗. 文章目录 ...

  10. python+requests对app和微信小程序进行接口测试

    对于web端和app端的接口测试来说,他们都是通过请求方法,url和传递的body参数进行接口请求,区别web和app的区别就是header请求的不同.不同的地方在于header中的User-Agen ...

最新文章

  1. .Net转Java自学之路—基础巩固篇十八(正则)
  2. 十年Java编程开发生涯,java计算时间差毫秒
  3. 计算机组装策划案,产品策划书格式
  4. 中消协:视频平台不应向VIP老会员收取超前点播费
  5. 《SQL高级应用和数据仓库基础(MySQL版)》学习笔记 ·011【视图和索引】
  6. 拉勾数据分析岗数据分析报告
  7. 一种解决常见的80/443端口被占用导致steamcommunity 302服务无法启动的方法
  8. ERP项目组成员及各项目组职责
  9. 【深度学习】视频分类技术整理
  10. 专访陈星汉:“游戏禅师” 的自我苛刻与孤独
  11. 数据库sql对象名无效问题
  12. ASP+ACCESS注入—主要靠猜实现
  13. 键鼠共享工具Barrier--实现linux与windows不同系统间的键鼠共享
  14. 吉时利Keithley软件2600系列2601B|2602B|2604B|2606B NS-SourceMeter源表软件
  15. 一个天气App案例(一)
  16. 腾讯视频自动签到详细版(多种方式得V值)
  17. Could not get JDBC Connection排查
  18. (摘自百度百科)石油输出国组织-欧派克(伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉)介绍...
  19. Windows命令提示符之常见命令
  20. 回溯方法解决数独问题

热门文章

  1. 联想微型计算机7360,我的电脑是联想启天M7360台式品牌机,想升级CPU,请问可以换什么CPU?...
  2. 使用NRF52xx sniffer抓取BLE包
  3. python 模拟触屏_python一次简单游戏辅助的经历(截取屏幕模拟键盘)
  4. robotium测试
  5. Eclipse 快捷键
  6. 自动升级系统的设计与实现(源码)
  7. Ubuntu下编译vtk(java版本)【超详细-带过程截图】
  8. Hook技术(1):Hook技术简介
  9. c语言英文背单词软件下载,英语百词斩下载,背单词最好的软件排名?
  10. ps抠图神器:Topaz ReMask 5 for Mac