2019独角兽企业重金招聘Python工程师标准>>>

代码

话不多说,直接上代码

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesdef getSource(url):headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8','Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3','User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4882.400 QQBrowser/9.7.13059.400','referer':'http://www.taobao.com'}#使用copy()防止修改原代码定义dictcap = DesiredCapabilities.PHANTOMJS.copy() for key, value in headers.items():cap['phantomjs.page.customHeaders.{}'.format(key)] = value# 不载入图片,爬页面速度会快很多cap["phantomjs.page.settings.loadImages"] = Falsedriver = webdriver.PhantomJS(desired_capabilities=cap)driver.get(encodeUrl(url))

部分博文提到设置User-Agent使用的是这个方法,好像也是可以的:

cap["phantomjs.page.settings.userAgent"] = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36'

检查

访问如下网址,可以回显你请求的数据,用来检查设置的header是否有效:
https://httpbin.org/get?show_env=1

例如我用如上的代码,访问这个地址,后面跟上两个实验参数:
https://httpbin.org/get?show_env=1&q=nihao&bbb=c
网页返回:

转载于:https://my.oschina.net/u/2396236/blog/1790714

Python下Selenium PhantomJs设置header的方法相关推荐

  1. vxWorks6.8 操作系统下 QT 安装设置、运行方法

    vxWorks6.8 操作系统下 QT 安装设置.运行方法 1. 前言 本文详细描述了在 vxworks6.8 操作系统下,如何安装设置 QT 的方法,给出 了详细的过程,图文并茂,并给出了在 vxs ...

  2. [Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论

    前面几篇文章介绍了Selenium.PhantomJS的基础知识及安装过程,这篇文章是一篇应用.通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是 ...

  3. python下selenium模拟浏览器常见操作

    本文主要记录下selenium的常见操作,如定位具体元素的不同方法.在具体元素内循环.提取文本等.具体代码如下: # -*- coding: utf-8 -*- ''' Created on 2019 ...

  4. python使用selenium + PhantomJs搭建的简单漫画爬虫工具

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  5. python中用Selenium驱动Edge浏览器的方法

    当我们需要用到webdriver.Edge(),如果没有安装相应的驱动,就会运行错误,显示: 'edgedriver' executable needs to be in PATH. 这是我们需要来到 ...

  6. python Scrapy Selenium PhantomJS 爬取微博图片

    1,创建项目 scrapy startproject weibo #创建工程 scrapy genspider -t basic weibo.com weibo.com #创建spider 目录结构 ...

  7. python下selenium测试报告整合

    使用过一段时间的Robot Framework测试框架,测试之前需要先搭环境,需要安装的东西很多,这一点个人有些排斥. 每一个测试内容对应一个Test_Case,Robot有自己语法格式,如判断.循环 ...

  8. Python 之selenium+phantomJS斗鱼抓取案例

    from selenium import webdriver from bs4 import BeautifulSoup import timeif __name__ == '__main__':dr ...

  9. 【Python】Selenium多级悬浮菜单定位方法分享

    举例图: 以下菜单选择需逐级鼠标悬浮显示才可选择 注明: """触发步骤:1.定位下拉框触发元素---点击----触发下拉框显示2.悬浮一级选择项,触发一级选择项3.悬浮 ...

最新文章

  1. mysql跨库oracle查询_Oracle如何实现跨库查询
  2. ITK:VTK图像到ITK图像
  3. JAVA生成随机字符串方法
  4. 在Gradle 2.13中更好地处理“在插件Y上找不到属性X”
  5. nuxt.js 配置后端的请求地址
  6. Nagios 使用 NSClient++ 监控Windows Server
  7. 进程+协程 计算操作
  8. block(块元素)、inline(内联元素)的差别是什么?
  9. 启动分区不存在,使用分区工具修正
  10. 深蓝词库转换2.2发布,支持手心输入法和Win10微软拼音
  11. matlab求COPULA偏导,matlab note
  12. pr用什么显卡比较好_用 PR 剪辑视频应该用什么 CPU 和显卡?
  13. SAP 上线 新旧科目映射 辅助核算
  14. 爆料!滴滴或于4-5月开启第二轮裁员,内部员工透露细节:或无赔偿!
  15. apicloud缓存
  16. Unity3D研究院之异步加载游戏场景与异步加载游戏资源进度条(三十一)
  17. PointNet网络结构详细解析
  18. 讲讲简单的电源隔离和信号地,电源地的处理
  19. 软件系统的服务器环境,服务器软件环境操作系统
  20. 内存编址计算题--会一个题能做对一万个题

热门文章

  1. NLP(二十八)多标签文本分类
  2. Android的矩阵(一):ColorMatrix
  3. 【Java基础】四种Java引用类型
  4. (0055)iOS开发之dealloc认识
  5. (0047)iOS开发之nil/Nil/NULL的区别
  6. ubuntu常用指令
  7. struts2 防止表单重复提交--令牌机制
  8. 51nod 1179 最大的最大公约数 (打表计数法)
  9. 关于爬楼梯的lintcode代码
  10. c++纯虚函数在父类中调用的规避