网上大部分用谷歌浏览器获取网页network

这里我用的是microsoft edge浏览器

python selenium+browsermobproxy环境配置

1.安装browsermbproxy

链接:https://github.com/lightbody/browsermob-proxy

2.安装 microsoft edge webdiver

查看浏览器版本

microsoft edge webdiver网址:

https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

不要忘记配置环境变量

这里的selenium要更新到selenium4

支持selenium Tools for Microsoft Edge

https://learn.microsoft.com/en-us/microsoft-edge/webdriver-chromium/#upgrading-from-selenium-3

selenium3一部分被弃用 该网站也有系统的说明

要安装java11

完整代码:

from browsermobproxy import Server
from selenium import webdriver
from selenium.webdriver.edge.options import Options
from msedge.selenium_tools import Edge, EdgeOptions
import time

server = Server(r'C:\browsermob-proxy-2.1.4-bin\browsermob-proxy-2.1.4\bin\browsermob-proxy.bat')#proxy位置
server.start()
proxy = server.create_proxy()

# chrome_options = Options() 模仿谷歌形式
edge_options = EdgeOptions()

edge_options.add_argument('--proxy-server=127.0.0.1:8087')
# edge_options.add_argument('--proxy-server={0}'.format(proxy.proxy))
edge_options.add_argument('--ignore-certificate-errors')
edge_options.add_argument('--disable-gpu')
driver=Edge(executable_path="C:/Program Files (x86)/Microsoft/Edge/Application/msedgedriver1.exe",options=edge_options)#webdiver地址

# # 要访问的地址
base_url = "https://www..com/"#任意地址
proxy.new_har("ht_list2", options={'captureContent': True, 'captureHeaders': True, 'captureBinaryContent': True})

driver.get(base_url)

# 此处最好暂停几秒等待页面加载完成,不然会拿不到结果
time.sleep(3)
result = proxy.har
print(result)

python使用browsermbproxy获取网页xhr(edge浏览器)相关推荐

  1. 利用python模块pandas获取网页表格,并保存为excel

    文章只用于学习交流 利用python模块pandas获取网页表格. 网页上的表格内容,想要保存下来,有没有办法呢?答案是有的. 主要有两个步骤, 一是读取表格内容, 二是保存读取后的内容. 在这里只讲 ...

  2. header python 环境信息_python获取网页header头部信息(python小白学习笔记二)

    方法一:代码查看 通过python获取网页的链接url,返回码,以及相关的信息 #对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 import urllib.request ur ...

  3. Python selenium Browsermob-Proxy获取网页加密请求参数的方法及过程

    一.问题 爬虫在获取页面数据时可能会遇到许多页面异步加载.js加密.动态Cookie等问题,我们在做爬虫开发的时候经常用到浏览器的开发者工具,分析网页元素,查看资源加载(Network)等.Selen ...

  4. 批量采集html软件,在线批量获取网页链接工具 浏览器插件版-♚付涛纪实阁♚

    这两天在弄网站蜜蜂采集的时候,发现原来收藏的一个[在线批量获取网页链接工具]工具对应的网站已经不知道什么原因打不开了:在百度里面通过这个词去一搜索,一初搜索,看到百度结果里面拥有大量的匹配信息,但是经 ...

  5. python使用bs4获取网页排行榜数据(基础版)

    1.首先来到B站排行榜页面,按F12分析结构 2.鼠标放在代码上,一行一行往下移动,不要急,给浏览器一点反应时间. 3.当你发现排行榜所在位置被覆盖了,如下图,证明排行榜的代码就在这里 4.接下来,打 ...

  6. python 使用xpath获取网页标签内容

    获取指定html的标签内容 打开网页的开发者模式,得到路径标签,然后加上/text() 即可得到标签的文本内容//*[@id="sonsyuanwen"]/div[1]/h1 对于 ...

  7. python urlopen 乱码_Python 2.7.3 urllib2.urlopen 获取网页出现乱码解决方案

    出现乱码的原因是,网页服务端有bug,它硬性使用使用某种特定的编码方案,而并没有按照客户端的请求头的编码要求来发送编码. 解决方案:使用chardet来猜测网页编码. 1.去chardet官网下载ch ...

  8. edge浏览器如何设置无痕浏览 无痕浏览网页方法

    首先打开电脑的Microsoft Edge浏览器,开始菜单-所有应用-Microsoft Edge. edge浏览器如何设置无痕浏览 无痕浏览网页方法 打开Microsoft Edge浏览器以后,点击 ...

  9. edge浏览器如何把网页放到桌面_edge浏览器怎么把网页放桌面 - 卡饭网

    win10 Edge浏览器怎么收藏网页到收藏夹并显示出来 win10 Edge浏览器怎么收藏网页到收藏夹并显示出来 win10 Edge浏览器怎么收藏网页到收藏夹并显示出来?自从安装了Win10正式版 ...

最新文章

  1. FlashDevelop flex sdk 报错的奇怪问题
  2. 浮点数正则表达式_正则表达式的邮箱,手机号,身份证号,密码
  3. 使用WatchService监控文件变化
  4. 计算机负数用英语怎么说,负数在计算机中如何表示
  5. 315道Python常见面试题
  6. Linux time ls命令:用户态内核态分别占用多长时间
  7. 蓝桥杯2017初赛-9数算式-dfs
  8. N的阶乘的长度 V2(斯特林近似) 51Nod - 1130
  9. Topshelf创建Windows服务
  10. Maximum sum(poj 2479)
  11. akoj-1153-p次方求和
  12. 分析robin的“seo培训”网站
  13. html5css3背景下雪,HTML5 CSS3下雪奥运五环背景动画特效
  14. 思科交换机常用命令及配置
  15. 论文笔记-《深度卷积神经网络的发展及其在计算机视觉领域的应用》
  16. heeds matlab,Ricardo IGNITE下载-整车性能仿真分析软件Ricardo IGNITE下载v2018.1 最新版-西西软件下载...
  17. MySQL报错Column xxxx in xxxx clause is ambiguous
  18. android 人脸 动画表情包,天呐 原来动画角色的面部表情是这样做出来的
  19. 一个女孩写给女孩的话
  20. mac 和 windows excel 格内换行

热门文章

  1. 计算机卸载软件后网络上不去了,电脑上有无法卸载的软件怎么办?
  2. 虚拟聊天记录生成器,微信对话视频生成器,让微信对话以视频形式呈现!
  3. 视频的格式怎么转换?分享几种好用的视频格式转换方法
  4. 现阶段实践“拿着锤子找钉子”的六个步骤
  5. linux 的中断 命令,linux skill命令参数及用法详解(linux中断进程执行命令)
  6. 雷军布局智能家居 A轮投资丽维家过千万
  7. 硬盘无损分区教程EASEUS分区工具使用
  8. java.io.FileNotFoundException系统找不到指定文件(已解决)
  9. ui设计师要会html和css吗,UI设计师转行成为Web前端工程师需要学什么
  10. SQL语句高级(八)——not like、year函数