1.起因:使用selenium爬取某网站,第一次爬取成功了,时隔半个月在执行脚本发现翻页不好使,打开控制台发现几个错误,然后使用默认谷歌浏览器打开就没问题,猜想是反爬虫了。

2.解决方案:

options = webdriver.ChromeOptions()
#使用chrome开发者模式
options.add_argument("--disable-blink-features=AutomationControlled")
#禁用启用Blink运行时的功能
options.add_argument("--disable-blink-features=AutomationControlled")
#Selenium执行cdp命令
driver = webdriver.Chrome(options=options)driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})"""})

按照如上设置再次执行脚本则可以继续访问了。

参考文献:selenium被识别的解决方法_HelloW先生的博客-CSDN博客_selenium爬虫被识别

记录一次反selenium爬虫经历相关推荐

  1. 【复】从0到1的 selenium 爬虫经历

    文章目录 前言 简介与安装 定义 安装 selenium 库 安装浏览器驱动程序 测试 Selenium IDE 实战演练 例一:下载图片 例二:注册登录 代理 透明代理 匿名代理 高级匿名代理 后记 ...

  2. Linux 服务器配置selenium 爬虫

    Linux 服务器配置使用代理 IP 的selenium 爬虫 ​ 在 Linux 服务器运行爬虫有时可以取得奇效,但在 Linux 服务器环境(即无图形化界面)下配置爬虫环境.代理 IP 与常见的 ...

  3. __init__在python中的用法知乎_python使用selenium爬虫知乎的方法示例

    说起爬虫一般想到的情况是,使用 python 中都通过 requests 库获取网页内容,然后通过 beautifulSoup 进行筛选文档中的标签和内容.但是这样有个问题就是,容易被反扒机制所拦住. ...

  4. 反网络爬虫以及解决方案

    做技术的或者是互联网行业的人可能都比较清楚,网络爬虫对于互联网的共享是非常大的,其中有超过一半的流量都是网络爬虫的贡献,如果一个网站不设置发爬虫机制,那就会成为一个透明的研究所一样,所有的信息都会公开 ...

  5. 如何隐藏 Selenium 爬虫?

    点击上方蓝色小字,关注"涛哥聊Python" 重磅干货,第一时间送达 作者 | kingname 来源 | 未闻Code 在昨天的公众号文章<别去送死了,Selenium 爬 ...

  6. python selenium爬虫

    python selenium爬虫 1 前言 博主是一名经管研究生,以自身经历为例.如今大学生写论文大部分都需要数据支撑来论证研究结果,数据除了从数据库直接下载外,有些是需要通过网络爬虫来获得.网络爬 ...

  7. 【selenium爬虫】用selenium自动化爬虫爬取海贼王动漫图片

    以下内容为本人原创,欢迎大家观看学习,禁止用于商业用途,转载请说明出处,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/art ...

  8. python selenium爬虫实例_python使用selenium爬虫知乎的方法示例

    说起爬虫一般想到的情况是,使用 python 中都通过 requests 库获取网页内容,然后通过 beautifulSoup 进行筛选文档中的标签和内容.但是这样有个问题就是,容易被反扒机制所拦住. ...

  9. 针对淘宝反selenium的反反爬措施详讲1-----pyautogui

    现在某猫和某宝在反反selenium的道路上越越来恶毒了,大部分是检测webdriver的关键符(网上有很多介绍这里就不一一介绍了)当我们遇到反selenium那该怎么办??????????????? ...

最新文章

  1. MySQL连接问题【如何解决MySQL连接超时关闭】
  2. [YTU]_1063 (输入三个整数,按由小到大的顺序输出)
  3. 无监督领域迁移及文本表示学习的相关进展
  4. mysql dump 选项_mysqldump的几个主要选项探究
  5. Servlet其他关联类---ServletContext类
  6. 独立站卖家不可缺的推广引流?
  7. wordpress插件列表
  8. java验证码图片工具类_工具类:VerifyCode.java:图片验证码
  9. 在几何画板中如何制作圆柱的侧面展开动画_几何画板制作圆锥侧面展开图课件...
  10. String字符串拼接原理
  11. MySQL Java的JDBC编程
  12. 使用Python与Sharepoint进行交互——第2部分
  13. 微信-点链接进入公众号关注页
  14. 通信频段详解(5G)
  15. 数据与广告系列三十二:重排ReRank,广告推荐算法链路上的背叛者,生态系统格局的重塑者...
  16. 【易语言助手插件】IDE 鼠标手势1.2 原汁原味移植浏览器手势
  17. 时域特征提取_时域分析——无量纲特征值含义一网打尽
  18. 【Linux】设备和磁盘分区|/dev/sda
  19. arduino 定时器、定时中断与PWM使用以及注意事项
  20. ESP8266+DHT11温湿度传感器+小爱同学语音智能LED灯(状态可视化)

热门文章

  1. 固态硬盘win7优化指南:九个Win7固态硬盘优化方法
  2. IDEA 2017.2输入法候选框不跟随光标的问题 Windows 7 旗舰版
  3. 进击的正益工场,2016技术与生态齐头并进
  4. 常见数据结构——完全二叉树(定义、特征、节点个数的判断以及C++简单实现)
  5. 爬取《令人心动的offer2》13万弹幕,看网友是如何评价的
  6. 第六届CUIT校级智能车电磁组竞赛
  7. java 如何读取txt文件并添加换行符
  8. 基本概念--MAE、MSE和RMSE
  9. 集美大学计算机工程学院考研科目,集美大学考研专业目录
  10. 震源机制(Focal Mechanism)之断层基本知识