前言:

在使用puppeteer自动爬取知乎上数据的时候,在登录的时候会报错: 10001:请求参数异常,请升级客户端后重试...  相信很多人在爬取知乎数据的时候也会碰到类似的问题,怎么解决呢?

解决方案:

先说说为什么会出现这种情况,知乎其实在对是不是用户活人的判断,是有一定的依据的,记得之前是通过window.navigator.webdriver 这个来判断是不是通过puppeteer来判断的,现在这个版本又换了..  通过user-agent来判断了

上面的截图中我的user-agent是:

user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) awesomeScripts/1.0.0 Chrome/104.0.5112.102 Electron/20.1.1 Safari/537.36

具体是通过哪个判断我也不晓得,但是全部替换肯定没毛病.于是把这段user-agent换成了我正常电脑登陆的user-agent,

  await page.setUserAgent('Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36')

换完之后便可正常登录了.

另外如果想改变window.navigator.webdriver 为undefined只需要在跳转到url之前执行以下代码即可:

await page.evaluateOnNewDocument(() => {Object.defineProperty(navigator, 'webdriver', {get: () => undefined})});

总结:

其实服务端判断当前用户是否是正常的用户,就那么几个方式,最主要的是通过user-agent来判断,未来如果碰到相似的问题,都可以往这方面去靠.

知乎使用爬虫时报10001:请求参数异常,请升级客户端后重试 怎么搞?相关推荐

  1. 订单参数异常,请重新下单后再发起付款(ALIN42273)

    问题描述: 最近支付宝支付时常出现:订单参数异常,请重新下单后再发起付款(ALIN42273),之前产品App都是正常支付,现在用户反馈支付成功率很底,导致很多订单无法支付. 排除问题: 用户手机问题 ...

  2. 爬虫-requests库(二)get请求参数的使用 —搜狗搜索后爬取搜索结果

    之前写过一个用urllib.request 爬取百度搜索后结果的小文章 百度搜索关键词后爬取搜索结果 这次用requests库实现下搜狗搜索后查询,代码 import requests from fa ...

  3. 拦截器获取请求参数post_SpringBoot拦截器如何获取http请求参数

    1.1.获取http请求参数是一种刚需 我想有的小伙伴肯定有过获取http请求的需要,比如想 前置获取参数,统计请求数据 做服务的接口签名校验 敏感接口监控日志 敏感接口防重复提交 等等各式各样的场景 ...

  4. ServletRequest HttpServletRequest 请求方法 获取请求参数 请求转发 请求包含 请求转发与重定向区别 获取请求头字段...

    原文地址:ServletRequest HttpServletRequest 请求方法 获取请求参数 请求转发 请求包含 请求转发与重定向区别 获取请求头字段 ServletRequest 基本概念 ...

  5. springboot接收get和post请求参数

    一.get请求前端传参和后台接收的写法: 1.ajax请求: $.ajax({ url:'/user/login3',//contentType: 'application/json;charset= ...

  6. python网页请求超时_python爬虫多次请求超时的几种重试方法(6种)

    第一种方法 headers = Dict() url = 'https://www.baidu.com' try: proxies = None response = requests.get(url ...

  7. java爬虫---问卷星自动提交问卷请求参数(jqsign,jqnonce等)解密

    以https://www.wjx.cn/jq/35713991.aspx这个问卷页为例 填完问卷打开控制台,转到network并且勾选preserver log(不然等会儿提交的请求看不到),点提交, ...

  8. 详解用Java实现爬虫:HttpClient和Jsoup的介绍及使用(请求方式、请求参数、连接池、解析获取元素)

    一.介绍:何为爬虫 网络爬虫(Web crawler)也叫做网络机器人 可以代替人 自动地在互联网中进行数据信息的采集和整理 是一种按照一定的规则 自动地抓取万维网信息的程序或者脚本 可以自动采集所有 ...

  9. Python爬虫:逆向分析酷我音乐请求参数(支持SQ超品音质)

    文章目录 前言 1. 请求分析 2. 获取参数 3. 完整代码 结束语 前言   免责声明:     本篇博文的初衷是分享自己学习逆向分析时的个人感悟,所涉及的内容仅供学习.交流,请勿将其用于非法用途 ...

最新文章

  1. js中的DOM对象和jQuery对象的比较
  2. 互联网1分钟 | 0110 腾讯联手拳头游戏成立腾竞体育;百度智能云发布中国首款智能边缘计算产品BIE...
  3. 光纤收发器出现死机故障怎么解决
  4. 怎么看准确率_做题粗心马虎怎么训练?采取这三项措施,有效提高做题的准确率...
  5. springmvc重定向到另一个项目_SpringMVC结合Ajax、请求转发重定向、视图解析器
  6. MS SQL 日常维护管理常用脚本(二)
  7. Ubuntu Server Nginx 下配置 mono 下运行 asp.net mvc
  8. Java项目——个人博客系统
  9. 推荐5款精挑细选的软件,大幅提升工作效率,用一次就会爱上
  10. latex中Winedt和Sumatra PDF互联设置及失效解决
  11. 华为太极magisk安装教程_【玩机必会技能】小米手机通用刷TWRP RECOVERY|ROOT|刷第三方ROM教程...
  12. eMule电驴使用从入门到精通
  13. 淘宝开通恶意评价维权通道 客服24小时内处理
  14. 【开箱】B.FRIEND MK3机械式键盘!可换轴换灯,绝美双色金属底座!
  15. protobuf引入不同包下的proto文件
  16. java的class文件批量反编译
  17. 问题解决:配置静态IP
  18. WIN10 + Tensorflow1.12 + Cmake编译 + Bazel编译
  19. vue ie报错:SCRIPT5022: [vuex] vuex requires a Promise polyfill in this browser.
  20. 荣耀magic4.0系统是鸿蒙系统吗,快,不依赖于高刷!荣耀30 Pro+升级Magic UI 4.0后体验...

热门文章

  1. Web3赋能新商业模式
  2. Gartner 2021年云安全技术成熟度曲线中的四项必备技术
  3. 赣南师大计算机科学学院,胡文玉 - 赣南师范大学 - 数学与计算机科学学院
  4. 第一篇博客——Python如何实现一个守护进程来定时每天在十点的时候跑shell脚本
  5. 一分钟为 Fedora 30 / RHEL 8 配置好 Wayland 下的 fcitx 输入法
  6. 佳能Canon PIXMA G4010 一体机驱动
  7. 什么是工作流?为什么程序员要用它?
  8. 激光slam学习笔记1--RTK组合惯导、激光雷达传感器一些经验知识分享
  9. java全网最为优质的技术交流微信群,qq群,工作、交流、学习亦可
  10. python绘制组合图_Python如何绘制组合图 Python绘制组合图代码示例