针对淘宝反selenium的反反爬措施详讲1-----pyautogui
现在某猫和某宝在反反selenium的道路上越越来恶毒了,大部分是检测webdriver的关键符(网上有很多介绍这里就不一一介绍了)当我们遇到反selenium那该怎么办???????????????下面进入我们的正文!!!!!!!!!!!!!!
pyautogui利器
pyautogui是一个鼠标键盘的一个库,由于它是真实模拟鼠标和键盘事件所以只能开有界面哦!
下面是一些pyautogui的一些基础用法:
获取当前屏幕分辨率
screenWidth, screenHeight = pyautogui.size()
获取当前鼠标位置
currentMouseX, currentMouseY = pyautogui.position()
鼠标移动坐标为100,100位置 绝对移动
pyautogui.moveTo(100, 100)
鼠标左击
pyautogui.click()
鼠标向下移动 相对移动
pyautogui.moveRel(None, 10)
鼠标双击
pyautogui.doubleClick()
用缓动/渐变函数让鼠标2秒后移动到(1000,500)位置
pyautogui.moveTo(1000, 500, duration=2, tween=pyautogui.easeInOutQuad)
在每次输入之间暂停0.25秒
pyautogui.typewrite(‘Hello world!’, interval=0.25)
键盘点击esc
pyautogui.press(‘esc’)
按住shift键
pyautogui.keyDown(‘shift’)
放开shift键
pyautogui.keyUp(‘shift’)
好了!上面介绍了基本用法。我们来介绍一下运用这个pyautogui利器怎么才能让某宝检测不到咱爬虫!!!!
由于淘宝检测淘宝特别严格只要你用selenium打开浏览器就会检测。但是我们发现他检测最厉害的不就是那个滑块那一段吗?那我们为什么不能在它滑块检测的时候不用selenium就可以了啊!!!(哈哈哈我真是太聪明了)说是迟那是快动手撸代码!
由于我们要滑块过去后才运用selenium所以我们打开网页的方法就不能按常理用selenium打开网页了。
我们想到可以利用 Chrome DevTools 协议呀 运用cmd打开浏览器啊
chrome.exe https://login.taobao.com --remote-debugging-port=9222 --user-data-dir=“C:\selenum\AutomationProfile”
(记得提前配置chrome.exe在环境变量中哦)
测试的时候先在cmd中运行这段代码看看能不能打开淘宝网页,如果可以那么恭喜你配置成功啦
接下来我们只需要将这个打开浏览器的步骤用我们的代码来实现
os.system(‘chrome.exe https://login.taobao.com --remote-debugging-port=9222 --user-data-dir=“C:\selenum\AutomationProfile”’)
由于我们不是运用selenium打开的浏览器,我们发现我们没办法运用我们的selenium的操作呀,
为了可以运用selenium的操作,我们需要让selenium去接管我们的浏览器
chrome_options = Options()
chrome_options.add_argument(’–log-level=3’)
chrome_options.add_experimental_option(“debuggerAddress”, “127.0.0.1:9222”)
driver = webdriver.Chrome(options=chrome_options)
恭喜你,你已经用selenium控制这个浏览器了。现在我们就可以用selenium的操作了。淘宝的反反selenium也就迎刃而解了。
(你以为这样就完了???我以为这样就完了。。。正当我开心的爬着的时候突然发现淘宝进行了更新,发现现在滑块不管怎么样滑都是错误失败,接下来我们的利器pyautogui就出场了!!!!)
经过本人的不懈努力发现淘宝在首页不管用selenium的任何操作都会被检测(真的恶心啊),它不要我们用,我们就不用呗。既然selenium代替的是我们鼠标键盘操作,那我们用我们的pyautogui这个来模拟鼠标键盘操作不就可以了吗???(真是天才啊我啊哈哈哈哈)
由于pyautogui是用的绝对定位,所以每次操作都是运用的坐标去点击和拖动
print(pyautogui.position())
我们运用这个代码就可以输出当前点的坐标了,然后我们把我们需要点击和滑动的点坐标都print出来不就可以了吗
pyautogui.typewrite('xxxxxxx')#输入账号pyautogui.typewrite(['enter'])#点击回车pyautogui.typewrite('xxxxxxxx')#输入密码pyautogui.moveTo(1256, 631)#移动鼠标到滑块开头处pyautogui.mouseDown()#按下鼠标pyautogui.moveTo(1670, 800, duration=0.6)#拖动鼠标到滑块结尾处time.sleep(1)pyautogui.mouseUp()#松开鼠标
经过本人测试这种方法适合任何反selenium的网站(能不适合吗?不就是按键精灵吗?说的好高大上 啊哈哈哈)
具体代码就不贴了
有任何问题可以加我 q:1374522338
留言看见也会解答!
下一篇:针对淘宝反selenium的反反爬措施详讲2-----pyppeteer
``
针对淘宝反selenium的反反爬措施详讲1-----pyautogui相关推荐
- 淘宝封杀selenium的ua算法分析
接上一回,我们大致梳理了淘宝封杀selenium的思路,找到核心的参数ua,并抛出疑问:为什么ua每次都不一样,并且随着使用次数次数增加长度越来越长. 关于为什么每次获取的ua参数长度都不一样,有个网 ...
- 【征集需求】准备开发一个针对淘宝卖家的excel模板,实现在Excel上做帐
一个针对淘宝卖家的excel模板,实现在Excel上做帐 请大家把做帐过程中关心的功能补充上来 比如 记录款项来源 模板中提供选项 1支付保 2 工行直接汇款 3招行直接汇款 4 赊帐 等等 [提供有 ...
- 怎么在手机上取消双重认证_用手机在淘宝上怎么开网店?流程步骤详解
这是一篇关于"用手机在淘宝上怎么开网店?流程步骤详解"的文章: 开网店因为门槛低.收益大,成为众多年轻人创业的首选.很多新手朋友们都想开一家属于自己的网店,但是苦于没有经验, ...
- Python爬虫淘宝基于selenium抓取淘宝商品数据2021年测试过滑动验证
配置一下"可能需要修改的参数",就可以食用底部代码了,ps:可能已失效 本文章代码功能 准备工作 Python用到的库和准备工作 可能需要修改的参数 在CMD中打开一个Chrome ...
- (淘宝无限适配)手机端rem布局详解(转载非原创)
从网易与淘宝的font-size思考前端设计稿与工作流 本文结合自己对网易与淘宝移动端首页html元素上的font-size这个属性的思考与学习,讨论html5设计稿尺寸以及前端与设计之间协作流程的问 ...
- (淘宝无限适配)手机端rem布局详解
从网易与淘宝的font-size思考前端设计稿与工作流 本文结合自己对网易与淘宝移动端首页html元素上的font-size这个属性的思考与学习,讨论html5设计稿尺寸以及前端与设计之间协作流程的问 ...
- (淘宝无限适配)手机端rem布局详解(转载非原创) 1
从网易与淘宝的font-size思考前端设计稿与工作流 本文结合自己对网易与淘宝移动端首页html元素上的font-size这个属性的思考与学习,讨论html5设计稿尺寸以及前端与设计之间协作流程的问 ...
- 用py写了个针对淘宝的抢购程序(清空购物车)
使用 适合学python的练手 部分代码参考于他人,优化了部分逻辑 手动扫码,把需要的商品提前放入购物车 缺点 取决于网速,提交订单的时候有可能提示拥挤,抢个药应该没问题,抢茅台做梦 结算到提交订单之 ...
- 淘宝直播h5页面js逆向解析
最近公司需要爬取直播商品的一些数据,其中就有淘宝直播. 分析淘宝直播app 很显然,直接搞难度很大,想到找h5页面,半天没找见:然后搞淘宝直播app,先抓包,请求尝试: import requests ...
最新文章
- vs编译慢原因和解决方法
- 【转】mysql-status和variables区别
- 2017-05-12-Linux文件操作
- Mysql学习总结(23)——MySQL统计函数和分组查询
- linuxeth0路径_linux 驱动 路径(最新更新)网卡驱动路径
- 一些国外学位论文和期刊下载链接
- bzoj 3772 :精神污染 线段树+打标记 or 主席树
- MBR20200CT-ASEMI肖特基二极管MBR20200CT
- U8二开之界面增加按钮处理事件
- 借助HttpCombiner让你的网站加速
- 十五章、KPI(千峰网络安全300课时笔记)
- 智慧城市物联网主要技术路线
- C# 中使用TCP连接设置超时问题
- websocket-PacketCapture乱码包解密
- 数据分析实战:利用python对心脏病数据集进行分析
- 2021中国网络视频市场年度报告(202104).PDF
- java十进制转化为二进制
- LightOJ 1079 Just another Robbery【概率DP】
- 定积分的计算(分部积分法)习题
- sqlmap使用图解