爬虫:SNKRS电商网站应该怎么反爬,反BOT
黄牛抢鞋的过程:
通常黄牛们都会用小程序不停地扫描SNKRS这样的电商网站,通过HTML里面的信息找到目标,比如AJ1,YEEZY等销量高的鞋。然后通过调用API的方式,实现“加入购物车”->“输入地址”->“付款”等步骤。
下图是SNKRS的HTML,里面包含了API和鞋子的基本信息。无论是通过API调用还是headless browser(无头浏览器), 这些信息都是识别的关键。
如何增加黄牛的难度呢?
通过对GitHub上天猫,京东,SNKRS,Adidas等黄牛软件的学习。发现了他们都普遍不具备AI的能力。所以,我们要怎样才能强迫BOTS使用AI,提升他们难度呢?
答案就是:字体混淆
下面图片中圈出来的两个地方,第一个是网页的原文,第二个是相应的HTML。可以发现,‘的’这个字,在HTML里面是一个‘框’,这也是黄牛会爬到的东西。如果电商网站上的商品名称或者尺码信息使用了混淆技术,那么黄牛就没办法知道应该买哪一双鞋了。
黄牛能否突破字体混淆呢?
答案是:能,但是很贵
字体混淆的成本很低,可以通过一些随机方法,生成几千套字体。
但是黄牛要怎么破解这几千套字体呢?
- 人工标注
- OCR
黄牛还有其他方法吗?
答案是:有的,但是一个持续斗智斗勇的过程了
比如:
场景1:
黄牛:通过搜索来锁定目标商品的位置
反黄牛:取消搜索框,比如SNKRS APP就没有搜索框
场景2:
黄牛:通过无头浏览器方式,通过锁定位置方式找到商品,而不是文本识别
反黄牛:商品位置加上随机策略
场景3:
黄牛:通过大量账号尝试,到了付款环节在确定商品是否正确,如果不正确就取消订单
反黄牛:在风控系统中,对这些长期下了订单不付款的账号进行分析,适当扣分或者封号
爬虫:SNKRS电商网站应该怎么反爬,反BOT相关推荐
- python爬虫实例电商_如何用代码爬抓电商数据(附淘宝API调用实例)
原标题:如何用代码爬抓电商数据(附淘宝API调用实例) 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业智能B ...
- 电商网站爬虫案例(1)
从今天开始,将陆陆续续把最近做的二十多家电商平台的爬虫分进行发布 今天日电商网站: https://www.alipearlhair.com/ 一家面向全球的国外假发网站 主页如图 可以看到,这家网站 ...
- 小白学 Python 爬虫:Selenium 获取某大型电商网站商品信息
目标 先介绍下我们本篇文章的目标,如图: 本篇文章计划获取商品的一些基本信息,如名称.商店.价格.是否自营.图片路径等等. 准备 首先要确认自己本地已经安装好了 Selenium 包括 Chrome ...
- 增长黑盒:零代码基础做智能电商网站,不要重复发明轮子
增长黑盒:零代码基础做智能电商网站 Step0,不破不立,走上增长黑客之路 很多卖货的人最大的问题就是整个团队没有一个懂代码的,更不懂电商网站制作.此时贸然出去外包一个电商网站,问题可能会越来越多 ...
- 电商网站的积分要不要年末清零?
咖友提问:电商网站做年底积分清零时要考虑哪些因素? 积分清零到底有没有必要,如果要做,要考虑哪些因素? 来自建君 味库 产品经理的回答 首先,思考一下为什么会有积分体系,了解积分存在的作用和目的.然后 ...
- 电商网站全链路压测实战
1.背景 在电商及互联网应用时代,用户和流量已成为应用核心竞争力,而随着数字化营销逐渐走进各个领域,线上的秒杀抢购.热点营销等活动也成为企业的必备营销手段,营销带来的大规模流量浪涌对系统来说是个巨大的 ...
- 如何快速压测电商网站?
1.背景 在电商及互联网应用时代,用户和流量已成为应用核心竞争力,而随着数字化营销逐渐走进各个领域,线上的秒杀抢购.热点营销等活动也成为企业的必备营销手段,营销带来的大规模流量浪涌对系统来说是个巨大的 ...
- 构建电商网站业务安全系统,防止“薅羊毛”
构建电商网站业务安全系统,防止"薅羊毛" 2020-02-19 新零售安全 场景描述 业务运营活动是电商行业开展业务必不可少的手段,但大流量带来的系统可用性.优惠券带来的" ...
- 设计电商网站必看,如何改善用户体验
电子商务是一个复杂的系统,很多小伙伴在设计电商网站的时候会遇到不少的问题.作为电子商务的典型模式之一,B2C网上零售网站要考虑的因素很多,有时候很多意想不到的因素都可能决定一个用户最终是否在该网站完成 ...
最新文章
- UNDO表空间损坏,爆满,ORA-600[4194]/[4193]错误解决
- python好还是c+-JAVA,Python和C+各有什么特点和优势?
- 汤家凤高等数学基础手写笔记-微分方程
- SAP存货后续调整总结
- 前端技术周刊 2018-09-10:Redux Mobx
- 32通过rs485烧写程序_28027芯片sci程序烧写问题请教
- eclipse查看android源码包(eclipse导入android源码包)
- JavaScript数据类型之Number
- C++标准程序库读书笔记-第二章新的语言特性
- 一些自己使用VS2015的心得
- C# 线程安全的单例模式
- CAD中图形无法复制,使用块插入来合并两个dwg图形
- 【有奖调研】| 参与区块链调研,赢千元大奖!
- 领英工具:如何使用领英精灵在领英上有序归类分组管理客户?
- chapter8 Pull Complexity Downwards
- 将SQL server2019数据库部署在虚拟机上
- 矩阵的entry 和element?
- 电脑卡死、死机、黑屏怎么办?驱动人生教你如何解决
- 安卓以太网共享4G网络方法
- 厘米换算英尺英寸程序_使用C程序计算两个城市之间的距离,从公里到米,厘米,英尺和英寸...
热门文章
- realloc函数的使用
- Problem A: 让动物们叫起来吧!
- 谁能帮我解决这个问题
- 九州云获“边缘计算优秀方案奖”|2021年度边缘计算优秀项目评选揭晓
- PyTorch学习笔记:nn.ReLU——ReLU激活函数
- 2020年,那些令人印象深刻的AI论文
- 高通中国区董事长孟樸:物联网时代进程正在加速
- 从“跑分神器”到数据平台,鲁大师开启演进之路
- 求n的阶乘的算法框图_干货丨Python 递归算法指归-百知教育
- Python:pycharm里面seaborn没有显示画不出来图