2019独角兽企业重金招聘Python工程师标准>>>

爬虫风险管理产品是阿里云云盾推出的新安全产品,1月底正式宣布商业化上线,提供可以覆盖Web/H5/API/APP多种业务形态的爬虫风险解决方案,对爬虫风险进行有序管理。

恶意爬虫引发高风险
随着传统行业互联网化及大类业务的数据化,使爬虫风险逐渐成为一个风险爆发点。有网络数据报告统计,目前互联网中超过60%的流量都是批量自动化的爬虫流量。

广义的爬虫并不是仅仅定义为“爬数据”,恶意的黑客利用一些自动化程序“爬虫”来进行业务攻击和欺诈,例如撞库、占座、抢票、刷排名、接口滥用、刷红包等,趋利特征非常明显。常见爬虫主要会集中在类似航空、电商、咨讯、数据、金融、旅行等一些存在高价值数据、原创内容、高获利点的行业中。

恶意爬虫流量往往会引发企业一系列安全问题,并对业务造成一定利益损失,甚至请求量级过大也会同步造成服务器的不可用。

防爬任务困难重重
爬虫中也并不是完全都是恶意爬虫流量,有一部分友好的爬虫,例如搜索引擎爬虫、第三方合作伙伴程序、Robots 协议程序等。安全运维不但要区分出正常人请求和机器爬虫请求,还需要放行友好的爬虫,这会对爬虫识别检测精细度要求较高,并对不同类型的爬虫要有分类和标记。

难点其二在于业务渠道的多样性。行业的互联网化快速发展,尤其是移动端的兴起,一般客户业务中除基础的Web端外,移动端的H5/APP/小程序等也占据较大的业务流量。而爬虫往往攻击的是所有渠道中防护最薄弱及攻击成本最低的业务渠道,会持续在各渠道中切换尝试发现防护短板。如果防护方案比较单一,容易在对抗过程中产品顾此失彼的状态,最终防护失效,仍然造成业务影响。

持续对抗的过程中,爬虫也是会学习进化的,从最初简单自动化脚本会逐步演变成模拟正常用户的访问请求,模拟小区宽带IP,模拟页面浏览停顿操作,模拟正常业务流程路径等等,我们变得越来越难识别恶意爬虫。

难但并不是没有办法。和爬虫的对抗就像一场博弈,我们利用云上生态的优势降低防护成本,提高识别检测的实时性和精准度,逼得爬虫用来伪装的成本高于爬虫的获利时自然会放弃。我们建立独立的检测系统和防护体系,围而不全杀;用AI智能模型识别爬虫,让爬虫难以察觉识别逻辑而减缓变异进度;用人机的验证手段,做第二层的引擎判断,更灵活的对识别结果做处置,进一步减少对正常用户的误报。

爬虫风险如何有序管理
爬虫风险管理产品是一款云盾推出的新安全产品。

产品为SAAS模式,反向代理接入非常轻量和灵活,对七层流量做一次转发,通过云上综合的爬虫防护引擎识别并过滤爬虫流量,帮助客户降低恶意的自动化程序带来的业务影响。干净的业务流量会被继续转发到源站,保证业务正常运行。

产品建设了一整套有层次的爬虫检测模块,主要分为基础防护层、云端情报层、机器学习层,进行信息传递和鉴别,从提供流量上自定义爬虫特征规则工具,到共享云端优势的行业爬虫攻击情报,再到定制贴合客户业务的机器学习算法,逐步递进,快速帮助客户打造一套量身定做的反爬虫策略体系。

产品除了能快速甄别爬虫的行为特征,还可以实现对不同风险等级的爬虫识别结果做不同的处置,合法爬虫做放行,恶意爬虫做阻断,遇到可疑的爬虫去做一个挑战或者校验,多验一次身来做最终判断。

同时,产品内提供了数据可视化模块,从不同维度展示给用户,包括数据和数据之间的关联,让用户参与爬虫特征数据和防护数据之间关系的探索,不断沟通和迭代,不仅清晰地向用户展示爬虫入侵的每一步,也提高了用户反爬虫的策略决策能力。数据模块还集成了阿里云的SLS日志服务,可以查询和定位详细的日志内容,帮助用户了解防护情况和流量细节。

当前产品防护场景主要集中在:

产品优势突出
1、云端部署
云端有技术专家负责产品的规则更新,迅速解决实时风险。
云上资源是可以随时弹性扩容的,针对高峰业务能够自由收缩,帮助客户解决因大促等问题需要扩充机器而带来的成本。
云上的威胁情报资源非常丰富,能够发现针对行业的集中式攻击,并可以将情报应用在行业客户的防御系统中。
2、生态体系
跨多行业的爬虫行为分析,利用关系网络进行恶意爬虫的扩充发现。
爬虫业务目的非常明确,识别行业的集中式攻击,达成行业内共享风险防控。
沉淀网络上黑灰产的百万级已知针对性爬虫风险的IP/UA黑灰产数据。
共享亿级阿里系的设备端的风险情报。

据了解,目前国内外有不少做恶意爬虫流量管理的厂商,侧重点也不尽相同,但阿里云爬虫风险管理产品则是侧重于多层的防护,除了人机识别等检测方式,还会通过行为分析、威胁情报、机器学习算法等方式辅助检测,可以覆盖包括APP在内的各种环境,云上反向代理的方式接入也非常轻量和灵活。

点击了解产品详情
https://www.aliyun.com/product/antibot

点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html

原文链接
更多技术干货 请关注阿里云云栖社区微信号 :yunqiinsight

转载于:https://my.oschina.net/u/3827390/blog/3013032

阿里云爬虫风险管理产品商业化,为云端流量保驾护航相关推荐

  1. 新功能: 阿里云爬虫风险管理利器 - 实时日志分析 (一)

    背景 爬虫形势 Web安全形势一直不容乐观, 根据Globaldots的2018年机器人报告, 爬虫占据Web流量的42%左右. 为什么要反爬 防资源过度消耗 大量的机器人访问网站, 设想你的网站有4 ...

  2. 阿里云弹性高性能计算产品商业化正式发布

    摘要: 来自全国500多家企业申请试用,结合客户的体验需求和反馈意见,不断地改善和打磨,弹性高性能计算商业版有了很大的优化,在产品性能和体验上都有全新的升级. 点此查看原文:http://click. ...

  3. 阿里云AIoT全新工业和农业云端一体机深度产品,全链路数据化实现效率提升

    简介:传统工业,农业如何数智化升级,阿里云工业互联网平台打通了钉钉端,整合一套标准化.轻量化的钉钉数字解决方案,帮助企业实现安全可靠的在线生产经营管控,提升生产效率,助力生产企业降本增效,实现在线管理 ...

  4. 2016阿里云121款产品和解决方案全向图(9月制)

    2016阿里云121款产品和解决方案全向图(9月制) 摘要: 云栖社区在9月底又更新了"2016阿里云产品全向图和解决方案全向图". 导语:DT时代,一切都将走向数据化,可视化.在 ...

  5. 阿里云弹性计算产品负责人:让客户用上本地化的公共云

    简介:5 月 28 日,在 2021 阿里云峰会上 "企业四种架构及部署方案"专场中,阿里云弹性计算产品负责人王志坤,基于云多种部署形态,带来了<企业本地化.低延时.高安全云 ...

  6. 阿里云消息队列Kafka商业化:支持消息无缝迁移到云上

    摘要: 7月25日,阿里云宣布正式推出消息队列Kafka,全面融合开源生态.在兼容Apache生态的基础上,阿里云消息队列Kafka彻底解决了开源产品稳定性不足的痛点,可用性达99.9%,数据可靠性9 ...

  7. 【PBL项目实战】户外智慧农场项目实战系列——1.阿里云物联网平台的开通与云端可视化应用的新建

    岭师人工智能素养教育共同体PBL项目教程系列之1:户外智慧农场项目实战系列 原文链接  https://mp.weixin.qq.com/s/avKWJHNvnPeFsdEXUBByjw 本系列以户外 ...

  8. 阿里云弹性计算产品专家张新涛:元宇宙应用时代的澎湃算力

    2022 年 9 月 2 日,在世界人工智能大会"区块新生 数字宇宙--元宇宙技术与生态合作"分论坛上,阿里云弹性计算产品专家张新涛带来了题为<澎湃算力,同频沉浸>的主 ...

  9. 阿里云思维导图系列(五)阿里云关系型数据库产品全家福

    今天是初五小年,花了一天时间给阿里云关系型数据库产品整理了个思维导图全家福!

最新文章

  1. vmware虚拟机启动centOs黑屏
  2. 2019cvpr oral | 实时自适应立体匹配
  3. 《Groovy极简教程》第12章 Groovy的JSON包
  4. node 微信授权 获取openid
  5. CodeChef Ada Pawns
  6. 早期的增长黑客 PayPal 如何在2000年初达到每日7%到10%的营收成长?
  7. css before after用法_CSS 伪元素基础知识:content 与counter 实用技巧(二)
  8. 开发 Windows 8 Bing地图应用(2)
  9. vue-quill-editor富文本 回显数据样式失效
  10. CSS基本操作详解及截图演示
  11. linux命令 renice,Linux命令之nice和renice
  12. 在线图像识别相似图片_宋源:图像识别传感器在制桶设备上的应用(附视频)...
  13. [译] ASP.NET 生命周期 – ASP.NET 请求生命周期(二)
  14. [Flex] Flex 控件类 的自定义事件添加
  15. 苹果之父乔布斯:我是如何东山再起的
  16. C++ begin( ) cbegin( ) end() cend()区别
  17. 【拉普拉斯变换】3. 拉普拉斯逆变换
  18. 【luogu/字符串】多项式输出(所有情况一起处理)
  19. 电脑眼病和干眼症的相关知识
  20. ONF与天地互连共同成立开放SDN推广中心(OSPC)

热门文章

  1. tomcat下如何才能运行shtml文件?
  2. jQuery最核心的基础设施之一——数据缓存模块进化史
  3. 微软推出 Xbox 漏洞奖励计划,最高奖励2万美元
  4. 手把手教你整合最优雅SSM框架
  5. VR一体机行业调研:用户活跃未达预期,广告收益前景堪忧
  6. 【ExtJs】获取grid选中的records
  7. windows下nodejs开发环境的安装与配置
  8. 常用算法大全-贪婪算法
  9. 看到这个我冷汗直冒,还好不是指我……
  10. windows xp下安装java8(jdk8)-转