“周四从北京飞郑州的机票又抢不到了,火车票也没了。”

无论是过年回家,还是假期探亲,每个人都会遇到类似“一票难求”的问题。为什么每次抢票会这么难?这些机票和火车票是真的没有了吗?随着假期时间的临近,抢票却一直在“加速中”,此时大多数人会开始找黄牛。

而这种结果也正中黄牛的下怀,当我们还挣扎在抢票加速的边缘时,黄牛却可以轻轻松松按照客户们的需求,抢下指定某时间段下的指定航班/车次,并收获一笔笔不菲的佣金。

为何黄牛能够轻松抢票?其实这背后反映出黑产非法盗爬访问和非法占座等恶劣行径。近年来,“提直降代”是民航业开展工作的重中之重,此前国资委要求国航、南航、东航等航空公司将机票直销比例提高至50%。而直销比例的提高,约可大力改善航企营销模式并可助其节省高额分销费用。

但公开数据表明,黑产的非法盗爬访问和非法占座行为却给航空公司直接带来近10亿元的巨额损失。为了深入了解这些巨额损失背后的黑产“抢票”生态体系,数美黑产研究院的小赵(化名)首先瞄准了国内铁路交通业,开始了“入敌侦查”。

为什么你总是抢不到票?

1、上游非法盗爬

7月10日,小方(黑产化名)先在web端破解12306的签名算法,然后注册登录少量账号,进行12306页面内容的非法盗爬和实时监控。主要目的是为了查看北京到郑州的各时段列车是否有票,以及具体的出行时间、列车座位。

“北京到郑州的火车票,12306会在7月13日上午10点放票,小张(黑产化名)记得脚本设置为10点开始抢票。”小赵看到小方在群里发了这样的通知。

2、中游非法占座

小张的设定目标是要抢到1万张票,一个账号平均可以抢到十张票(一个账号可录入10个身份证号),所以小张就会利用1千个账号进行抢票。而黑产最不缺的就是账号、IP、身份证号等个人信息资源。

小张一收到通知,就将昨天通过“讯代理”购买的4千个IP账号和4万个身份证号,分成四个组合(组合A、组合B、组合C、组合D)。每个组合有1千个账号。由于要大批量抢号,小张使用的服务器延迟极低,然后通过打接口的方式来发包,请求访问12306的服务器。

7月13日上午10点,12306准时放票。小张通过组合A抢到1万张票后,不会立即付款,只会非法占座。12306的可支付时间为30分钟,10:30,这1万张票再次返回系统。随后,小张开始用组合B的一千个账号进行二次抢票,重复组合A的占票步骤,依次循环......

3、下游黄牛倒卖

直到有客户小美找上黄牛小王,需要代买一张“10月1日下午3点,北京到郑州的G653次列车,二等座”的票,佣金50元。

小王会登记小美的姓名、身份证号和手机号,然后发送给小张,小张便将小美的个人信息添加到他即将要在11:00抢票的组合C中。

帮助小美抢到票后,11:30小张会继续开始第四波抢票,只要有客户再次上门买票,小张就会将客户的个人信息添加到下一波的抢票账号里。

与此同时,小张也会实时监控页面信息并盗爬。12306发现上午发的票都被抢完了,很多人没有买到票,还在候补。就会定时7月14日上午10点继续放票,而小张会重复7月13日的抢票步骤,在14日上午进行再次操作。

为什么想买一张回家的票这么难?因为现在的抢票不再是拼手速、拼网速的问题了。同一张票,你需要抢过人工智能,很显然,这是不可能的。火车票是这样,机票亦是同理,通过黑产“抢票”的例子看,现在的黑产生态链已经完善优化到令人发指的地步了。

黑产“抢票”惯性套路

通过上文可知,黑产“抢票”拥有完整的上下游供应链。例如上游小方(负责非法盗爬访问、实时监控页面信息)、中游小张(负责大批量抢票、非法占座)、下游小王(兼职黄牛,对接客户赚佣金)。同时,黑产“抢票”拥有自己的“优势”:超低延迟的服务器,以及取之无尽的他人隐私数据资源。

1、火车票黑产作恶逻辑

以火车票为例,数美黑产研究院深入挖掘黑产主要的作恶逻辑,总结为以下几点:

首先,黑产需要在web端破解12306的签名算法;然后利用大量代理IP、批量账号、低延迟的服务器,通过验证码来注册/登录;先登录少量账号监控页面信息,主要查看是否有票,以及出行时间;接着就是发包,请求访问12306的服务端;最后进行大量持续抢票、黄牛开始倒卖。

2、航空公司黑产作恶路径

同样,与火车票的作恶手段类似,以某航空公司为例,数美黑产研究院发现,黑产从事内容盗爬活动,主要目的是借助程序自动化访问航空公司网站以获取需要的信息。

这些爬虫主要查询航司舱位、机票价格信息、航班动态信息等。黑产拿到这些信息后,往往会用于恶意占座、第三方平台的信息展示,甚至进行短信诈骗等违法行为。而航司查定比(查询下单比)高,主要原因也是爬虫。

细分来看,在航旅行业场景下,黑产的业务路径主要集中在通用环节和业务环节两个部分。如下图所示:

显然,黑产在其中的作恶手段就集中在注册、登录、页面信息内容盗爬、营销活动欺诈和批量占座以及黄牛倒卖。同时,这些环节也是航空公司可有力防控黑产的重要途径。

黑产“抢票”异常行为分析

面对黑产在铁路交通/航空公司整个消费生态产业链的无孔不入,以及严重的数据盗爬与非法占座所造成的巨额损失,数美黑产研究院对黑产“抢票”的异常行为路径进行了全面分析。

从黑产作恶路径上看,主要有以下四个方面:

1.黑产在破解12306/航空公司的验证码时,通常采用联众打码和机器学习的方式。而web端的设备指纹异常不稳定,对于是否伪造的辨识度要求较高。

2.黑产用批量代理IP、账号等资源进行登录时,会出现大量IP的强聚集性。

3.由于黑产需要实时监控页面信息、查看票价的相关信息,所以会进行高频的账号请求访问。

4.在黑产开始大量抢票、进行倒卖的时候,会发生IP异常行为、资源离散等违规现象。

因此,对web端采取加固措施,可从“源头”对黑产进行拦截,不断提高黑产的成本。同时采用关联频度策略也可进行高效防控。

应对黑产“抢票”风控策略

对于航空公司而言,基础的风控措施必然可以起到一定的防控目的,但是如何精准识别并强有力打击这类黑产分子最为重要。因此,从技术手段到解决方案的并驾齐驱,服务架构和系统平台的优化迭代更为实用有效。

数美黑产研究院发现,从异常行为的风控策略上看,主要涉及以下几个层面:

1.在解决方案上,依据基础风控规则,为了确保数据安全性,可结合私有云架构来支持。如利用深度学习模型来搭建多种智能网络模型,并利用私有云定期更新黑产图像,从而不断提高和优化黑产异常行为识别率的精准度。

2.在实用价值上,针对特定风控场景,深入挖掘并制定灵活的风险策略。如取消订单团伙挖掘;恶意账号、设备、联系人、乘坐人挖掘;机器时序挖掘;事件缺失团伙挖掘;多实体时间间隔/事件序列/实体时序相似团伙挖掘;航司下单场景策略等。

3.在应用成本上,考虑资源预估与弹性扩容,避免风控管理流程冗余。尽量利用较少服务器来部署Web界面、接入模块、业务逻辑模块、决策引擎、基础引擎、统计引擎、元数据信息等,以此达到资源的充分利用,减少资源浪费。

4.在系统优化上,利用私有化的系统监控,来预防、巡检和预警各类异常风控现象。如主动调用API接口报警,及时同步相关业务人员异常信息的发生;运维人员定期调用并进行系统巡检;直接发现和报警访问量突增等异常行为。

所以综合来看,环环相扣,层层把关的AI在线业务风控解决方案是最有力的防控武器,精准防御和高精度识别技术是最出色的防控手段。

数美科技通过布局全球SaaS风险网络,利用规则引擎,可实时预防行业竞争数据、高价值内容、隐私数据等被盗爬行为。数美科技的天网——全栈式实时智能风控引擎,也可对异常账号进行精准识别和拦截,高效保障航空公司和铁路交通的平台利益,为其在线业务运营保驾护航。

当前,针对非法盗爬和非法占座等问题,数美科技为航旅行业制定了专业AI在线风控解决方案,并和多家大型航空公司达成了深入合作。在未来,数美科技还将继续解锁黑产作恶新行径,不断优化迭代自身技术实力,全方位为客户提供最精准最优质的服务方案。

数美黑产研究院|揭秘黑产非法盗爬访问与非法占座“抢票”行径相关推荐

  1. 首次揭秘!大麦如何应对超大规模高性能选座抢票?

    作者|  阿里文娱技术专家恒磊.高级开发工程师新钱 出品 | AI科技大本营(ID:rgznai100) 背景介绍 随着现场娱乐行业的不断发展,各类演出层出不穷,越来越多的演出开启选座购票满足用 户的 ...

  2. 新零售场景下数美手把手教你 怎么样抵御网络黑产

    自2016年"新零售"提出以来,新零售正以肉眼可见的速度迅猛发展,例如生鲜.便利店.餐饮.电商等平台也涌现出各种各样的互联网零售平台,大批零售企业也在重塑新零售业态. 尤其是生鲜电 ...

  3. 数美科技 | “双十一”全网狂欢,防“黑产”刻不容缓

    距2009年淘宝首创"双十一"至今,已过去了十余年,这场一年一度的购物狂欢,给了全国"剁手党"多年来始终无法抗拒的理由--"价格史低"!优惠 ...

  4. 风控人不能不知的黑产大揭秘

    大数据黑产(以下简称"黑产"),指的是盗取.贩卖个人信息,通过掌握个人信息进行精准非法牟利.在信贷业务中,黑灰产基于非正常的资源/手段(IP.手机号.身份信息等),通过正常的产品流 ...

  5. 数美科技的智能文本审核能为社交行业带来什么价值 | 数美人工智能研究院

    移动互联网打破了传统门户网站的交流屏障,社交软件则架起了信息之间无障碍沟通的桥梁. 根据<2019年社交行业研究报告>显示,目前市面上的社交软件一共有6000多个,包括内容社交.工具社交. ...

  6. 【云周刊】第139期:阿里年会黑科技全揭秘:IoT手环、人脸识别验票、大屏弹幕互动等“十八般武艺”轮番上阵...

    摘要: 阿里年会黑科技全揭秘:IoT手环.人脸识别验票.大屏弹幕互动等"十八般武艺"轮番上阵,2017上半年无监督特征学习研究成果汇总,CDN最全学习教程,量子计算会带来什么样的革 ...

  7. Mob研究院联合明源地产研究院发布《2022年商业地产发展白皮书》

    Mob研究院近日联合明源地产研究院共同发布<2022年商业地产发展白皮书>,报告从行业现状.企业概况.新兴业态和未来展望四个方面对商业地产行业进行了全景扫描,深入分析了由于疫情的影响以及消 ...

  8. 【报告分享】2021年百万经纪人调查报告-58安居客房产研究院 (附下载)

    摘要:进入2021年,日趋完善的行业规则,互联网科技的不断赋能,从业者学历素养的不断提高等众多因素,都在助力经纪从业者提升职业发展信心.线上化找房平台逐渐成为经纪人服务客户的主战场,购房用户对经纪人服 ...

  9. 【报告分享】2021年一季度楼市总结-58安居客房产研究院(附下载)

    摘要:2021年一季度新房月度访问热度上升,购房者信心指数基本呈上涨趋势,3月份达116.0:二手房市场上,一季度找房热度同比上涨23.7%,挂牌均价保持稳定:租房访问热度逐月上涨,一季度重点城市租房 ...

  10. 【报告分享】2021年上半年楼市总结-58安居客房产研究院(附下载)

    摘要:稳定"无疑是下半年楼市最确定的关键词,房价稳定.地价稳定是基础,购房者的预期稳定也在土地两集中的环境下变化更为确定.可以说,一些热点城市整体热度相比上年下半年已经明显降温,并且这种趋势 ...

最新文章

  1. c语言编一个dll 用message box 弹出一个对话框,Qt学习之路(17): Qt标准对话框之QMessageBox...
  2. python mysql绑定变量_python 数据库绑定变量
  3. pb更新oracle表格,PB自定义retrieve刷新函数、PB导入excel表、打印
  4. java 相对路径 文件读取,Java相对路径读取文件
  5. js 图片库 改进版
  6. mysql运行状态监控研究内容_如何监控mysql主从的运行状态shell脚本实例介绍
  7. opencv调试利器ImageWatch的安装使用
  8. 微软开源 TensorFlow-DirectML,为 WSL2 提供 GPU 支持
  9. 人工智能综述性论文_人工智能论文研读:深度学习算法与架构综述(包含详细统计表)...
  10. 企业IT治理样板间首次直播,教您如何打造高效可控的云环境
  11. Bookmarks(2005-4-23)
  12. c语言线性链表的插入,线性链表的创建_插入_删除_操作_C语言
  13. scree VS tmux
  14. Caused by: org.elasticsearch.action.search.SearchPhaseExecutionException报错解决
  15. 扣哒世界发布面向中小学阶段C++信奥课程体系
  16. VR光学设计的关键参数
  17. HTML5期末大作业:中国传统节日网页设计——端午节(9个页面) HTML+CSS+JavaScript 节日网页HTML代码 学生网页课程设计期末作业下载...
  18. Job Shop Schedule 生产调度问题 (一) 简介
  19. 2022危险化学品经营单位主要负责人考试题库及答案
  20. 基于事件的视觉传感器及其应用综述

热门文章

  1. 图书馆系统java实训报告_基于Java的图书馆管理系统的设计实习报告
  2. 阿里云播放器SDK 不断读取播放事件【内部用】
  3. How fast is a C++ extension by the PHP-CPP liberary?
  4. php留言板源码无需数据库,无需数据库的PHP留言板
  5. XDF怎么转换成PDF
  6. 循环冗余校验(CRC,模2运算)
  7. 学生管理系统数据库设计
  8. 学堂在线 python_利用API获取【学堂在线】课堂练习答案
  9. Log4Cpp 使用实例
  10. CSDN直播BlOB视频流下载,JAVA实现下载直播视频