简介:这是淘特在阿里巴巴参与的第二个双11大促,大促期间累计超过上千万消费者在此买到心仪的商品,数百万家商家因为淘特而变得不同,未来,淘特也将会继续更好的服务于下沉市场,让惠民走近千万家。

2021年11月11日23:59:59,阿里巴巴淘特(淘宝特价版)的第二个双11完美落下帷幕。在双11大促期间,淘特历经多个大促爆发高峰,丰富的权限玩法,各类高性价比货品,大促期间累计超上千万人在淘特买到质美价廉的商品。本次双11大促中,淘特无论是流量、买家还是订单数都创下新的记录,交出了完美答卷,这也意味着,阿里巴巴在下沉市场开始斩露头角。

业务简介与面临的问题

淘特(原淘宝特价版)定位为消费者带来低价且有质量的源头好货,目前仍然处于用户快速增长的阶段,其中三方线上广告投放具有规模效应大,行业成熟度高等特点,是平台用户引流的重要渠道。

在淘特为期30多天的双促期间(双10,双11),市场竞争尤为激烈,渠道投放策略的及时优化调整是保障获量与控本的重要手段。同时针对下沉用户偏好简单的玩法独特区域性货盘的特点,平台需要创新研发各类简单易于理解的营销玩法,和相应的站内流量分发机制,促使更多的用户可以边玩边买。

由于本次大促具有时间长与高爆发两个特点,在这个过程中,我们面临这这么几个问题:

  1. 流量低价获客:线上广告创意规模大,但拉新拉活效果成本参差不齐。但因为不同时间波段流量差异大,如何通过探索式分析,快速定位问题广告或者挖掘新机会,为大促提供持续稳定的高质量流量成为了优化师们进行投放优化的首要问题。
  2. 极简营销玩法:大促新上各类营销玩法,营销玩法的效果需要实时监控。如何实时多维分析,帮助业务进行实现不同场景的不同效果分析,最终反哺业务实现大促交易目标。
  3. 货商高效汰换:货品是电商的核心,超长大促周期下,会场同学需要进行会场货品调优,行业同学需要通过货品类目进行供给调整,还有风控、商家管理等多个角色,均需要通过对单商单品的精准强控。其中如何通过实时聚合排序,及时对低效能货品的汰换,避免流量与转化效率的错配。

解决方案

围绕淘特双10&双11,基于上述在流量投放优化、营销玩法多维分析,品商实时排序等面临的业务问题下,我们构建了一套基于实时数仓Hologres的统一数据服务系统,从流量、玩法、货品全方面监控数据,支持业务在大促期间的精细化运营诉求。

下面分别从三方面内容讲述淘特在这一领域的实践。

优化投放持续低价获客

场景介绍和特点:广告投放场景偏探索分析,具有查询频率中,查询复杂程度高,对延迟容忍度相对较高等特点。分析师需要从一纵一横两个视角进行投放优化,一横即可以从广告创意到广告组、计划、账户、代理、媒体等不同颗粒度。一纵即从展示、点击、消耗的前链路数据到激活、新登、唤端、下单、支付等后链路数据。再叠加时间维度进行分析与优化。

实现方案:考虑到上卷与下钻维度非常多,且查询不固定,无法采用预计算模式,因此我们选择围绕最细颗粒度广告创意进行加工,将各类维度属性冗余成标签,前后链路的效果作为指标,存储在Hologres上,将分析师在投放中心上的优化的查询逻辑转变为基于明细数据的再筛选、聚合、加工的方案。

挑战与优化:探索式灵活分析,复杂查询,对Hologres都会产生较大的性能压力,我们主要考虑了存储优化选择分布列索引优化三种种优化方式。

  1. 在存储方式上,由于外投中心的使用场景是以范围查询、单表聚合为主,所以选用列存的存储方式。
  2. 此外由于分布列将文件组分成不同shard,然后优先在各shard内执行join和group by操作,所以选用了常用的关联键和聚合维度account_id, campaign_id, adgroup_id, agent, creative_id。
  3. 在索引优化上,根据不同索引方式我们选用了不同的字段作为key来优化查询速度。首先是选用了creative_id作为聚簇列,适用于范围查询和筛选所用字段。使用比特编码索引在聚簇后进一步进行文件内位图索引,适用于等值查询条件,所以选择了creative_id, account_id, campaign_id, adgroup_id, agent等常用于等值查询的字段。最后是分段键,该索引是用于标识文件边界,常用的是非空时间戳,这里我们选择用的是stat_date。

通过上述系列优化使得最终98%以上的通过投放平台过来的探索式分析查询可以在3s内完成。

业务收益:该数据产品在目标三方广告投放运营、产品中覆盖度100%,运营通过该平台快速高效的定位并解决包括异常掉量、消耗过高等问题计划数日均几十+,使得投放侧的优化效率整体提升50%以上。同时还帮助运营能够快速的找到增量价值渠道等。

权益玩法促用户成交转化

场景介绍和特点:营销玩法投放在包含新人、互动、裂变等不同的场域中,玩法的引导效果还与货盘强相关,交叉模式以及看数用数指标相对固定,且相对比较高频。

实现方案:我们在实时计算Blink中通过直接产出CUBE表,写入Hologres中,基于该CUBE表搭建数据报表。

业务收益:大促期间通过效果数据针对玩法进行了10+优化,如通过玩法X场域,为跨店满减会场新增购物车入口,快速满足用户的凑单需求;官方补贴的氛围链路透传提升转化率等,帮助行业顺利完成目标。

商品商家汰换高效分发流量

场景介绍与特点:运营小二为了能够在大促期间对商品与商家进行监控与汰换,就需要有细颗粒的查询监控,同时由于商品会关注在活动中的各个会场的特色指标表现,且部分活动存在跨多天的情况,所以多日累积的数据也是运营决策的重要参考。

实现方案:我们选择在实时计算Blink引擎中,完成对最细颗粒度的商品-人的计算,并将相关活动指标打横,写入Hologres。在报表层,根据运营的筛选条件进行跨天的汇总到商品、商家粒度的聚合排序。单个分区日志数据商品-人达到了2亿左右数据规模,通过索引、分布列等的优化基本可以满足单表的各类查询。

挑战与优化:实时离线的数据存在一定GAP,在多日的周期下,差异累积放大,导致影响业务的决策判断,另一方面大促期间人力开发资源紧张,如果用离线数据进行覆盖,成本额外增加一倍。在此背景下,引入了流批一体的技术方案,使用Hologres进行统一存储与计算,并且通过Blink Batch实现了实时离线共用同一套代码,计算逻辑统一,大幅度降低了重复开发与后续运维成本。

业务收益:品/商多维度实时排行覆盖行业运营、会场运营小二,通过选品汰换在几百家会场帮助消费者买到心仪商品,并针对挖掘出的潜力商家,及时的给予流量扶持,整体大促期间超过几百万商家完成动销。

业务总结

这是实时数仓Hologres首次走进淘特的双11大促,在大促期间,Hologers在流量洪峰的压力下,以99.8%响应支撑力多个促销活动的顺利开展。数据同学只需要加工最明细数据,便能通过Hologres构建灵活多维的查询应用,整体的研发效率提升在40%以上(单场景平均5人日下降至3人日),同时部分原本需要由在线Blink作业的数据计算,转变为了查询时再计算的模式,整体计算资源预计有20%左右的减少

这是淘特在阿里巴巴参与的第二个双11大促,大促期间累计超过上千万消费者在此买到心仪的商品,数百万家商家因为淘特而变得不同,未来,淘特也将会继续更好的服务于下沉市场,让惠民走近千万家。

原文链接
本文为阿里云原创内容,未经允许不得转载。

实时数仓Hologres首次走进阿里淘特双11相关推荐

  1. CCO x Hologres:实时数仓高可用架构再次升级,双11大规模落地

    简介:本文将会介绍今年是如何在去年基础上进行实时数仓高可用架构升级,并成功大规模落地双11. 作者 | 梅酱 来源 | 阿里技术公众号 一 2021年双11总结 2021年阿里巴巴双11期间,由CCO ...

  2. 实时数仓Hologres 新一代弹性计算组实例技术揭秘

    随着实时数仓在业务生产系统的普及,资源弹性.资源隔离等保障业务稳定性方面的技术需求开始变得越来越迫切.Hologres在保障业务方面持续优化核心技术竞争力,过去一年中,Hologres创新提出并实现了 ...

  3. 技术分享:从双11看实时数仓Hologres高可用设计与实践

    简介:本文将会从阿里巴巴双11场景出发,分析实时数仓面临的高可用挑战以及针对性设计. 2021年阿里巴巴双11完美落下为帷幕,对消费者来说是一场购物盛宴,对背后的业务支撑技术人来说,更是一场年度大考. ...

  4. 从双11看实时数仓Hologres高可用设计与实践

    2021年阿里巴巴双11完美落下为帷幕,对消费者来说是一场购物盛宴,对背后的业务支撑技术人来说,更是一场年度大考.在这场大考中,一站式实时数仓Hologres以每秒11.2亿条的高速写入,和每秒1.1 ...

  5. 从零开始,带你玩转一站式实时数仓Hologres

    简介:本次系列直播课程,将会从零开始带您玩转一站式实时数仓Hologres,让您从入门到精通. 在大数据领域,Hologres一直以其超牛的功能.超高的性能,低成本的运维等优势广受好评,但是随着越来越 ...

  6. 阿里专家20讲,玩转一站式实时数仓Hologres训练营(限量免费)

    大数据文摘出品 随着企业数字化转型进程的加速,实时数仓技术开始逐渐从幕后走到台前,支撑更多的生产应用,高可靠和低延时地数据服务成为企业数字化转型的关键.掌握实时数仓的建设能力,也正成为每一位技术人必不 ...

  7. 开放下载!《阿里云实时数仓Hologres最佳实践合集》

    简介:<阿里云原生实时数仓Hologres最佳实践合集>电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践. 点击免费下载 <阿里云实时数仓Holog ...

  8. DataFunTalk:阿里建设一站式实时数仓的经验分享

    导读:大数据计算正从规模化走向实时化,实时大数据建设过程中开始面临很多的痛点和问题.本文内容整理于阿里资深技术专家姜伟华在DataFunTalk上的演讲,为大家介绍阿里巴巴基于一站式实时数仓Holog ...

  9. 从阿里核心场景看实时数仓的发展趋势

    简介:随着2021年双11的完美落幕,实时数仓技术在阿里双11场景也经历了多年的实践和发展.从早期的基于不同作业的烟囱式开发,到基于领域分层建模的数仓引入,再到分析服务一体化的新型融合式一站式架构,开 ...

最新文章

  1. 2.对于所有对象都通用的方法_EJ
  2. Excel 计算时间差
  3. php时间类函数吗,关于PHP 内置时间类函数的一个小问题
  4. 精致全景图 | 程序是如何运行起来的
  5. 帮助你生成响应式布局的CSS模板 - xyCSS
  6. Win7下搭建外网环境的SVN服务器
  7. 编程题【Math类】计算类
  8. sed 解释正则表达式
  9. ORACLE SQL总结六:管理方案对象
  10. JavaSelenium处理页面Table以及Table中随机位置的数据
  11. python mysql删除数据_Python MySQL-删除数据
  12. mysql安装包提示选项_Windows操作系统安装MySQL解压版
  13. 0/1背包总结(持续更新...)
  14. 从零基础入门Tensorflow2.0 ----六、29keras_generator读取 kaggle 10 monkeys数据
  15. 【转】用户空间编写驱动程序
  16. LibXML2不支持中文补遗
  17. 禁忌搜索算法(现代优化计算方法)
  18. Code For Better 谷歌开发者之声——Flutter - Google 开源的移动 UI 框架
  19. python设置excel套打_你不一定知道这个用 Python 快速设置 Excel 表格边框的技巧
  20. 口诀计算机,PID算法的通俗讲解及调节口诀[计算机类]

热门文章

  1. MyEclipse的自动补全功能:输入@或者.没提示
  2. mac 爱普生打印机驱动_高效打印企业首选 爱普生M2178黑白多功能一体机评测
  3. javabean连接mysql数据库,jsp+javabean 链接 mysql 数据库
  4. Java 反射机制和动态代理是基于什么原理,了解过吗?
  5. python文件对象是可以迭代的_详解python可迭代对象、迭代器和生成器
  6. 【LeetCode笔记】117.填充每个节点的下一个右侧节点指针 II(二叉树、DFS)
  7. 小黑框如何连接mysql_珍藏版(cmd小黑框)数据库命令及操作
  8. python车牌识别系统开源代码_天津谁做车牌识别系统供应商,伸缩栅栏门_郑州荣锋科技有限公司...
  9. mysqlclient==1.3.7对应mysql版本_「MySQL」CentOs 7 下安装MySQL
  10. ivew 的ajax,iView-Upload组件分析