阿里巴巴一直在面向未来探索B类新电商模式,并从2019年开始重点构建“新供给、新链接、新营销”三新体系。买家是三新体系的核心,缺少买家维度的数字化经营体系是不完整的。平台场景目标群体及场景间买家差异性尚不明确,客群矩阵就是为场景中控解决这一业务痛点、提高场货分发效能而专门设置的算法研究主题。同时,客群矩阵也是用户增长和算法特征的核心数据。鉴于客群矩阵如此重要且拥有诸多应用,其构建迫在眉睫。

阿里巴巴意在将客群矩阵打造成平台的一个风向标,以便业务有目标、有层次、有差异、高效地选品和进行场景运营及商家运营,为用户增长和算法模型优化提供动力,为数字化运营提供依据。我们主要围绕4个维度构建,客群矩阵概况如图1所示。

图1 客群矩阵概况

客群矩阵同场景矩阵叠加,在构建场景目标用户、衡量场景差异性的同时,也能提高场景效能,有效引导目标流量,进而为各类业务场景的算法建模提供底层数据基础。

1

采购力

B类买家不像C类买家有明确的年龄、性别等基础坐标维度,B类用户多是企业或者批发商,如何刻画B类特色的客群矩阵,这对于B类电商非常重要,也是B类电商“小二”一直在思考的问题。

既然B类用户群体主要是企业批发商,那么如何准确地描述客群矩阵呢?采购力就是突出的表征,采购力包含采购金额采购频率,从采购力可以看出用户的经营规模和消耗能力。因此,我们将采购力作为基础坐标维度,分层提供精准差异化服务。

采购金额主要是一定周期内用户采购的金额。为了规避不同品类价格差异较大带来的分层干扰,首先分类目对采购金额划档,然后再按照金额档不分类目看,占比最多的金额档就是此用户的采购金额档层。

采购频率是一定周期内用户的采购频次。将用户按照采购时间排序,然后计算用户在一定时间周期内采购的频次。将所有用户按照高斯分布比例划分出高、中、低档,作为采购频率的分层档次。

2

生命周期

包括新装机、新用户、低活、中活、中高活、高活、沉睡、流失等阶段,该生命周期主要是按照用户在电商平台的活跃度来划分的,其中也融入了部分业务知识。例如,新装机用户是指刚装机的用户,新用户是指成交在2单以内的用户,低活是指一个月访问天数在2天以内的用户等。

从交易周期分析用户生命周期,如图2所示,包括新装机激活用户、登录用户、首单用户、活跃买家(高采购力买家、潜力买家)、潜睡买家、深睡买家等阶段,各个生命周期阶段之间的转换关系在图中也有直观呈现。精准化用户运营根据买家生命周期阶段不同而调整目标,所采取的策略也会相应调整。

图2 用户生命周期

了解了用户生命周期,就可以有针对性地做用户拉新、促活、留存,以提高用户黏性:对于新装机新用户,主要是提高他们的用户体验,培养用户的消费习惯,做留存转化;对于中低活用户,主要是促活、留存;对于中高活用户,主要是维持用户的习惯,加强黏性;对于沉睡和流失用户,主要是通过红包权益等方式促活。用户生命周期的维护对于电商持续用户增长发挥着至关重要的作用。

3

核心主营

CBU作为B2B电商平台的典型代表,一直致力于服务全球亿万B类买家用户。用户核实身份与主营类目(如进口母婴店店主、精品女装店店主、微商兼职、小超市店主等)作为B类用户画像最为核心的属性之一,不仅代表着用户的线下实体身份,还直接影响着用户在电商平台上的行为偏好、采购周期及对商家服务能力的诉求等,因此一直是B类电商平台致力于深耕与运营的核心用户画像属性之一。

大多数C类用户画像属性可以直接基于用户在网站上的历史行为进行建模,但B类用户画像则不同。因为要核实用户核身身份以及对主营类目有精准性的要求,一般B类电商平台主要以用户自填表单的形式进行用户核实身份的确定。这种用户自填方式结果准确度较高,但位置隐蔽、链路冗长、没有利益点的引导,不仅用户填写率低,而且与场景结合力不足。

为解决原表单式核身用户操作成本高的问题,阿里巴巴CBU电商平台通过用户核身组件借力算法模型对用户核身进行预测,依据置信度排序,为用户推出Top K个选项供用户点选。整体算法解决方案如下。

3.1

数据源

1)用户站内行为

用户站内行为是用户需求与偏好的第一反馈基地,是算法需要着重去挖掘的数据源。相对其他偏好类画像属性来说,用户核身是一个相对稳定和长期的用户属性,因此在算法应用中,我们选取了用户最近半年的站内全域行为作为底层数据。定义半年的长时间窗口选取主要有两方面考虑:一是目前网站商品丰富、优质,搜索与推荐算法日渐精进,用户浏览各类商品的成本较低,所以B类用户在网站上的注意力难以保持专注,用户B类/C类的需求与行为混杂,数据较脏,较长的时间窗口有利于滤除干扰,捕获用户更为长期和稳定的需求;二是用户行为数据,特别是采购行为,相对稀疏,然而B类用户的采购行为是反映用户核身身份最为核心的特征之一,且用户采购行为又具有一定的周期性,因此长期的时间窗口能够帮助算法更加全面地认识用户。

2)用户站外上下游身份

 

不同于很多偏好类用户画像属性,用户核身身份能够与用户在现实中的身份产生真实的映射关系,如奶茶店店主—喜茶店主、烘焙店店主—宝岛金典店主、精品女装店店主—淘宝女装店店主等。因此,用户站外上下游的身份映射关系,能够辅助我们进一步完善用户核身身份的预测,提高覆盖率准确率

3)行业知识

 

鉴于用户在网站上B类/C类行为混杂,噪声较多,B类用户核身偏好易受网站热门类目与商品的干扰,因此我们也引入了大量行业知识作为指导来协助完成B类用户核身身份的预测,并基于此沉淀下来一份核身偏好类目数据。

3.2

算法方案

利用以上用户站内行为、站外上下游身份和行业知识的数据,算法端可以通过以下几个步骤实现用户核身身份的预测工作,预测流程如图3所示。

图3 用户核身预测流程图

1)种子用户圈选

种子用户主要定义为站内已核身用户及站外上下游有映射关系的核身信息的用户。

2)行业知识指导

我们基于种子用户最近一段时间的站内行为数据,挖掘识别显著性特征,提供给运营同事,对种子用户再进行一轮划拨,把日常核心行为与行业偏好明显不符合的用户排除,优化种子用户的圈选。

3)种子商品圈选

以行业偏好类目作为门槛,筛选出种子用户在门槛下最近半年内采购过的商品作为种子商品。

4)种子商品扩展

基于团队沉淀现有商品的I2I表,利用种子商品作为trigger触发Key,对种子商品进行扩展,扩展种子商品的偏好分等于商品I2I相似分与trigger种子商品偏好分的乘积。

5)用户核身预测

对于一个用户的核身预测,我们选取其最近半年的行为数据进行建模打分。然后基于打好分的用户行为商品计算用户对每一个可能的核身身份的偏好置信度,并用以区分用户的个人采购行为和B类采购行为,降低用户的个人采购行为对预测结果的影响,加大用户的B类采购行为的权重。

本文摘编于《阿里巴巴B2B电商算法实战》经出版商授权发布。

本书是阿里巴巴CBU技术部(1688.com)深耕B2B电商15年的经验总结。阿里巴巴B2B在战略形态上经历了信息平台、交易平台和营销平台的升级迭代,本书聚焦营销平台商业形态背后的算法和技术能力,试图从技术和商业互为驱动的视角阐述技术如何赋能业务,并结合阿里巴巴集团在基础设域和算法创新上的沉淀,打造出智能B2B商业操作系统。

- EOF -

想要加入中生代架构群的小伙伴,请添加群合伙人大白的微信

申请备注(姓名+公司+技术方向)才能通过哦!

好文推荐

蚂蚁研究员玉伯:做一个简单自由有爱的技术人

2020-11-13

腾讯游戏许振文:王者荣耀实时大数据平台黑科技解密

2020-11-12

多隆:从工程师到阿里巴巴合伙人

2020-11-10

58 转转技术总监骆俊武:一个核心系统 3 万多行代码的重构实战篇

2020-11-09

徐昊:运用四色建模法进行领域分析

2020-11-11

中台实践:数据中台构建五步法

2020-11-06

为什么说IT科技公司应该留住35岁员工?

2020-11-05

混沌工程:苏宁系统稳定性之道

2020-11-03

贝壳找房技术总监肖鹏:高速成长下的技术团队怎么带?

2020-11-02

阿里技术专家楚衡:架构制图的工具与方法论

2020-10-30

蚂蚁集团技术专家山丘:性能优化常见压测模型及优缺点

2020-10-28

京东平台研发朱志国:领域驱动设计(DDD)理论启示

2020-10-27

架构专家高磊:缓存为王——无线缓存架构优化

2020-10-22

阿里文娱技术专家战獒: 领域驱动设计详解之What, Why, How?

2020-10-20

工程师的基本功是什么?如何练习?听美团技术大咖怎么说

2020-10-19

监控之美——Prometheus云原生监控

2020-11-14

   END
#架构师必备#点分享点点赞点在看

深度:揭秘阿里巴巴的客群画像相关推荐

  1. 深度丨银行零售客群策略与标签体系搭建指南

    近年来,随着国内经济增速放缓.新冠疫情爆发反复等内外部环境的剧烈影响,国内银行业也在发生着显而易见的变化,整体从高利率时代过渡进入到中低利率时代.与此同时,银行个人客户的数字化程度达到历史新高,在线时 ...

  2. 虚拟机体验NAS私人云全揭秘:深度揭秘虚拟机体验NAS私人云的原由

    "世界在新冠肺炎疫情后将永远改变",对于2020春天在全球蔓延的新冠肺炎疫情,美国前国务卿基辛格做了这样的评价.确实,也改变了我们.春节期间,本着少添乱的原则,响应国家号召,自我隔 ...

  3. 虚拟机体验NAS私人云全揭秘:深度揭秘虚拟机安装群晖DSM6.2/6.2.1/6.2.2/6.2.3系统

    文章目录 一.系统文件下载及工具安装 二.启动硬盘映像文件准备 三.虚拟机文件夹准备 四.创建群晖虚拟机 五.添加数据硬盘 六.启动群晖虚拟机 七.进入群晖虚拟机启动系统 八.虚拟机中安装DSM6.2 ...

  4. 亿级PV超大型网站集群架构图形深度揭秘讲解

    猛戳下面地址观看: 亿级PV超大型网站集群架构图形深度揭秘讲解

  5. 信贷产品年终总结之客群特征画像

    临近年末,围绕信贷产品业务的年终总结,是各家金融机构或科技公司的必要工作内容之一.根据实际业务的数据表现进行汇总分析,不仅为回顾过去业务经营的全貌特点,提供了客观的数据分布描述,而且对后期业务开展的策 ...

  6. 阿里技术分享:深度揭秘阿里数据库技术方案的10年变迁史

    本文原题"阿里数据库十年变迁,那些你不知道的二三事",来自阿里巴巴官方技术公号的分享. 1.引言 第十个双11即将来临之际,阿里技术推出<十年牧码记>系列,邀请参与历年 ...

  7. 深度揭秘:腾讯存储技术发展史

    采访嘉宾 | 腾讯云副总裁谢明等 图源 | 视觉中国 来源 | CSDN(ID:CSDNnews) 在腾讯内部,负责腾讯存储技术研发的部门,一直被认为是生产技术专家的"黄埔军校". ...

  8. 读懂现金贷产品的客群风险标签维度

    互联网领域做客户细分是为了做不同客群的营销,常规上分为有资产的.无资产的:授薪的.自雇的:一线城市用户.非一线城市用户-客群细分分得越细,相关的推荐越需要做得精准,这个内容在营销适用,在金融产品的定价 ...

  9. 2022Q4手机银行新版本聚焦提升客群专属、财富开放平台、智能化能力,活跃用户规模6.91亿人

    易观:2022年第4季度,手机银行APP迭代升级加快,手机银行作为零售银行服务及经营的主阵地,与零售银行业务发展的联系日益紧密.迭代升级一方面可以顺应零售银行发展战略及方向,对手机银行业务布局进行针对 ...

最新文章

  1. sublime text 3 使用过程总结记录
  2. python【Configparser解析配置文件库】Python3中的configparser模块
  3. exception ----- Functions
  4. 【Linux】一步一步学Linux——ssh-add命令(182)
  5. Mysql(三) Mysq慢查询日志
  6. 【 Grey Hack 】记一次被黑经历
  7. Acitivity创建与配置
  8. 使用 EclEmma 进行覆盖测试
  9. pyecharts入门及新冠病毒疫情数据可视化(绘制地理图表)
  10. 迅雷发布了自主研发的TCFS协议,有意转型区块链开发的必看
  11. 宜居指数c语言,城市功能日趋完善宜居指数持续提升
  12. dvbbs 7.1版块图标感应渐变效果 From www.jfeng.cn
  13. [文摘20080908]哈佛大学成功25句
  14. gallery3d 代码分析
  15. 李开复给中国学生的第二封信:从优秀到卓越
  16. [2020.8.3]联想 A5(L18011) Magisk ROOT 纯净无推广 一键刷机 ZUI_3.9.068
  17. 四百元左右有什么降噪耳机推荐?高性价比降噪耳机推荐
  18. 这就是传说中的一行代码一句注释?Python每日一练----种花
  19. 【EmguCV】EmguCV各种调用
  20. 带有详细书签的IT电子书大全

热门文章

  1. dita文档_使用DITADoclet和DITA API专业化生成DITA Java™API参考文档
  2. dita信息开发理论_具有DITA映射域的信息架构设计模式
  3. 游戏 2048 的最佳算法是什么?
  4. C语言 有限状态机
  5. OpenDDS内部关键的idl文件(Federation)
  6. 动漫人物头发的画法教程!
  7. Ubuntu20.04安装RMF组件
  8. linux如何关闭端口
  9. u盘修复计算机w7,怎么用u盘修复系统开启,win7旗舰版!
  10. Tomcat 集群部署