本文作者:子玺

袋鼠云数据中台解决方案专家。拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理。曾服务过国家工商总局、北京市工商局、北京市财政局、广州开发区大数据局、平湖人社局、海盐人社局等行政单位,担任多个大型数据项目的数据应用咨询顾问/项目经理。

正文:

一、什么是用户画像?什么是标签?

当我们从互联网时代逐渐步入大数据时代后,企业及消费者行为不可避免地要面临一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是「可视化」的,然而,「似乎」并不等于「一定」。海量数据赋予企业的不一定都是可用信息「如何能够让企业在排山倒海般的数据海洋里更清晰、更快速地感知电脑那一端具体某类用户的喜好,从而为做精准营销服务」一直以来都被热切讨论,其中最行之有效的方式就是基于行为大数据构建清晰的「用户画像」。

用户画像(User Profile)

是对现实世界中「用户」的数学建模,它能够完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了精准营销的基础。之所以说用户画像是一种模型,是因为它是通过分析挖掘用户尽可能多的数据信息得到的,它从数据中来,但对数据做过了抽象,做过概念泛化,比数据要高,后面所有用户画像的内容都是基于这个展开的。比如「游戏宅」,这个肯定是挖掘分析出来的,不是说原来的数据中包含游戏宅这个属性。

标签(Tag)

则是某一种用户特征的符号表示,是我们观察、认识和描述用户的一个角度,例如刚刚的「游戏宅」,其实就是一个用户生活习惯的侧面标签。标签和用户画像的关系是整体和局部的关系,而这种关系则通过「标签体系」体现。

二、袋鼠云标签体系建设方法论

我们刚刚说到,用户画像其实就是标签的集合,那么如何构建这个集合呢?

经过多个项目的经验沉淀,袋鼠云整理了标签体系建设的四字箴言,那就是:「 建、用、优、精 」。我们说,罗马不是一天建成的,同样标签体系建设是个体系化的工作,需要不断的用业务来滋养,初步建立后,通过业务方的使用及反馈,不断优化它,并最终沉淀、精炼出一套适合企业自身发展诉求的标签体系。

下面,我们以典型互联网电商平台用户标签体系的构建过程为例来帮助大家理解。

在电商这个场景下,我们构建用户标签体系主要根据用户在历史时间内的网购行为记录,从网购时间点、内容深度剖析,针对用户的基础属性、社交行为、互动行为、消费行为、偏好习惯、财富属性、信用属性和地理属性等八大维度构建用户标签体系,以期综合描绘平台消费者的行为特征。

建设的过程分为六个基本步骤:

  1. 首先以业务视角梳理规划整个标签体系的架构,即上面所说的八个维度

  2. 无规矩不成方圆,在进行实际开发之前,我们要定义包括数据(指标)规范、模型设计规范、ETL规范在内的规范体系。前文也讲过,这个规范体系可以借助数栈产品帮助建立和执行

  3. 将分散在各个系统/应用的数据同步到大数据开发平台之上,包括结构化的业务数据、埋点采集的行为日志数据等

  4. 核心围绕“用户”,以唯一标识打通来自不同平台、系统、渠道的数据,基于OneData体系依次构建全域数据中心、萃取数据中心

  5. 在萃取数据中心基础上,进行各类标签的研发,例如事实类标签(性别、年龄段等)、业务类标签(钻石会员、普通会员等)、统计类标签(近90天下单金额等)、算法类标签(重要保持客户、高忠诚度客户等)

  6. 标签/画像投入应用,或对接至下游业务系统,产生业务价值。与此同时监控各类标签的使用与效果,统计出热门标签,替换掉不合理的标签,调整业务算法和规则,添加新的标签等,来进一步推动标签体系的梳理规划,逐步沉淀一套精华版标签集合

这其中,除了业务的输入以及数据的支撑外,要想快速建立一套科学的标签体系,还需要丰富的技术经验以及智能的工具或平台来提供助力,而袋鼠云则专注于为企业提供专业的数据技术服务及智能的大数据开发平台,有能力帮助企业最大限度地缩短“读懂用户“这个目标的实现过程。

三、小结

最后再对前面讲的内容进行一个小结,在大数据时代,机器要学会从比特流中解读用户,构建用户画像尤其重要,是上层各种数据应用的基础,也就是袋鼠云数据中台专栏下一期要讲的数据应用的内容。

构建用户画像的核心是进行标签体系建设,合理的标签体系不是一次性工程,它需要不断地被业务滋养。为此,袋鼠云总结了标签体系建设的四字经验:建、用、优、精。

最后,袋鼠云拥有丰富的企业数据项目落地经验,有能力帮助企业构建科学合理的标签体系,为企业数据价值最大化提供助力。

转载于:https://my.oschina.net/u/3869098/blog/1925930

袋鼠云数据中台专栏(七):用户标签体系建设的四字箴言相关推荐

  1. 袋鼠云数据中台专栏(一) :浅析数据中台策略与建设实践

    袋鼠云数据中台专栏(一) :浅析数据中台策略与建设实践 https://yq.aliyun.com/articles/604571?spm=a2c4e.11153940.0.0.22e27e09zv9 ...

  2. 袋鼠云数据中台专栏(五):数栈,企业级一站式数据中台PaaS

    本文作者:江枫 袋鼠云CTO,花名江枫,本名宁海元. 2007年加入淘宝,曾是双十一大促技术指挥部成员,"去IOE"数据库负责人. 打造过千亿级实时日志平台.手机淘宝日志分析创始人 ...

  3. 袋鼠云数据中台专栏2.0 | 数据中台之数据源

    关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型?袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量 ...

  4. 袋鼠云的mysql_袋鼠云数据中台专栏2.0 | 数据中台之数据集成

    关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型?袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量 ...

  5. 袋鼠云 oracle,袋鼠云数据中台专栏2.0 | 数据中台之数据集成

    关于袋鼠云数据中台专栏V2.0 数据中台如何定义?企业数据化与数据中台的关系是什么?数据中台如何支撑企业战略转型?袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大量 ...

  6. 袋鼠云数据中台专栏2.0 | 企业数字化(数据界面)整体架构

    袋鼠云数据中台专栏V2.0 数据中台如何定义? 企业数据化与数据中台的关系是什么? 数据中台如何支撑企业战略转型? 袋鼠云近两年来,先后为国内数十家大型龙头企业提供数据中台咨询与实施落地服务,积累了大 ...

  7. 袋鼠云数据中台专栏(六):企业数据指标的那些事儿

    本文作者:子玺 袋鼠云数据中台解决方案专家.拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理.曾服务过国家工商总局.北京市工商局.北京市财政局.广州开发区大数据局 ...

  8. 数据中台为什么要建标签体系,分类它不香吗?

    数据中台为什么要建标签体系,分类它不香吗? 在众多的数据中台的解决方案中,一个叫做"标签中心"或"标签体系"的应用,几乎成了数据中台的"标配" ...

  9. 数据中台-架构、构建与体系建设

    数据中台-架构.构建与体系建设 数据中台架构 数据中台构建方法论 技术体系 数据体系 服务体系 运营体系 数据中台功能架构 数据中台技术架构 企业构建数据中台评估 统计分析阶段 决策支持阶段 数据驱动 ...

最新文章

  1. ssh 用密码连接不上、查看openSSH 的版本、CentOS - 升级openSSH,修复安全漏洞
  2. ue4 改变枢轴位置_UE4渲染模块概述(四)---反射
  3. python通过tkinter和json界面库实现考研知识点统计
  4. 虚拟时代将至:环绕计算才是未来
  5. JAMstack简介:现代Web的体系结构
  6. mysql过滤效率和java过滤效率_熔喷布过滤效率测试仪详解
  7. 使用Python编写打字训练小程序
  8. github进不去_app.gitbook.com进不去,一直卡着怎么回事
  9. linux c语言ide,linux下用过的c++IDE
  10. altair edem2021仿真模拟软件
  11. 如何找到WIN10自带桌面背景图,看这里就够了,系统自带背景图怎么找到存放在哪里
  12. 高仿滴滴打车 android,仿滴滴出行页面Demo
  13. docker daemon调试
  14. 网页报错:You don't have permission to access
  15. 深度学习资料链接整理(囊括ML,DL,CV团队,网站,优秀博客,实验室等大堆资料集)
  16. 【Python零基础快速入门系列 | 07】浪漫的数据容器:成双成对之字典
  17. Book Collector for Mac(图书信息管理软件)
  18. 《计量经济学》复习重点(敲黑板~)
  19. 硬件描述语言基本知识
  20. 全球城市数据库 mysql_获取全球国家和城市列表

热门文章

  1. HTTP协议之防盗链与反防盗链
  2. 。。。。AC米兰夺冠
  3. 晓庄学院计算机音乐,南京晓庄学院音乐学院新媒体时代高校音乐课程的改革与创新...
  4. 低延迟长续航手游伴侣—HyperX Cloud Buds云雀蓝牙无线游戏耳机
  5. redis进阶持久化、事务、主从复制、集群高可用
  6. layer.alert文字换行
  7. 潍坊刘洁新东方计算机学校,美本申请,最强访校攻略来了
  8. 这有个小程序,渣男了解一下
  9. SQL注入相关防御及破解方法
  10. 基于 TiDB 开源社区的友邻合作伙伴体系构建