王兴说过,我们已经进入到互联网的下半场。在上半场,也就是早期的互联网时代,你永远不知道在对面坐的是什么样的人。那个年代大部分人还是QQ的早期用户。在下半场,互联网公司已经不新鲜了,大部分公司已经互联网化。他们已经在用网络进行产品宣传,使用电商销售自己的商品。

这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业,他们有数据,有用户。

通过大数据告诉政府该如何智慧地管理交通,做城市规划。

通过消费数据分析,告诉企业该在什么时间生产什么产品,以最大化地满足用户的需求。

通过生活大数据告诉我们餐饮企业,甚至房地产企业该如何选址。

如果说互联网的上半场是粗狂运营,因为有流量红利不需要考虑细节。那么在下半场,精细化运营将是长久的主题。有数据,有数据分析能力才能让用户得到更好的体验。

所以,用户是根本,也是数据分析的出发点。

假如你进入到一家卖羊肉串的餐饮公司,老板说现在竞争越来越激烈,要想做得好就要明白顾客喜欢什么。于是上班第一天,老板问你:“你能不能分析下用户数据,给咱们公司的业务做个赋能啊?”

听到这,你会怎么想?

你说:“老板啊,咱们是卖羊肉串的,做数据挖掘没用啊。”估计老板听后,晚上就把你给开了。

那该怎么办呢?如果你感觉一头懵,没关系,我们今天就来讲讲怎么一步步分析用户数据。

用户画像的准则

首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。

你可以这么和老板说:“老板啊,用户画像建模是个系统的工程,我们要解决三个问题。第一呢,就是用户从哪里来,这里我们需要统一标识用户ID,方便我们对用户后续行为进行跟踪。我们要了解这些羊肉串的用户从哪里来,他们是为了聚餐,还是自己吃宵夜,这些场景我们都要做统计分析。第二呢,这些用户是谁?我们需要对这些用户进行标签化,方便我们对用户行为进行理解。第三呢,就是用户要到哪里去?我们要将这些用户画像与我们的业务相关联,提升我们的转化率,或者降低我们的流失率。”

听到这,老板给你竖起了大拇指,说:“不错,都需要什么资源,随时找我就行。”


刚才说的这三个步骤,下面我一一给你做个梳理。

首先,为什么要设计唯一标识?

用户唯一标识是整个用户画像的核心。我们以一个App为例,它把“从用户开始使用APP到下单到售后整个所有的用户行为”进行串联,这样就可以更好地去跟踪和分析一个用户的特征。

设计唯一标识可以从这些项中选择:用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID等。

其次,给用户打标签。

你可能会想,标签有很多,且不同的产品,标签的选择范围也不同,这么多的标签,怎样划分才能既方便记忆,又能保证用户画像的全面性呢?

这里我总结了八个字,叫“用户消费行为分析”。我们可以从这4个维度来进行标签划分。

  1. 用户标签:它包括了性别、年龄、地域、收入、学历、职业等。这些包括了用户的基础属性。

  2. 消费标签:消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。

  3. 行为标签:时间段、频次、时长、访问路径。这些是通过分析用户行为,来得到他们使用App的习惯。

  4. 内容分析:对用户平时浏览的内容,尤其是停留时间长、浏览次数多的内容进行分析,分析出用户对哪些内容感兴趣,比如,金融、娱乐、教育、体育、时尚、科技等。

可以说,用户画像是现实世界中的用户的数学建模,我们正是将海量数据进行标签化,来得到精准的用户画像,从而为企业更精准地解决问题。

最后,当你有了用户画像,可以为企业带来什么业务价值呢?

我们可以从用户生命周期的三个阶段来划分业务价值,包括:获客、粘客和留客

  1. 获客:如何进行拉新,通过更精准的营销获取客户。

  2. 粘客:个性化推荐,搜索排序,场景运营等。

  3. 留客:流失率预测,分析关键节点降低流失率。

如果按照数据流处理的阶段来划分用户画像建模的过程,可以分为数据层、算法层和业务层。你会发现在不同的层,都需要打上不同的标签。

数据层指的是用户消费行为里的标签。我们可以打上“事实标签”,作为数据客观的记录。

算法层指的是透过这些行为算出的用户建模。我们可以打上“模型标签”,作为用户画像的分类标识。

业务层指的是获客、粘客、留客的手段。我们可以打上“预测标签”,作为业务关联的结果。

所以这个标签化的流程,就是通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”。

美团外卖的用户画像该如何设计?

刚才讲的是用户画像的三个阶段,以及每个阶段的准则。下面,我们来使用这些准则做个练习。

如果你是美团外卖的数据分析师,你该如何制定用户标识ID,制定用户画像,以及基于用户画像可以做哪些业务关联?

首先,我们先回顾下美团外卖的产品背景。美团已经和大众点评进行了合并,因此在大众点评和美团外卖上都可以进行外卖下单。另外美团外卖针对的是高频O2O的场景,美团外卖是美团的核心产品,基本上有一半的市值都是由外卖撑起来的。

基于用户画像实施的三个阶段,我们首先需要统一用户的唯一标识,那么究竟哪个字段可以作为用户标识呢?

我们先看下美团和大众点评都是通过哪些方式登录的。

我们看到,美团采用的是手机号、微信、微博、美团账号的登录方式。大众点评采用的是手机号、微信、QQ、微博的登录方式。这里面两个APP共同的登录方式都是手机号、微信和微博。

那么究竟哪个可以作为用户的唯一标识呢?当然主要是以用户的注册手机号为标准。这样美团和大众点评的账号体系就可以相通。

当然,大家知道在集团内部,各部门之间的协作,尤其是用户数据打通是非常困难的,所以这里建议,如果希望大数据对各个部门都能赋能,一定要在集团的战略高度上,尽早就在最开始的顶层架构上,将用户标识进行统一,这样在后续过程中才能实现用户数据的打通。

然后我们思考下,有了用户,用户画像都可以统计到哪些标签。我们按照“用户消费行为分析”的准则来进行设计。

  1. 用户标签:性别、年龄、家乡、居住地、收货地址、婚姻、宝宝信息、通过何种渠道进行的注册。

  2. 消费标签:餐饮口味、消费均价、团购等级、预定使用等级、排队使用等级、外卖等级。

  3. 行为标签:点外卖时间段、使用频次、平均点餐用时、访问路径。

  4. 内容分析:基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度等。

当你有了“用户消费行为分析”的标签之后,你就可以更好地理解业务了。

比如一个经常买沙拉的人,一般很少吃夜宵。同样,一个经常吃夜宵的人,吃小龙虾的概率可能远高于其他人。这些结果都是通过数据挖掘中的关联分析得出的。

有了这些数据,我们就可以预测用户的行为。

比如一个用户购买了“月子餐”后,更有可能购买婴儿水,同样婴儿相关的产品比如婴儿湿巾等的购买概率也会增大。

具体在业务层上,我们都可以基于标签产生哪些业务价值呢?

  • 在获客上,我们可以找到优势的宣传渠道,如何通过个性化的宣传手段,吸引有潜在需求的用户,并刺激其转化。

  • 在粘客上,如何提升用户的单价和消费频次,方法可以包括购买后的个性化推荐、针对优质用户进行优质高价商品的推荐、以及重复购买,比如通过红包、优惠等方式激励对优惠敏感的人群,提升购买频次。

  • 在留客上,预测用户是否可能会从平台上流失。在营销领域,关于用户留存有一个观点——如果将顾客流失率降低5%,公司利润将提升25%~85%。可以看出留存率是多么的重要。用户流失可能会包括多种情况,比如用户体验、竞争对手、需求变化等,通过预测用户的流失率可以大幅降低用户留存的运营成本。

锻炼自己的抽象能力,将繁杂的事务简单化

上面我们讲到的“用户消费行为标签”都是基于一般情况考虑的,除此之外,用户的行为也会随着营销的节奏产生异常值,比如双十一的时候,如果商家都在促销就会产生突发的大量订单。因此在做用户画像的时候,还要考虑到异常值的处理。

总之,数据量是庞大的,会存在各种各样的使用情况。光是分析EB级别的大数据,我们就要花很长的时间。

我们的最终目的不是处理这些数据,而是理解、使用这些数据挖掘的结果。对数据的标签化能让我们快速理解一个用户,一个商品,乃至一个视频内容的特征,从而方便我们去理解和使用数据。

对数据的标签化其实考验的是我们的抽象能力,在日常工作中,我们也要锻炼自己的抽象能力,它可以让我们很快地将一个繁杂的事物简单化,不仅方便理解,还有益后续的使用。

我们今天讲了用户画像的流程,其中很重要的一个步骤就是给用户打标签,那么你不妨想想,如果给羊肉串连锁店进行用户画像分析,都可以从哪些角度进行标签化?

最后,我们从现实生活中出发,打开你的手机,翻翻看你的微信通讯录,分析下你的朋友圈,都有哪些用户画像?如果你来给它设计标签,都有哪些种类需要统计呢。为了方便后续使用,你是如何将他们归类分组的?

用户画像:标签化就是数据的抽象能力相关推荐

  1. 数据分析基础篇16讲之07用户画像:标签化就是数据的抽象能力

    07 用户画像:标签化就是数据的抽象能力 用户画像建模的三个步骤有哪些?以及它每一步骤的目的是什么? 第一步:统一化 目的:用来统计用户的唯一辨识,从而保证该用户的唯一性 第二步:标签化 目的:给用户 ...

  2. 深度学习在用户画像标签模型中的应用

    原文地址:https://blog.csdn.net/chaishen10000/article/details/79324016 最近一段时间都在学习深度学习,想着在用户画像标签模型中看能不能用上, ...

  3. 三分钟入门大数据之用户画像标签的分类

    哈喽,大家好,我是汉斯老师.近几年来,互联网行业由于较高的薪资收入,受到许多人的追捧.很多年轻的学子,或是其他行业的有志青年,都想要投身到这个行业中来.然而一方面受到"互联网寒冬" ...

  4. 用户画像标签数据存储之Elasticsearch存储

    目录 0. 相关文章链接 1. Elasticsearch简介 2. 应用场景 3. 工程化案例 4. 用户画像标签数据存储总结 注:此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一 ...

  5. 用户画像 | 标签数据存储之Hive真实应用

    本文已收录github:https://github.com/BigDataScholar/TheKingOfBigData,里面有大数据高频考点,Java一线大厂面试题资源,上百本免费电子书籍,作者 ...

  6. 用户画像-标签体系(dwt层)

    1 前言 最近在学习用户画像,翻看了七十多份资料,简单过了一遍赵宏田老师的书,最近又看了许多微信公众号里的文章. 整体感受就是,资料太杂.内容太乱.重复的太多.相互间也会有些冲突.但大致可以归为两类: ...

  7. 万字用户画像标签体系建设分析指南!

    转自:大数据梦想家 01 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特 ...

  8. 全网超详细!用户画像标签体系建设指南!

    大家好,最近工作之余看了很多用户画像的文章,要么描述浅显.要么相对片面,对于数据分析人员来说算是窥中豹管. 今天我将结合日常工作实践和理解,整理了一份用户画像的文章,内容偏向数据分析方法论,个人觉得这 ...

  9. 数仓用户画像-标签体系详解

    2 标签体系概览 2.1 什么是对象 2.2 什么是标签 标签是人为设定的.根据业务场景需求,对目标对象运用一定的算法得到的高度精炼的特征标识. 标签是对对象某个维度特征的描述与刻画,是某一种用户特征 ...

最新文章

  1. python测试脚本 进制转换_使用Python进行新浪微博的mid和url互相转换实例(10进制和62进制互算)...
  2. 修改代码150万行!Apache Flink 1.9.0做了这些重大修改!(附链接)
  3. 怕了么?三年后,人工智能将彻底改变前端开发?
  4. qt 实现的电视遥控系统,如何让qt响应来自遥控器的按键信息?
  5. TikTok英国市场你不能不知道的10大数据
  6. 2021热度不减的在线教育,正在努力成为线下教育的有益补充
  7. python百钱买百鸡-百钱买百鸡的Python实现
  8. dos debug命令
  9. 2.3 最佳创新先锋:e代驾副总裁兼CTO于杨
  10. 一些难懂的笑话,看看你懂得多少? [转帖]
  11. 解读设计模式----策略模式(Strategy Pattern)
  12. 一个 冒泡排序 和 选择排序 的简单c程序
  13. Netty工作笔记0052---Pipeline组件剖析
  14. maven java web项目_Maven创建JavaWeb项目
  15. Redhat6.5安装vnc服务远程桌面
  16. iapp如何导入本地源码,iapp导入源码使用教程
  17. 单片机c语言中断延时,单片机中C语言延时函数
  18. 腾讯云文档数据库MongoDB怎么样?腾讯云文档数据库MongoDB有什么优点?
  19. C++中构造函数和析构函数调用的时机
  20. 闵帆老师《论文写作》心得体会

热门文章

  1. 8.法律法规与标准化知识
  2. 杨振宁六大数理工作赏析 | 祝贺杨先生百岁华诞
  3. 京东第八批C/C++笔试题10.15第二题答案
  4. Typora常用快捷键(MarkDown)
  5. Number Game(数字游戏)
  6. bat 批处理拷贝文件
  7. C++ bitset的使用
  8. 华为OD机试 - 自动曝光(C 语言解题)【独家】
  9. Tensorflow笔记(八)——Estimator
  10. HitTest 和SubItemHitTest