什么是用户画像?

Alan Cooper (交互设计之父)最早提出了 persona 的概念:“Personas are a concrete representation of target users.”Persona 是真实用户的虚拟代表,是建立在一系列真实数据(Marketing data,Usability data)之上的目标用户模型。

简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。
举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有 5-10 岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。
除去“标签化”,用户画像还具有的特点是“低交叉率”,当两组画像除了权重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。

用户画像的作用

罗振宇在《时间的朋友》跨年演讲上举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准销售”,当然了,这是极其错误的用法。

其作用大体不离以下几个方面:
1. 精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销;
2. 用户统计,比如中国大学购买书籍人数 TOP10,全国分城市奶爸指数;
3. 数据挖掘,构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况;
4. 进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务;
5. 对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户(个人认为这是目前的发展趋势,未来的消费主流)。比如,某公司想推出一款面向 5-10 岁儿童的玩具,通过用户画像进行分析,发现形象=“喜羊羊”、价格区间=“中等”的偏好比重最大,那么就给新产品提供类非常客观有效的决策依据。
6. 业务经营分析以及竞争分析,影响企业发展战略。

构建流程

数据收集

数据收集大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类。
1. 网络行为数据:活跃人数、页面浏览量、访问时长、激活率、外部触点、社交数据等
2. 服务内行为数据:浏览路径、页面停留时间、访问深度、唯一页面浏览次数等
3. 用户内容便好数据:浏览/收藏内容、评论内容、互动内容、生活形态偏好、品牌偏好等
4. 用户交易数据(交易类服务):贡献率、客单价、连带率、回头率、流失率等

当然,收集到的数据不会是 100% 准确的,都具有不确定性,这就需要在后面的阶段中建模来再判断,比如某用户在性别一栏填的男,但通过其行为偏好可判断其性别为“女”的概率为 80%。
还得一提的是,储存用户行为数据时最好同时储存下发生该行为的场景,以便更好地进行数据分析。

行为建模

该阶段是对上阶段收集到数据的处理,进行行为建模,以抽象出用户的标签,这个阶段注重的应是大概率事件,通过数学算法模型尽可能地排除用户的偶然行为。

这时也要用到机器学习,对用户的行为、偏好进行猜测,好比一个 y=kx+b 的算法,X 代表已知信息,Y 是用户偏好,通过不断的精确 k 和 b 来精确 Y。

在这个阶段,需要用到很多模型来给用户贴标签。

用户汽车模型
根据用户对“汽车”话题的关注或购买相关产品的情况来判断用户是否有车、是否准备买车
用户忠诚度模型
通过判断+聚类算法判断用户的忠诚度
身高体型模型
根据用户购买服装鞋帽等用品判断
文艺青年模型
根据用户发言、评论等行为判断用户是否为文艺青年
用户价值模型
判断用户对于网站的价值,对于提高用户留存率非常有用(电商网站一般使用 RFM 实现)

还有消费能力、违约概率、流失概率等等诸多模型。

用户画像基本成型

该阶段可以说是二阶段的一个深入,要把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征、社交网络大致地标签化。

为什么说是基本成型?因为用户画像永远也无法 100% 地描述一个人,只能做到不断地去逼近一个人,因此,用户画像既应根据变化的基础数据不断修正,又要根据已知数据来抽象出新的标签使用户画像越来越立体。

关于“标签化”,一般采用多级标签、多级分类,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置等二级分类,地理位置又分工作地址和家庭地址的三级分类。

数据可视化分析

这是把用户画像真正利用起来的一步,在此步骤中一般是针对群体的分析,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以作出针对性的运营。
如图:

原文链接

基于大数据的用户画像构建(理论篇)相关推荐

  1. 基于大数据的用户画像构建小百科全书

    来源:http://suo.im/6aVjHQ 一. 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用 ...

  2. 毕业设计 - 题目:基于大数据的用户画像分析系统 数据分析 开题

    文章目录 1 前言 2 用户画像分析概述 2.1 用户画像构建的相关技术 2.2 标签体系 2.3 标签优先级 3 实站 - 百货商场用户画像描述与价值分析 3.1 数据格式 3.2 数据预处理 3. ...

  3. 如何快速全面建立自己的大数据知识体系? 大数据 ETL 用户画像 机器学习 阅读232 作者经过研发多个大数据产品,将自己形成关于大数据知识体系的干货分享出来,希望给大家能够快速建立起大数据

    如何快速全面建立自己的大数据知识体系? 大数据 ETL 用户画像 机器学习 阅读232  作者经过研发多个大数据产品,将自己形成关于大数据知识体系的干货分享出来,希望给大家能够快速建立起大数据产品的体 ...

  4. 基于大数据的用户行为预测

    2019独角兽企业重金招聘Python工程师标准>>> 随着智能手机的普及和APP形态的愈发丰富,移动设备的应用安装量急剧上升.用户在每天使用这些APP的过程中,也会产生大量的线上和 ...

  5. 大数据标签获取处理步骤_基于大数据的用户深层标签挖掘方法与流程

    本发明涉及大数据应用技术领域,尤其涉及一种基于大数据的用户深层标签挖掘方法. 背景技术: 用户画像建立的过程就是添加相应的标签,在数据挖掘领域称为标签化.标签是通过对用户信息分析而得到的高度精炼的特征 ...

  6. 什么叫大数据人物画像_大数据时代用户画像有什么作用

    简单来说,用户画像就是把用户的信息进行标签化,从而提供给企业和公司.在当下这个大数据时代,各个企业公司早就把用户画像,作为重要的经营战略调整依据.因此,用户画像在电商中的价值和作用不言而喻.下面就为大 ...

  7. 【大数据相关】电商大数据之用户画像介绍

    因为平时工作中接触的跟大数据有关,于是学习了一下大数据 第一篇学习的是:慕课网 -- 大数据 --  电商大数据之用户画像介绍 笔记--基本概念介绍: 1.用户画像的价值 --- 有利于精准营销,营销 ...

  8. video 微信 标签层级过高_基于大数据的用户标签体系建设思路和应用

    在大数据时代,数据在呈现出海量化.多样化和价值化变化的同时,也改变了传统IT行业的市场竞争环境.营销策略和服务模式.如何在ZB级的海量数据中获取并筛选有价值的信息,是对IT企业的一大挑战,通过构建客户 ...

  9. 大数据学习-用户画像

    一. 什么是用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识.通过打标签可 ...

最新文章

  1. Request.ServerVariables参数集
  2. javascript jquery 获取select选中的值
  3. FPGA 实验六 计数器、 ROM和DDS
  4. 蓝桥杯练习系统习题-基础训练2
  5. Linux shell删除变量
  6. 初烧盲狙一条铁三角e40
  7. Android app:transformNativeLibsWithStripDebugSymbolForDebug错误分析
  8. 王者体验服服务器注册人数已满,王者荣耀体验服注册人数达到上限怎么回事?体验服测试最新申请方法...
  9. Android端实时音视频开发指南
  10. Harbor的搭建(vmware企业级docker镜像私服)
  11. 安装配置rabbitmq
  12. 漫画:“架构师”小赵的故事
  13. Java制作一个更加真实的按钮
  14. LaTeX简历模版,自己瞎做的,请多指教
  15. PSCAD建立高压直流输电线路雷击模型--相关建模问题
  16. 基于W800的AIOT离在线一体方案说明 (阿里飞燕+离线语音控制)
  17. ML语言/函数式编程原理(一)
  18. html5小猫钓鱼游戏思路,小猫钓鱼的游戏算法
  19. JavaScript中的常用鼠标事件以及小天使图片拖拽
  20. C语言基础 判断周几

热门文章

  1. 前端移动端的rem适配计算原理
  2. 设计系统(Design System),设计和开发之间的“DevOps”
  3. FANUC机器人超行程报警时的解决办法
  4. Ocelot + Swagger
  5. 联想wh系列服务器,ThinkAgile WH 系列
  6. 【Ubuntu】Ubuntu下搜狗输入法打不出中文
  7. 【学四天,复合材料20个案例带你如何玩转ABAQUS!】
  8. 服务器RAID信息存储方式介绍服务器磁盘做直通模式
  9. 实现智能读报(逐字朗读+自动滚屏)
  10. 03UEc++【打飞艇:导弹与飞艇的碰撞事件】