用户画像是数据运营的基础,也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础,确保画像质量,后续的深挖行为才有突破的可能。

一. 用户画像开发中
    1.1 Recall、Pecision、K-S、F1曲线、Roc曲线、Confusion Matrix、AUC
    1.2  交叉验证
二. 用户画像上线后
三. 用户画像更新
    3.1 用户回访
    3.2 机制检测


在用户研究的课题中,用户画像是几乎每个公司都会去做的,浅层的包括统计类的:上月购买量,上周活跃天数等;深层的包括洞察类的:潜在需求偏好,生命周期阶段等;前者的校验简单,后者的校验需要通过一些特别的方式。本文就洞察类画像校验做一系列的梳理。

省略掉预处理设计的过程,画像校验的步骤主要集中在画像开发,画像上线,画像更新中,并且三个阶段中,每个阶段的校验方式不尽不同

一. 用户画像开发中

当我们所开发的用户画像是类似于用户的下单需求、用户的购车意愿、用户是否有注册意愿这一类存在历史的正负样本的有监督的问题,我们可以利用历史确定的数据来校验我们的画像准确性。比如,银行在设计用户征信的画像前,会有一批外部购买的坏样本和好样本,其实画像问题就转化为分类问题去解决评估了。

1.1 Recall、Pecision、K-S、F1曲线、Roc曲线、Confusion Matrix、AUC

针对这类问题,已经有较为成熟的理论基础,直接利用测试样本判断的准确程度判断画像是否准确

这张图是一张非常常见也是有效的来总结Recall、Pecision、Lift曲线、Roc曲线、Confusion Matrix的图。

FPR = FP/(FP + TN)

Recall=TPR=TP/(TP+FN)

Precision=TP/(TP+FP)

F1曲线:2*Precision*Recall/(Precision+Recall)

Roc曲线:TPR vs FPR,也就是Precision vs Recall

Auc:area under the roc curve ,也就是roc曲线下面的面积,积分或者投点法均可求解。

1.2  交叉验证

并不是所有画像都是有监督训练的画像,举个例子,用户的性别画像,是一个无监督的刻画,当你无法通过app端资料填写直接获取到的时候,你只能够通过其他数据特征的对用户进行分群。

首先,我们在总的数据集中筛选出所有关键影响特征,每次将筛选出的特征分为两块,测试特征训练特征,利用训练特征建立模型,再利用测试特征去判断模型是否合理(比如女鞋用户群的女鞋购买次数小于男性用户群,则次模型异常,删除),最后集成所有合理模型。

这样的逻辑中,我们将所有异常不合理的模型全部剔除,训练过程中就校验了用户画像的准确性。

二. 用户画像上线后

ABTest

不得不说,abtest是用户画像校验最为直观有效的校验方式。

用户分流模块:

一句话解释,就是A1=A2保证分配随机,A3好于A1+A2的效果检验画像是否准确?多准确?

三. 用户画像更新

3.1 用户回访

在画像刻画完成后,必然会存在画像优化迭代的过程,客服回访是非常常见且有效的方式。

比如,我们定义了一波潜在流失用户10万人,随机抽取1000人,进行回访,根据回访结果做文本挖掘,提取关键词,看消极词用户的占比;

(来源网络)

3.2 机制检测

再比如,我们定义了一波忠诚用户10万人,随机抽取100人,后台随机获取用户安装app的列表,看用户同类app的下载量数目的分布;

横轴为用户手机中同类竞品安装量的个数,纵轴为对应的随机抽样的100人中的个数。

  • 人群1分布为忠诚用户画像最准确的,同类app下载量集中在1附近,定义的用户极为准确
  • 人群2分布杂乱
  • 人群3分布在下降量异常高的数值附近,定义人群不准确

用户画像是数据运营的基础,也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础,确保画像质量,后续的深挖行为才有突破的可能。

校验用户画像的准确性相关推荐

  1. 如何构建用户画像,给用户打“标签”?

    前言 大家好,我是云祁! 和大家分享一本近期读完的非常不错的技术书籍,赵宏田老师的<用户画像:方法论与工程化解决方案>. 用户画像是目前在技术公司广泛使用的技术,是根据客户人口统计信息.社 ...

  2. 数据分析学习笔记-用户画像怎么做?

    文章目录 前言 一.什么是用户画像? 二.用户画像的应用场景 1.对于产品 2.对于运营 3.对于技术 4.对于商业化 三.建立用户画像之前 四.构建用户画像 五.用户画像效果评估和迭代 总结 前言 ...

  3. 程度性数据python分析_用户画像准确性评测初探——拨开python大数据分析的神秘面纱...

    导读 本文主要包括两部分内容,第一部分会对零零散散进行了两个多月的用户画像评测做个简要回顾和总结,第二部分会对测试中用到的python大数据处理神器pandas做个整体介绍. Part1用户画像评测回 ...

  4. 用户画像准确性评测初探 ——拨开python大数据分析的神秘面纱

    Part1 用户画像评测回顾与总结 1.为什么做用户画像评测? 将时钟拨回到2018年初,大家迫切想打破以往资讯推荐无章可循的局面,而今日的推荐算法也似乎演成了神话,用户意图这个词在WiFi管家团队被 ...

  5. flink读取不到文件_日处理数据量超10亿:友信金服基于Flink构建实时用户画像系统的实践...

    简介: 友信金服公司推行全域的数据体系战略,通过打通和整合集团各个业务线数据,利用大数据.人工智能等技术构建统一的数据资产,如 ID-Mapping.用户标签等.友信金服用户画像项目正是以此为背景成立 ...

  6. 超硬核 | 一文带你入门用户画像

    本文已收录github:https://github.com/BigDataScholar/TheKingOfBigData,里面有大数据高频考点,Java一线大厂面试题资源,上百本免费电子书籍,作者 ...

  7. 用户画像构建方法调研和初步解决方案

    近期,由于项目需求,需要构建一套消费者的用户画像.这是一套偏大数据处理和实时数仓领域的解决方案,因为之前对这个领域并不熟悉,因此做了下前期的方案调研和初步的解决方案设计,本文将这个过程做个记录总结,希 ...

  8. 【BI学习心得03-推荐系统眼中的你——用户画像】

    内容目录 1.背景故事 2.概述 3.用户画像流程 3.1整体流程 3.2用户为什么进行标注 3.3用户如何打标签 3.3.1数据结构 3.3.2用户画像模块 3.3.3数据指标体系 3.3.4常见的 ...

  9. 千人千面、用户画像的设计、技术选型与架构实现

    用户画像的目的是为产品筛选出目标客户 目前,越来越多的企业,在大数据应用上,都会选择用户画像这一主题,为什么呢?因为用户画像相对于做推荐以及机器学习等简单容易的多,做画像,更多是就是对用户数据的整合, ...

最新文章

  1. 刷了一个月算法,终于拿到了double的offer
  2. python中类的用法_Python中的类和方法使用举例
  3. Mapgis6.7 林相图自动注记 .
  4. php跨域session共享,PHP中利用COOKIE与SESSION联合实现SESSION跨域
  5. 6.1 文件对象常用方法与属性
  6. (50)VHDL实现增减计数器
  7. C# Gridview 固定表头及表尾
  8. error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools,亲测100%安装
  9. springboot上传图片
  10. MacBook 连接投影仪
  11. 打印机一直不停打乱码的解决方法
  12. 【科普】显示器连接线有哪几种都长什么样子
  13. 【渝粤题库】国家开放大学2021春2410中国古代文学(B)(2)题目
  14. ArcGIS api 4.x label文字,图片显示
  15. WaveTone 2.67原创汉化版扒谱辅助教程
  16. 监控建设05dingtalk搭建
  17. php contract的作用,契约(Contracts)
  18. 全球生态遥感监测数据
  19. i3 3220 主板b75m d3v安装黑苹果10.9.1正式版,纪实
  20. dedecms笔记一

热门文章

  1. Linux终端乱码的解决办法
  2. wordpress使用二级域名绑定七牛云存储做图片存储站
  3. ASP.NET 3.5中的一个超简单的Ajax实验
  4. Discuz论坛架设从零起步之二
  5. SPOJ - BALNUM Balanced Numbers(数位dp+进制转换)
  6. Docker教程-深度学习环境配置
  7. 安卓入门系列-04常见布局之LinearLayout(线性布局)
  8. nginx系列之七:限流配置
  9. 另一种sysenter hook方法(绕过绝大多数的rootkit检测工具的检测)
  10. (二)boost库之字符串格式化