衡量一款产品是否健康,用户的留存率是一个关键的指标,常见的有7日留存率,14天留存率,30天留存率,60天留存率等等。今天Tay哥先讲一下如何用Tableau做Cohort Analysis ,中文一般译为分组留存率。上面提到的留存率,可以通过分组留存率进一步计算出来。

如何做分组留存率?

分组留存率计算起来比较简单,对用户进行分组,先维度分,再粒度分。

什么是维度?以Tableau自带的超市数据为例,如果按用户的首次购买时间对用户进行分组,购买时间就是维度;所谓粒度,就是时间维度是按日、周、月、季度,还是按年为分析的颗粒度?也即粒度上的差异。维度也可以是新增用户的渠道,那么新增的来源产品,还是来源的具体网址,这也属于粒度上的差异。通过这两方面的分组可以将对比的差异值逐级锁定,寻找数据表象差异背后的原因。

通常来讲,对于用户的留存分析有两个比较常用的的分组方向:

** 从用户的获取角度分组

** 从用户的行为角度分组

从用户获取的角度分组

如果按用户购买的时间分,粒度可选日、周、月、季度等,我们就可以分析后看出,各个时间段获取的客户在留存率表现上是不是有差异,例如在一个时间段内留存曲线是收敛并趋于稳定,还是强烈。通过留存率分析我们能够对流失的用户做用户画像分析,并在流失率高的时间段进行适当的干预。

在获取用户的角度,还可以对获客渠道进行划分,分析不同渠道的用户后续的留存情况。通过渠道维度的分析也可以判定不同渠道表现的优劣情况 ,好的渠道可以加大促销或者广告投入,差的渠道可以淘汰不用。

从用户行为角度分组

从用户行为角度分组对于功能比较复杂的产品也非常重要。比如一个浏览器产品,已不单单是解决用户访问网页的需求,通过浏览器,还可以向用户推送新闻、小说、视频等服务,浏览器俨然已经变成了一个内容的综合载体。一个用户选择用一个浏览器来看小说,并不代表他也一定会用浏览器来看新闻或视频。所以同样是用户流失,可能是对产品不同功能模块体验上的不满结果。

这个时候,产品团队就可以通过用户行为角度分组来具体分析存在哪些问题。还是以浏览器为例,新闻,小说,视频都应该是每日活跃的模块,如果做的好,应该表现出很高留存比例,如果分组分析中发现使用过某个功能的用户在之后的时间中留存情况很差,那就需要对这个功能进行优化了。同时,可以做竞品分析,看看相对于竞争对手,产品在哪些方面可以做进一步的优化和改进。

分组分析是一种简单成熟的分析方法,不但能够告诉我们用户在什么时候离开了我们的产品,而且能进一步告诉我们用户为什么离开,帮助我们找到优化产品的方向。同时,为了更好地使用分组分析,需要我们从一开始的数据收集和存储结构就为后续的分析做好准备。

Tableau分组留存分析实践

打开Tableau的Superstore样本数据,我们可以看见左侧数据栏中有一个维度是购买时间(Order Date),一个用户可能会来这个超市购买过多次的产品,那么如果我们需要对用户按首次购买时间进行分组,那我们就需要计算出每个用户的首次购买日期。

在Tableau新建计算字段,命名为 1st Order Date,然后在表达式中,写下如下的公式:

{fixed [Customer Name]: min([Order Date])}

这个公式用到了两个知识点,一个是Fixed详细表达式 (LOD),Tay哥以后为详细说明什么是详细表达式,什么情况下可以用详细表达式,以及三种不同的详细表达的区别。 第二个知识点是表计算函数 Min()。 这个公式用文字解释一下就是 “对每个用户,求他/她所有购买日期的最小值”,换句话,即首次购买日期。

如果按季度来看用户的留在率,那么就需要对每个用户,按照他/她的首次购买时间,对所有的购买时间进行坐标0点的统一,相对第X周,不同购买日期的用户分组留存率是多少。

在Tableau新建计算字段,命名为 Retention,然后在表达式中,写下如下的公式:

DATEDIFF(‘quarter’,[1st Order Day],[Order Date])

这个公式里,又用到一个新的函数,Datediff,它可以计算两个日期之间的天、周、月、季度等差值,这里是按季度来计算(quarter)。

然后将1st Order Date放入列,并右键,选择季度(Quarter)为粒度,同时选则为 非连续(discrete)。将Retention放入行,也选则为非连续(discrete)。

再新建一个计算字段,命名为 Number of Customers, 在表达式中,写下如下的公式:

COUNTD([Customer Name])

Number of Customer 拖入标记(Marks)>文本(text)上,可以看见,按首次购买时间分组,在随后的第X季度,这些用户中,有多少人返回Superstore购买东西。

那么我们希望得到的结果是,第X周里,某个季度内首次购物的人,有多少返回购买,需要增加对上面这个,再增加一个表计算,percent of total,然后按照行的方向,进行计算。

得到如下结果,Tableau默认的百分数是2位小数,下图已经改为0位小数。

图中倒三角形部分的百分比正是我们想要的,比如2015年Q1首次购买的用户,在第2周,有23%的用户再次购买。但是Grand Total里,有没有发现什么问题?按理Grand Total中,只有2015Q1首次购买的的用户达到了第15季,其它月首次购买的,其实都还没有达到他们的第15季,所以Grand Total应该是55%,但结果却显示为8%,这是为什么? 这个我们将在下一篇中详细说明,如何算聚合的分组留存率。

敬请关注下一讲,分组留存率的聚合计算。

mysql怎么分组计算逾期率_Tableau分享第一篇:如何计算分组留存率(Cohort Analysis)!...相关推荐

  1. 追溯系统二次开发源代码免费分享---第一篇

    第一篇:先说下它出生的背景 5年前自己写了个hcrain架构,本想在公司推广应用起来.基本完成时,换工作了. 一直没有机会,前两看有机会自己写个系统.果断用起来并完善它,我只能说,绝对是个:个人快速开 ...

  2. CHS-DRG医保支付(甘肃省庆阳市)分组解读第一篇:分组规则总述及MDCA篇

    国家医保局在2021年7月份发布的国家医疗保障疾病诊断相关分组(CHS-DRG)分组方案(1.1版) 基于医保疾病诊断和手术操作分类与代码2.0版 下载. 每个城市都会对DRG标准分组进行本地化,但是 ...

  3. mysql怎么分组计算逾期率_转行数据分析第三篇:mysql查询入门练习题

    这篇练习题是我在学sql入门的时候做的,应该算是在网上能找到的习题里最基础的一篇,非常适合新手练习,如果你接触sql不超过半个月,建议可以看一下<sql必知必会>或<mysql必知必 ...

  4. mysql怎么分组计算逾期率_用sql统计vintage,滚动率,迁移率,逾期率

    风险统计分析,离不开vintage,滚动率,迁移率,逾期率等指标的统计,贴一段递延率的Mysql代码,仅做参考. #create view overdue_list2 #as #逾期(递延)表 SEL ...

  5. 机票分享第一篇 机票由何而来

    要: 遥想05年刚加入飞猪,有同学问我机票搜索是怎么做的,一时间不知如何回答.转眼三年过去,为了给自己一个交代,抽时间把所负责的业务.系统.心得加以总结,才有了这几篇机票分享的文章.由于所用的技术.架 ...

  6. mysql查询并计算单价_Mysql--查询的成本如何计算

    查询成本组成有哪些. 1.I/O成本 2.CPU成本 3.Mysql规定读取一个页面花费的成本默认是1.0,读取以及检测一条记录是否符合搜索条件的成本默认是0.2.1.0.0.2这些数字称之为成本常数 ...

  7. 基于Spark的巨型矩阵分布式LU计算求逆【第一篇】

    概述 本文将介绍如何利用Spark解决巨型矩阵分布式的LU法求逆的问题.本篇则将对LU求逆的前半部分--分布式LU分解做介绍. [后半部分再我的队友整理完后,会以链接的形式补在这里] 正文 首先,我们 ...

  8. r语言aggredate_R语言 分组计算,不止group_by

    最近在研究excel透视图,想到好像自己在R-分组操作并不是很流畅,顺便学习分享一下.R自带数据集比较多,今天就选择一个我想对了解的mtcars数据集带大家学习一下R语言中的分组计算(操作). 目录 ...

  9. MySQL 到 MySQL 实时数据同步实操分享

    摘要:很多 DBA 和开发同学经常会遇到要从一个数据库实时同步到另一个数据库的问题,同构数据还相对容易,遇上异构数据.表多.数据量大等情况就难以同步.最近了解到一款实时数据同步工具 Tapdata C ...

最新文章

  1. mysql主从同步linux,linux中部署mysql主从同步示例详解(绝对经典,看了必会)
  2. argmax最经典解释
  3. 初识费用流 模板(spfa+slf优化) 餐巾计划问题
  4. 连年亏损的平安健康,能否成为中国版“联合健康”?
  5. 海华·垃圾分类AI挑战赛baseline分享,评测得分最高至0.85
  6. 寄存器、存储器、内存的区别
  7. 分布式之延时任务方案解析
  8. 去掉“搜一搜”后,让“查看新贴”等按钮居中
  9. nodejs实践录:我的nodejs编码风格
  10. 企业上公有云的 10 种驱动力
  11. 【搜索】【usaco 4.1.4】奶牛加密术
  12. 数据分析之学术前沿分析- 任务2
  13. 中国饭局里的潜规则:中国饭局中的细节
  14. POJ 1273 Dinic
  15. python中frame用法_python:pandas中dataframe的基本用法汇总
  16. select句柄数限制 及总结
  17. CCC认证介绍(转载)
  18. 常用db与倍数的关系
  19. Android与uni-app 互相通信案例(包含源代码)
  20. Python股票监控机器人,加强版!

热门文章

  1. XX.sh和./XX.sh
  2. 数据工具sqoop用法之mysql与hive数据导入导出
  3. python图书搜索与书籍封面下载
  4. eigen冲突 sophus 安装_SVO-SLAM环境搭建指南
  5. UVA - 11604 General Sultan 题解
  6. 大数据晋级之路(4)Hadoop生态系统体系架构及基本概念
  7. storm流程——storm
  8. dxf怎么用cad打开?办公常备
  9. k8s中的deployment
  10. oracle dul 12.2.0.2.4 测试