偷闲,整理自己作为分析师工作下常用的一些业务指标的计算口径,不足之处,往多多指正;
这里,将指标分成3类-事件类、漏斗类、留存类

1 事件类

个人定义:可以直接通过计数计算&加减得到的指标

1.1 uv(日活&dau)

  • 定义:用户使用&曝光人数
  • 统计口径:
select count(distinct user_id) as pv from  xx --表  where p_date = ''  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制

1.2 pv(曝光数)

  • 定义:曝光&点击数(不去重)
  • 统计口径:
select count(user_id) as pv from  xx --表  where p_date = ''  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制

1.3 停留时长

  • 定义:页面&功能的使用时长

目前的统计方案主要有两种

  1. 直接取用开发提供的时间;
  2. 离开时间点-进入时间点的时间间隔(对数据基础要求高)
  • 统计口径:
 --放在某个日志文件里;
--直接取用开发提供的时间;
select ziduan['time'] as timefrom  xx --表
where p_date = ''  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制--离开时间点-进入时间点的时间间隔(对数据基础要求高)
select max(time) - min(time) as timefrom xx表where p_date = 'xxx'  --时间限制 and user_id = 'xxx' --选定用户

2、漏斗类

顾名思义,指标计算出来加减外 还有乘除

2.1 点击&点赞率(UV)

select (count(distinct p2.user_id)*1.00/count(distinct p1.user_id))*100 as uv_click_rate from  (select user_idfrom xxx --表 where p_date = ''  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date = ''  --时间限制 and stat_id rlike 'xxx.click' --用户行为埋点限制(点击))p2on  p1.p_date = p2.p_date

2.1 点击&点赞率(PV)

select (count(p2.user_id)*1.00/count(p1.user_id))*100 as pv_click_rate from  (select user_idfrom xxx --表 where p_date = ''  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date = ''  --时间限制 and stat_id rlike 'xxx.click' --用户行为埋点限制(点击))p2on  p1.p_date = p2.p_date

3、留存类

3.1 次日&三日&五日&七日留存

-----------------------------------------------------------------------------
--单天
select (count(p2.user_id)*1.00/count(p1.user_id))*100 as return_rate from  (select user_idfrom xxx --表 where p_date = ['last_1_day']  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date = ['now']  --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(点击))p2on  p1.user_id = p2.user_id---------------------------------------------------------
-- 一段时间
select (count(p2.user_id)*1.00/count(p1.user_id))*100 as return_rate ,p1.datefrom  (select user_idfrom xxx --表 where p_date >= xxx  --时间限制and p_date <= xxx and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date >= xxx  --时间限制and p_date <= xxx  --时间限制and stat_id rlike 'xxx.show' --用户行为埋点限制(点击))p2on  p1.user_id = p2.user_idand date_add (p1.date,1) = p2.p_dategroup by p1.date

常用的业务分析指标统计口径(基于Hive实现)相关推荐

  1. 数据分析_常见的业务分析指标及模型介绍

    一.常见的业务分析指标及模型介绍 1. 业务指标介绍 (1)简单企业架构 产品:包括设计.落地.优化,类似于项目经理的岗位: 技术:包括前端.后端: 运营:分为产品.内容.活动三个方面: 市场:包括品 ...

  2. 指标统计:基于流计算 Oceanus(Flink) 实现实时 UVPV 统计

    作者:吴云涛,腾讯 CSIG 高级工程师 导语 | 最近梳理了一下如何用 Flink 来实现实时的 UV.PV 指标的统计,并和公司内微视部门的同事交流.然后针对该场景做了简化,并发现使用 Flink ...

  3. 机械故障诊断信号幅域分析- 时域统计特征 | 基于python代码实现,在CWRU和IMF轴承数据集上实战

    最详细的机械故障信号时域特征分析及实战 1.摘要 2.有量纲幅域参数计算公式及物理意义 3.无量纲幅域参数计算公式及物理意义 4.模拟数据代码实战 4.1 导入包 4.2 生成模拟正弦数据 4.3 绘 ...

  4. 我常用的5种业务分析方法

    回想了下,做增长也快3年的时间了.期间成长了很多,尤其是以数据驱动业务增长方面. 趁着周末时间,梳理下自己最常用的业务分析方法,一来做个复盘迭代:二来方便自己遇到分析瓶颈时,可以到这里快速找找思路. ...

  5. 数据分析:业务的分析指标

    业务的重要性 基于业务才能建立好的数据模型. 基本APP的指标 分析指标的作用 指标建立的要点 核心指标 从结构化的角度考虑,核心指标就是金字塔的塔尖. 以初创公司为例: 创业早期,关注新增用户量 创 ...

  6. 七周成为数据分析师 第二周:业务篇-指标

    七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...

  7. 【Java】基于TA-Lib技术分析指标研究

    [Java]SFC融媒体项目基于TA-Lib技术分析指标研究 [Java]SFC融媒体项目基于TA-Lib技术分析指标研究 0. 前言 1. TA-Lib介绍 2. TA-Lib数据准备 2.1 指标 ...

  8. 基于NLP的书法字体分析、统计及可视化

            基于NLP对书法字体进行分析.统计.可视化    选题3:   对十二个"一"的文艺创作作业进行文本分析.统计和可视化 任务主题:   对全体同学的文艺创作进行文本 ...

  9. 基于hive数仓的游戏指标分析

    目录 一.分析指标数据 二.基础层数据处理 1.先把全部数据导入到HDFS中 2.创建一个外部表,将数据导入到hive中 3.分割txt文件中的数据 4.取出需要的值,并建表 5.检查数据日期 三.设 ...

最新文章

  1. HTML基本介绍与操作
  2. MATLAB中FFT的使用方法
  3. spring boot filter配置方式
  4. spring mvc 接收List数组类型参数
  5. response对象简介
  6. TreeCtrl 查找功能的最简单实现
  7. vue组件样式穿透种类 /deep/ ::v-deep >>>。the >>> and /deep/ combinators have been deprecated. Use :deep() in
  8. 电脑不识别移动硬盘怎么办_U盘插入电脑后不识别无法读取的解决方法
  9. zabbix监控系统的实际应用(客户端安装-基本应用设置-报警提醒篇)
  10. 基于RFID定位技术的文物仓库管理--新导智能
  11. 【自动驾驶】KITTI Road Detection Benchmark Devkit_road使用
  12. 到底学机械好还是学计算机好,大学同学一个选择学机械,另一个学计算机,对比5年后收入蒙了...
  13. n位整数去掉m位后求最大值问题
  14. DZZ云桌面1.3下载 多图介绍
  15. 基于SSM的家政服务管理系统
  16. 到底什么是范数?什么是0范数、1范数、2范数?区别又是什么?
  17. codeforces1375G Tree Modification
  18. 来玩个游戏,解锁IT女~
  19. Vue.js中的生命周期函数
  20. 防止计算机病毒和木马的方法,防止电脑中病毒、木马的方法(windows清理助手)...

热门文章

  1. 宾馆房间管理系统(C++)
  2. day 3:蓝桥杯python 杨辉三角知识点
  3. 医疗平台,专攻医学软件方向,病历云、影像学、实验室检验
  4. 985大学改考408!复旦大学软件工程专硕
  5. 计算机硬件技术的应用毕业论文,计算机硬件技术论文
  6. 动物模型之肾衰竭模型 大鼠实验性ARF的最常用大鼠模型
  7. w5100网络扩展板故障排查记录
  8. Python图片字符化(表情包)
  9. 群晖nas做文件服务器的安全性,更换NAS后,数据如何安全处理?聊聊NAS数据安全性那些事...
  10. 输入整数n(0<=n<=1000),紧接着在下一行连续输入n个数。随后输出这一组数的最小值和最大值。