常用的业务分析指标统计口径(基于Hive实现)
偷闲,整理自己作为分析师工作下常用的一些业务指标的计算口径,不足之处,往多多指正;
这里,将指标分成3类-事件类、漏斗类、留存类
1 事件类
个人定义:可以直接通过计数计算&加减得到的指标
1.1 uv(日活&dau)
- 定义:用户使用&曝光人数
- 统计口径:
select count(distinct user_id) as pv from xx --表 where p_date = '' --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制
1.2 pv(曝光数)
- 定义:曝光&点击数(不去重)
- 统计口径:
select count(user_id) as pv from xx --表 where p_date = '' --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制
1.3 停留时长
- 定义:页面&功能的使用时长
目前的统计方案主要有两种
- 直接取用开发提供的时间;
- 离开时间点-进入时间点的时间间隔(对数据基础要求高)
- 统计口径:
--放在某个日志文件里;
--直接取用开发提供的时间;
select ziduan['time'] as timefrom xx --表
where p_date = '' --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制--离开时间点-进入时间点的时间间隔(对数据基础要求高)
select max(time) - min(time) as timefrom xx表where p_date = 'xxx' --时间限制 and user_id = 'xxx' --选定用户
2、漏斗类
顾名思义,指标计算出来加减外 还有乘除
2.1 点击&点赞率(UV)
select (count(distinct p2.user_id)*1.00/count(distinct p1.user_id))*100 as uv_click_rate from (select user_idfrom xxx --表 where p_date = '' --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date = '' --时间限制 and stat_id rlike 'xxx.click' --用户行为埋点限制(点击))p2on p1.p_date = p2.p_date
2.1 点击&点赞率(PV)
select (count(p2.user_id)*1.00/count(p1.user_id))*100 as pv_click_rate from (select user_idfrom xxx --表 where p_date = '' --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date = '' --时间限制 and stat_id rlike 'xxx.click' --用户行为埋点限制(点击))p2on p1.p_date = p2.p_date
3、留存类
3.1 次日&三日&五日&七日留存
-----------------------------------------------------------------------------
--单天
select (count(p2.user_id)*1.00/count(p1.user_id))*100 as return_rate from (select user_idfrom xxx --表 where p_date = ['last_1_day'] --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date = ['now'] --时间限制 and stat_id rlike 'xxx.show' --用户行为埋点限制(点击))p2on p1.user_id = p2.user_id---------------------------------------------------------
-- 一段时间
select (count(p2.user_id)*1.00/count(p1.user_id))*100 as return_rate ,p1.datefrom (select user_idfrom xxx --表 where p_date >= xxx --时间限制and p_date <= xxx and stat_id rlike 'xxx.show' --用户行为埋点限制(曝光))p1left join(select user_idfrom xxx --表 where p_date >= xxx --时间限制and p_date <= xxx --时间限制and stat_id rlike 'xxx.show' --用户行为埋点限制(点击))p2on p1.user_id = p2.user_idand date_add (p1.date,1) = p2.p_dategroup by p1.date
常用的业务分析指标统计口径(基于Hive实现)相关推荐
- 数据分析_常见的业务分析指标及模型介绍
一.常见的业务分析指标及模型介绍 1. 业务指标介绍 (1)简单企业架构 产品:包括设计.落地.优化,类似于项目经理的岗位: 技术:包括前端.后端: 运营:分为产品.内容.活动三个方面: 市场:包括品 ...
- 指标统计:基于流计算 Oceanus(Flink) 实现实时 UVPV 统计
作者:吴云涛,腾讯 CSIG 高级工程师 导语 | 最近梳理了一下如何用 Flink 来实现实时的 UV.PV 指标的统计,并和公司内微视部门的同事交流.然后针对该场景做了简化,并发现使用 Flink ...
- 机械故障诊断信号幅域分析- 时域统计特征 | 基于python代码实现,在CWRU和IMF轴承数据集上实战
最详细的机械故障信号时域特征分析及实战 1.摘要 2.有量纲幅域参数计算公式及物理意义 3.无量纲幅域参数计算公式及物理意义 4.模拟数据代码实战 4.1 导入包 4.2 生成模拟正弦数据 4.3 绘 ...
- 我常用的5种业务分析方法
回想了下,做增长也快3年的时间了.期间成长了很多,尤其是以数据驱动业务增长方面. 趁着周末时间,梳理下自己最常用的业务分析方法,一来做个复盘迭代:二来方便自己遇到分析瓶颈时,可以到这里快速找找思路. ...
- 数据分析:业务的分析指标
业务的重要性 基于业务才能建立好的数据模型. 基本APP的指标 分析指标的作用 指标建立的要点 核心指标 从结构化的角度考虑,核心指标就是金字塔的塔尖. 以初创公司为例: 创业早期,关注新增用户量 创 ...
- 七周成为数据分析师 第二周:业务篇-指标
七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...
- 【Java】基于TA-Lib技术分析指标研究
[Java]SFC融媒体项目基于TA-Lib技术分析指标研究 [Java]SFC融媒体项目基于TA-Lib技术分析指标研究 0. 前言 1. TA-Lib介绍 2. TA-Lib数据准备 2.1 指标 ...
- 基于NLP的书法字体分析、统计及可视化
基于NLP对书法字体进行分析.统计.可视化 选题3: 对十二个"一"的文艺创作作业进行文本分析.统计和可视化 任务主题: 对全体同学的文艺创作进行文本 ...
- 基于hive数仓的游戏指标分析
目录 一.分析指标数据 二.基础层数据处理 1.先把全部数据导入到HDFS中 2.创建一个外部表,将数据导入到hive中 3.分割txt文件中的数据 4.取出需要的值,并建表 5.检查数据日期 三.设 ...
最新文章
- HTML基本介绍与操作
- MATLAB中FFT的使用方法
- spring boot filter配置方式
- spring mvc 接收List数组类型参数
- response对象简介
- TreeCtrl 查找功能的最简单实现
- vue组件样式穿透种类 /deep/ ::v-deep >>>。the >>> and /deep/ combinators have been deprecated. Use :deep() in
- 电脑不识别移动硬盘怎么办_U盘插入电脑后不识别无法读取的解决方法
- zabbix监控系统的实际应用(客户端安装-基本应用设置-报警提醒篇)
- 基于RFID定位技术的文物仓库管理--新导智能
- 【自动驾驶】KITTI Road Detection Benchmark Devkit_road使用
- 到底学机械好还是学计算机好,大学同学一个选择学机械,另一个学计算机,对比5年后收入蒙了...
- n位整数去掉m位后求最大值问题
- DZZ云桌面1.3下载 多图介绍
- 基于SSM的家政服务管理系统
- 到底什么是范数?什么是0范数、1范数、2范数?区别又是什么?
- codeforces1375G Tree Modification
- 来玩个游戏,解锁IT女~
- Vue.js中的生命周期函数
- 防止计算机病毒和木马的方法,防止电脑中病毒、木马的方法(windows清理助手)...
热门文章
- 宾馆房间管理系统(C++)
- day 3:蓝桥杯python 杨辉三角知识点
- 医疗平台,专攻医学软件方向,病历云、影像学、实验室检验
- 985大学改考408!复旦大学软件工程专硕
- 计算机硬件技术的应用毕业论文,计算机硬件技术论文
- 动物模型之肾衰竭模型 大鼠实验性ARF的最常用大鼠模型
- w5100网络扩展板故障排查记录
- Python图片字符化(表情包)
- 群晖nas做文件服务器的安全性,更换NAS后,数据如何安全处理?聊聊NAS数据安全性那些事...
- 输入整数n(0<=n<=1000),紧接着在下一行连续输入n个数。随后输出这一组数的最小值和最大值。