HIVE日活、周活、月活、新增业务指标分析
目录
一、前提
二、dws层日活、周活、月活
1、数据的走向分析
2、日活sql
3、dws_uv_detail_day日活跃的数据
4、周活跃sql
5、dws_uv_detail_wk周活跃的数据
6、月活跃的sql:
7、dws_uv_detail_wk月活跃的数据
三、ads层活跃用户数统计
1、活跃用户表的创建
2、活跃用户数的sql
一、前提
数据仓库ods,dwd层搭建完毕,基础数据导入成功。
二、dws层日活、周活、月活
1、数据的走向分析
dwd_start_log的数据zhangsan sh 2019-02-10zhangsan bj 2019-02-10zhangsan sz 2019-02-10lisi sh 2019-02-10lisi bj 2019-02-10lisi sz 2019-02-10wangwu sh 2019-02-10wangwu bj 2019-02-10wangwu sz 2019-02-10zhaoliu sh 2019-02-11zhaoliu bj 2019-02-11zhaoliu sz 2019-02-11
2、日活sql
select mid_idconcat_ws('|',collect_set(course)),from dwd_start_logwhere dt='2019-02-10'group by mid_id;
3、dws_uv_detail_day日活跃的数据
zhangsan |sh|bj|sz 2019-02-10zhangsan |sh|bj|sz 2019-02-11lisi |sh|bj|sz 2019-02-10wangwu |sh|bj|sz 2019-02-10zhaoliu |sh|bj|sz 2019-02-11
4、周活跃sql
select mid_idconcat_ws('|',collect_set(course)),date_add(next_day('2019-02-10','mo'),-7) 'moday',date_add(next_day('2019-02-10','mo'),-1) 'sunday',concat(date_add(next_day('2019-02-10','mo'),-7),'_',date_add(next_day('2019-02-10','mo'),-1)) wkfrom dws_uv_detail_daywhere dt>date_add(next_day('2019-02-10','mo'),-7) and dt < date_add(next_day('2019-02-10','mo'),-1)group by mid_id;
5、dws_uv_detail_wk周活跃的数据
zhangsan |sh|bj|sz|sh|bj|sz 2019-05-06_2019-05-12lisi |sh|bj|sz 2019-05-06_2019-05-12wangwu |sh|bj|sz 2019-05-06_2019-05-12zhaoliu |sh|bj|sz 2019-05-06_2019-05-12
6、月活跃的sql:
select mid_idconcat_ws('|',collect_set(course)),date_format('2019-02-10','yyyy-MM')) mnfrom dws_uv_detail_daywhere date_format('dt','yyyy-MM')) =date_format('2019-02-10','yyyy-MM'))group by mid_id;
7、dws_uv_detail_wk月活跃的数据
zhangsan |sh|bj|sz|sh|bj|sz 2019-02lisi |sh|bj|sz 2019-02wangwu |sh|bj|sz 2019-02zhaoliu |sh|bj|sz 2019-02
三、ads层活跃用户数统计
1、活跃用户表的创建
create external table ads_uv_count(dt string,day_count bigint,wk_count bigint,mn_count bigint,is_weekend string,is_monthend string)
2、活跃用户数的sql
selectdt ,day_count ,wk_count ,mn_count ,if(next_day(dt,'su')=dt,'Y','N'),if(last_day(dt,'yyyy-MM-dd')=dt,'Y','N') from (selectdt,count(*) ct,from dws_uv_detail_daywhere dt=dt)t1 left join (selectdt,count(*) ct,from dws_uv_detail_wkwhere wk_dt=concat(,,))t2 on t1.dt=t2.dtleft join (selectdt,count(*) ct,from dws_uv_detail_mnwhere mn=date_format(dt,'yyyy-MM'))t3 on t1.dt=t3.dt
HIVE日活、周活、月活、新增业务指标分析相关推荐
- 数仓工具—Hive实战之日活跃周活跃月活(12)
日活跃周活跃月活 日活的定义非常简单,就是今日活跃的用户数,因为定义很简答,所以逻辑很简单,因此它的计算也非常简单.虽然简单,但是它却是我们的业务上非常重要的一个计算指标 日活会受到很多因素的影响,产 ...
- 程序员的我们天天写日、周、月、年报,到底有什么用途?又不看!!!
让我们一起吐槽和分析 写在开头 日报制度的深层意义 日报的作用 周报的作用 月报/季报的作用 年报本该这么用 写在开头 日.周.月.季.年报制度,可能是数据分析领域最大的一个"咕咚来了&qu ...
- 【原创】实现日、周、月排行统计
在如今很多系统中,都需要进行日.周.月排行统计,但是在网上寻找了一番,发现很多都是相对的周.月排行,即周排行则用当前时间减去7天.这样我个人认为并不恰当.如月排行中,假设今天是4月22日,则从3月22 ...
- sql语句分别按日,按周,按月,按季统计金额
sql语句分别按日,按周,按月,按季统计金额 如: 表:consume_record 字段:consume (money类型) date (datetime类型) 请问怎么写四条sql语句分别 ...
- 实现日、周、月排行统计 sql
在如今很多系统中,都需要进行日.周.月排行统计,但是在网上寻找 了一番,发现很多都是相对的周.月排行,即周排行则用当前时间减去7天.这样我个人认为并不恰当.如月排行中,假设今天是4月22日,则从3月2 ...
- SqlServer 按日、周、月、季、年统计SQL语句
--创建表 CREATE TABLE Orders( Id int not null identity(1,1) primary key , Num int, CreationTime datetim ...
- Tableau--使用参数为报表增加一个统计周期筛选条件(日,周,月,季度,年)
有这样一个需求:要求在报表中增加一个统计周期控件,用来控制折线图的内容是按照控件里的选项(日,周,月,季度,年)来展示的. 这里用到了参数. 方法: step1: 创建一个字符型参数,'统计周期'. ...
- 利用element日期组件,封装季度组件, 实现日、周、月、季度切换,默认禁用部分日期选择(附带:获取昨日、昨日所在周、昨日所在月、昨日所在季度等方法)
具体效果图下: 1. 季度组件封装,创建一个 quarterDate.vue文件 <!-- 季度组件 --> <template><div><el-popov ...
- 国际WTI原油价格日、周、月、年度数据(1986.01-2019.02)
数据集名称:国际WTI原油价格日.周.月.年度数据 时间范围:1986.01-2019.02 数据来源:自算 相关说明:WTI原油是美国西得克萨斯的轻质原油,该原油期货合约具有良好的流动性及很高的价格 ...
- 整理1986.01-2019.02_国际WTI原油价格日、周、月、年度数据
整理1986.01-2019.02_国际WTI原油价格日.周.月.年度数据 数据集名称:国际WTI原油价格日.周.月.年度数据 时间范围:1986.01-2019.02 数据来源:自算 相关说明:WT ...
最新文章
- 标准caffe中实现darknet相关层。caffe和darknet模型的相互转换和加速(分类、检测、分割)
- 嵌入式开发之davinci--- DVRRDK, EZSDK和DVSDK这三者有什么区别
- ppt设置外观样式_PPT怎么做?如何做出好看的PPT?
- Python 技术篇-利用Office VBA实现word文档转化为pdf文档实例演示
- r怎么保存html文件,leaflet - 为什么在已保存的html文件中缺少传单地图上的杂项,但在Rstudio浏览器中可以正常打印呢? - 堆栈内存溢出...
- MongoDB-集群搭建
- 【转】Nginx服务器的反向代理proxy_pass配置方法讲解
- npm解决node-sass安装失败
- 【前端图表】echarts散点图鼠标划过散点显示信息
- 区块链软件公司:食品溯源+区块链
- pdf factory pro7序列号教你如何打印转换PDF教程
- 各种平均值:算术平均值,几何平均值,调和平均值等
- ★三个和尚与机构臃肿的故事
- Excel 导入Access 不能找到表达式中引用的字段的解决方案
- CSS 3之文字样式
- 打印机的ip地址怎么改?
- 初学电子快速入门的方法
- 无线模块在分布式数据采集中的应用
- 并发系列三:证明分代年龄、无锁、偏向锁、轻量锁、重(chong)偏向、重(chong)轻量、重量锁
- 2023寒假集训通知
热门文章
- 非对称加密 密码传输_密码学:对称与非对称加密
- oracle 10g sga_target,Oracle 10g 中sga_max_size 和sga_target用法
- 论文解读:It’s Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners
- R语言筛选dataframe中两个日期之外的数据行,介于两个日期(包括两个日期)之间的数据行
- 【Linux导论】Linux哲学(Linux philosophy)
- python设计2048小游戏_使用graphics.py实现2048小游戏
- 什么是MVVM,MVVM和MVC的区别?
- 阿里云生态峰会实录(下)
- ZZNUOJ算法题目录(C语言)
- mapbox 视角切换 3d与2d之前的切换,加指南针的旋转,模仿百度地图实现的效果