数仓经典面试题三:用户留存
题目要求:
如何计算留存率
留存率是考察企业留住用户的能力,我们经常会计算次日留存、2日留存、7日留存等,如果现在让你用SQL实现,该怎么操作呢?
表部分数据如下:
留存数据字段说明:
用户id:用户唯一标识;
APP应用名称:是手机中的某个应用,例如相机、微信、大众点评等。
启动时长:某一天中使用某应用多长时间(分钟)。
启动次数:某一天中启动了某应用多少次。
登陆时间:使用手机的日期。例如2018-05-01。
现在该手机厂商想要分析手机中的应用(相机)的活跃情况,需统计如下数据:
某日活跃用户(用户id)在后续的一周内的留存情况(计算次日留存用户数,3日留存用户数,7日留存用户数)
指标定义:
某日活跃用户数,某日活跃的去重用户数。
N日活跃用户数,某日活跃的用户数在之后的第N日活跃用户数。
N日活跃留存率,N日留存用户数/某日活跃用户数
例:登陆时间(20180501日)去重用户数10000,这批用户在20180503日仍有7000人活跃,则3日活跃留存率为7000/10000=70%
所需获得的结果格式如下:
留存样板:
自连接实现方式:
数仓经典面试题三:用户留存相关推荐
- 大数据数仓高级面试题整理
大家好,给大家整理了一下大数据数仓高级面试题,希望大侠们能够喜欢. 数仓高内聚低耦合是怎么做的 定义 高内聚:强调模块内部的相对独立性,要求模块内部的元素尽可能的完成一个功能,不混杂其他功能,从而使模 ...
- 数仓4.0(三)------数据仓库系统
目录 一:数仓分层 1.1 为什么要分层 1.2 数据集市与数据仓库概念 二:数仓理论 2.1 范式理论 2.1.1 范式概念 2.1.2 函数依赖 2.2 关系建模与维度建模 2.2.1 关系建模 ...
- 离线数仓-01-项目介绍和用户行为数据采集
文章目录 数据仓库概念 项目需求和架构设计 项目需求分析 技术选型 系统数据流程设计 框架版本选型 服务器选型 集群规模 集群资源规划设计 用户行为数据采集01-日志数据生成模块 目标数据 数据埋点 ...
- hive经典面试题2--次日留存、3日、7日留存怎么计算
背景:互联网公司,分析app上线后的效果,通常会通过很多指标来分析,其中一个指标就是留存率,留存率中最重要的就是次日留存,如果次日留存很高,说明这个app很成功,用户粘性高. 留存是怎么定义的呢? 一 ...
- 数仓4.0(三)------数据仓库系统(续)
四:数仓搭建-ODS层 首先,先了解一下ODS层的任务即其功能: 1)保持数据原貌不做任何修改,起到备份数据的作用. 2)数据采用LZO压缩,减少磁盘存储空间.100G数据可以压缩到10G以内. 3) ...
- 左神讲算法——异或的高级操作(两数交换+经典面试题)
目录 1. 异或的性质 2. 两数交换 3. 经典面试例题 参考链接:2021最新左神数据结构算法全家桶 1. 异或的性质 异或可以看成相同为1,不同为0:也可以看作无进位相加,有奇数个1则结果为1, ...
- 数仓经典案例-各个视频平均完播率、平均播放进度
问题1:计算2021年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序 注:视频完播率是指完成播放次数占总播放次数的比例.简单起见,结束观看时间与开始播放时间的差>=视频时 ...
- 经典面试题(三):ASP.NET部分----ASP.NET 页面之间传递值的几种方式
ASP.NET 页面之间传递值的几种方式 1.使用QueryString, 如....?id=1; response. Redirect().... 2.使用Session变量. 3.使用Serve ...
- 用户画像(一)数仓与表结构的基本构建
文章目录 初识用户画像 基础架构 数仓分层 用户画像标签 用户源数据分析 画像目标分析 用户画像建模 用户基本属性表 用户消费订单表 用户购买类目表 用户访问信息表 商品订单表 埋点日志表 访问日志表 ...
最新文章
- 只知道用它打印了Hello World,除此之外你了解多少呢?
- Linux学习笔记02
- 《大数据分析原理与实践》一一第3章 关联分析模型
- 透过率和反射率的关系_全国本科率只有不到百分之五?!醒醒吧!
- php 读文件返回字符串,PHP:file_get_contents('php:// input')返回JSON消息的字符串...
- WP7 开发(十五)输入范围和文本框
- linux系统下网络连接不上的问题
- STL系列使用教程(一)基础概念
- Nodejs开发框架Express3.0开发手记
- React传递参数的多种方式
- 自学Python八 爬虫大坑之网页乱码
- 问题描述_vortex_新浪博客
- VC++网络安全编程范例(2)-创建自签名证书
- opencv3/C++ 机器学习-EM算法/Expectation Maximization
- Python在WRF模型自动化运行及前后处理中的应用
- java使用递归,复制文件夹下的所有子文件
- 优秀的计算机简历,计算机优秀简历范文
- Django项目(sysinfo系统信息和用户信息展示)
- OpenCV中threshold自动阈值,类似matlab中的graythresh
- harness记忆_Java Microbenchmarking Harness的动手实践