今天来解一道题面试中可能经常会被一些面试官拿来“刁难”的题,就是《如何统计连续打卡天数》,当然了这里面的打卡可以换成任意其他行为,比如连续登陆天数,连续学习天数,连续购买天数,这里的天数也是可以换成小时或者别的时间单位的。这个问题的逻辑还是有点复杂,如果要是之前没遇到过这种问题,当场被问到的时候,肯定会一脸懵。

直接来看实战,现在有一张表t,这张表存储了每个员工每天的打卡情况,现在需要统计截止目前每个员工的连续打卡天数,表t如下表所示:uidtdateis_flag12020/2/11

12020/2/20

12020/2/31

12020/2/41

12020/2/50

12020/2/61

12020/2/71

12020/2/81

22020/2/11

22020/2/20

22020/2/30

22020/2/41

22020/2/51

22020/2/61

22020/2/71

22020/2/81

上表中uid是用户id,tdate是日期,is_flag是记录用户当天是否打卡,1为打卡,0为未打卡。

我们希望得到的结果为:uidflag_days13

25

这个逻辑还是挺难想的,第一个想法就是通过前后数据偏移来实现,就是将is_flag向前移动一行或者向后移动一行,然后和原来的is_flag标签做差,如果结果为0,说明前后两天的值是相同的,要么都是0,要么都是1。但是还是不能够得出我们想要的结果。

再换一种思路:如果是连续打卡,那么打卡日期与一个递增的数字依次做差的结果值应该是相等的,不理解这句话没关系,看具体结果你就明白了。

我们先获取每个用户在这一段时间内所有打卡的排名,是所有打卡的排名哦,利用的是窗口函数的row_number(),代码如下:select      uid    ,tdate    ,row_number() over(partition by uid order by tdate) date_rankfrom    twhere is_flag=1

运行上面的代码,可以得到如下结果:uidtdatedate_rank12020/2/11

12020/2/32

12020/2/43

12020/2/64

12020/2/75

12020/2/86

22020/2/11

22020/2/42

22020/2/53

22020/2/64

22020/2/75

22020/2/86

接着再获取每个打卡日期(tdate)中的日与其打卡日期排名(date_rank)之间的差,比如uid=1的2020/2/3的打卡日期中的3号与其排名(date_rank)2做差等于1,实现代码如下:select     uid    ,tdate    ,date_rank    ,(date_format(tdate,"%e") - date_rank) as day_chafrom     (    select          uid        ,tdate        ,row_number() over(partition by uid order by tdate) date_rank    from        demo.newtable    where is_flag=1    )t1

运行上面的代码,最后可以得到如下结果:uidtdatedate_rankday_cha12020/2/110

12020/2/321

12020/2/431

12020/2/642

12020/2/752

12020/2/862

22020/2/110

22020/2/422

22020/2/532

22020/2/642

22020/2/752

22020/2/862

看上面的结果表,有没有看出点意思来,连续打卡日期的day_cha都是相等的,比如uid=1的2020/2/3和2020/2/4是连续的,他们的day_cha都是1。到这里,如果我们要获取连续打卡天数是不是就很容易了。

不过这里面还有一个问题,就是连续打卡天数是截止目前最近的一个 连续打卡天数还是历史坚持最长的打卡天数,这就是传说中的口径问题哈。虽然在我们这个例子里面,这两种打卡天数的出来的结果是一样的,但是有的时候会是不一样的,比如下面这样的例子:uidtdateis_flag12020/2/11

12020/2/20

12020/2/31

12020/2/41

12020/2/51

12020/2/60

12020/2/71

12020/2/81

上面这个例子中,最近连续打卡天数是2,历史最长的连续打卡天数却是3。

好了,我们继续回到解题上,我们先获取每个用户历史所有连续过得的打卡情况,实现代码如下:select     uid    ,day_cha    ,count(tdate) flag_daysfrom     (select     uid    ,tdate    ,date_rank    ,(date_format(tdate,"%e") - date_rank) as day_chafrom     (    select          uid        ,tdate        ,row_number() over(partition by uid order by tdate) date_rank    from        demo.newtable    where is_flag=1    )t1    )t2group by     uid    ,day_cha

运行上面的代码,得到如下结果:uidday_chaflag_days101

112

123

201

225

要获取最近的连续打卡天数,我们只需要把上表中day_cha这一列最大的值对应的flag_days取出来就可以;要获取历史最久的连续打卡天数,我们只需要把上表中flag_days的最大值取出来就可以。直接再来个子查询就好了。

类似的需求可能还有获取过去连续打卡天数大于某个值得人,只需要筛选上表中的flag_days即可达到目的。只要能够生成上面这样每个人历史所有连续打卡的情况表,那么大部分连续打卡相关的需求都可以通过上表来获得。

很经典的一道题,或者是一种业务场景,大家各自多多练习。

你还可以看:

讲讲你不知道的窗口函数

mysql 连续打卡天数_Sql如何统计连续打卡天数相关推荐

  1. mysql 连续打卡天数_Sql如何统计连续打卡天数?

    今天来解一道题面试中可能经常会被一些面试官拿来"刁难"的题,就是<如何统计连续打卡天数>,当然了这里面的打卡可以换成任意其他行为,比如连续登陆天数,连续学习天数,连续购 ...

  2. sql server计算日期到当前日期天数_Excel如何统计连续停机天数问题

    前几天有个朋友问了一个关于连续时间统计的问题,使用Power Query for Excel来解决的.今天在张俊红老师的公众号上看到了使用使用SQL来解决连续时间的统计问题.这个问题是一个非常经典的例 ...

  3. mysql如何查询月薪总额_SQL语句统计每天、每月、每年的销售总额

    展开全部 一.32313133353236313431303231363533e4b893e5b19e31333366306530SQL语句统计每年的销售总额 select year(ordertim ...

  4. mysql查询 展示横纵坐标_sql 分组统计查询并横纵坐标转换

    关于sql 分组统计查询,我们在做报表的时候经常需要用到;今天就在这里整理下; 先附上一段sql代码: if object_id(N'#mytb',N'U') is not null drop tab ...

  5. Sql如何统计连续打卡天数

    总第208篇/张俊红 今天来解一道题面试中可能经常会被一些面试官拿来"刁难"的题,就是<如何统计连续打卡天数>,当然了这里面的打卡可以换成任意其他行为,比如连续登陆天数 ...

  6. Hive 统计连续天数

    第一步:创建表 -- 创建表 create table if not exists continue_days( uid int comment '员工id', tdate string commen ...

  7. 如何统计连续(连续登陆天数,连续学习天数,连续购买天数)

    直接来看实战,现在有一张表t,这张表存储了每个员工每天的打卡情况,现在需要统计截止目前每个员工的连续打卡天数,表t如下表所示: uid    tdate    is_flag 1    2020/2/ ...

  8. MySql中关于某列中相同数值连续出现次数的统计

    MySql中关于某列中相同数值连续出现次数的统计 原表如下: www.2cto.com 100 101 102 100 100 103 104 102 102 105 106 101 101 输出如下 ...

  9. mysql余额统计_实现按部门月卡余额总额分组统计的SQL查_mysql

    陈优章的专栏 (原创,到现在为至最为复杂的SQL查询代码)实现按部门月卡余额总额分组统计的SQL查询代码(在Ms SQL Server中调试通过) SELECT dp.dpname1 AS 部门, c ...

  10. sql案例分析:统计连续登陆、日活、蚂蚁森林、排名等

    # 当天新用户hive -e \'select count(1) from hm2.daily_helper \where guid not in (select guid from hm2.hist ...

最新文章

  1. 亿级流量网关设计思路
  2. R语言构建xgboost模型、预测推理:输出预测概率、预测标签
  3. python udp数据报
  4. 你不得不了解的10款服务器监控工具
  5. mysql 复制功能_MySQL实现主从复制功能
  6. SpringBoot指南(一)——SpringBoot入门
  7. 《恋上数据结构第1季》单向循环链表、双向循环链表以及约瑟夫环问题
  8. 24矩阵——条件数与方程组的性态、“病态”矩阵与方程、系数矩阵与右端微小扰动情况、条件数的几何意义
  9. 算法图解 各部分回忆
  10. ajax文件上传进度条实现
  11. Python+OpenCV摄像头人脸识别
  12. 抽象代数笔记-环、域、扩域、伽罗瓦理论
  13. vue + web 前端访问后端,跨域问题解决方案
  14. linux下的定时任务
  15. 触发器referencing old as old new as new
  16. 编码实现字符串类CNString实现运算符重载
  17. 猿人学第1题(一天搞一个)
  18. Centos7本地yum源配置安装
  19. 了解计算 python零基础_Python零基础入门与科学计算 寒假班
  20. xbox 屏幕录制配置

热门文章

  1. logstash 导入数据,查看每秒导入的数据量及已导入数量和已导入时间
  2. 怎么样关掉红米note开发者选项
  3. Java8 effectively final
  4. 〖2011.08.19〗秋无痕常用软件全功能装机光盘2011年八月版(支持64位WIN7)
  5. 三大语言(C/Java/Python)基本数据类型大小 / 内置容器 总结
  6. 概率论与数理统计前两章总结
  7. 怒怼|扎克伯格到底是个怎样的人
  8. 简述什么是“零信任”
  9. 解决:RSA host key for [ip] has changed and you have requested strict checking.
  10. pure-ftpd安装与使用