总第208篇/张俊红

今天来解一道题面试中可能经常会被一些面试官拿来“刁难”的题,就是《如何统计连续打卡天数》,当然了这里面的打卡可以换成任意其他行为,比如连续登陆天数,连续学习天数,连续购买天数,这里的天数也是可以换成小时或者别的时间单位的。这个问题的逻辑还是有点复杂,如果要是之前没遇到过这种问题,当场被问到的时候,肯定会一脸懵。

直接来看实战,现在有一张表t,这张表存储了每个员工每天的打卡情况,现在需要统计截止目前每个员工的连续打卡天数,表t如下表所示:

uid tdate is_flag
1 2020/2/1 1
1 2020/2/2 0
1 2020/2/3 1
1 2020/2/4 1
1 2020/2/5 0
1 2020/2/6 1
1 2020/2/7 1
1 2020/2/8 1
2 2020/2/1 1
2 2020/2/2 0
2 2020/2/3 0
2 2020/2/4 1
2 2020/2/5 1
2 2020/2/6 1
2 2020/2/7 1
2 2020/2/8 1

上表中uid是用户id,tdate是日期,is_flag是记录用户当天是否打卡,1为打卡,0为未打卡。

我们希望得到的结果为:

uid flag_days
1 3
2 5

这个逻辑还是挺难想的,第一个想法就是通过前后数据偏移来实现,就是将is_flag向前移动一行或者向后移动一行,然后和原来的is_flag标签做差,如果结果为0,说明前后两天的值是相同的,要么都是0,要么都是1。但是还是不能够得出我们想要的结果。

再换一种思路:如果是连续打卡,那么打卡日期与一个递增的数字依次做差的结果值应该是相等的,不理解这句话没关系,看具体结果你就明白了。

我们先获取每个用户在这一段时间内所有打卡的排名,是所有打卡的排名哦,利用的是窗口函数的row_number(),代码如下:

select  uid,tdate,row_number() over(partition by uid order by tdate) date_rank
fromt
where is_flag=1

运行上面的代码,可以得到如下结果:

uid tdate date_rank
1 2020/2/1 1
1 2020/2/3 2
1 2020/2/4 3
1 2020/2/6 4
1 2020/2/7 5
1 2020/2/8 6
2 2020/2/1 1
2 2020/2/4 2
2 2020/2/5 3
2 2020/2/6 4
2 2020/2/7 5
2 2020/2/8 6

接着再获取每个打卡日期(tdate)中的日与其打卡日期排名(date_rank)之间的差,比如uid=1的2020/2/3的打卡日期中的3号与其排名(date_rank)2做差等于1,实现代码如下:

select uid,tdate,date_rank,(date_format(tdate,"%e") - date_rank) as day_cha
from (select  uid,tdate,row_number() over(partition by uid order by tdate) date_rankfromdemo.newtablewhere is_flag=1)t1

运行上面的代码,最后可以得到如下结果:

uid tdate date_rank day_cha
1 2020/2/1 1 0
1 2020/2/3 2 1
1 2020/2/4 3 1
1 2020/2/6 4 2
1 2020/2/7 5 2
1 2020/2/8 6 2
2 2020/2/1 1 0
2 2020/2/4 2 2
2 2020/2/5 3 2
2 2020/2/6 4 2
2 2020/2/7 5 2
2 2020/2/8 6 2

看上面的结果表,有没有看出点意思来,连续打卡日期的day_cha都是相等的,比如uid=1的2020/2/3和2020/2/4是连续的,他们的day_cha都是1。到这里,如果我们要获取连续打卡天数是不是就很容易了。

不过这里面还有一个问题,就是连续打卡天数是截止目前最近的一个 连续打卡天数还是历史坚持最长的打卡天数,这就是传说中的口径问题哈。虽然在我们这个例子里面,这两种打卡天数的出来的结果是一样的,但是有的时候会是不一样的,比如下面这样的例子:

uid tdate is_flag
1 2020/2/1 1
1 2020/2/2 0
1 2020/2/3 1
1 2020/2/4 1
1 2020/2/5 1
1 2020/2/6 0
1 2020/2/7 1
1 2020/2/8 1

上面这个例子中,最近连续打卡天数是2,历史最长的连续打卡天数却是3。

好了,我们继续回到解题上,我们先获取每个用户历史所有连续过得的打卡情况,实现代码如下:

select uid,day_cha,count(tdate) flag_days
from (select uid,tdate,date_rank,(date_format(tdate,"%e") - date_rank) as day_cha
from (select  uid,tdate,row_number() over(partition by uid order by tdate) date_rankfromdemo.newtablewhere is_flag=1)t1)t2
group by uid,day_cha

运行上面的代码,得到如下结果:

uid day_cha flag_days
1 0 1
1 1 2
1 2 3
2 0 1
2 2 5

要获取最近的连续打卡天数,我们只需要把上表中day_cha这一列最大的值对应的flag_days取出来就可以;要获取历史最久的连续打卡天数,我们只需要把上表中flag_days的最大值取出来就可以。直接再来个子查询就好了。

类似的需求可能还有获取过去连续打卡天数大于某个值得人,只需要筛选上表中的flag_days即可达到目的。只要能够生成上面这样每个人历史所有连续打卡的情况表,那么大部分连续打卡相关的需求都可以通过上表来获得。

很经典的一道题,或者是一种业务场景,大家各自多多练习。

你还可以看:

讲讲你不知道的窗口函数

Sql如何统计连续打卡天数相关推荐

  1. mysql 连续打卡天数_Sql如何统计连续打卡天数?

    今天来解一道题面试中可能经常会被一些面试官拿来"刁难"的题,就是<如何统计连续打卡天数>,当然了这里面的打卡可以换成任意其他行为,比如连续登陆天数,连续学习天数,连续购 ...

  2. sql如何求连续打卡

    前言:   前一段时间遇到了一个需求,有一个运营活动要求在站内连续发布部分问题回答的学员,每日发布多次也算一次.当时绞尽脑汁最后求了 用户和有发布回答的天数排序的数据,但是连续问题想了一两个小时没得题 ...

  3. sql server计算日期到当前日期天数_Excel如何统计连续停机天数问题

    前几天有个朋友问了一个关于连续时间统计的问题,使用Power Query for Excel来解决的.今天在张俊红老师的公众号上看到了使用使用SQL来解决连续时间的统计问题.这个问题是一个非常经典的例 ...

  4. Hive 统计连续天数

    第一步:创建表 -- 创建表 create table if not exists continue_days( uid int comment '员工id', tdate string commen ...

  5. 如何统计连续(连续登陆天数,连续学习天数,连续购买天数)

    直接来看实战,现在有一张表t,这张表存储了每个员工每天的打卡情况,现在需要统计截止目前每个员工的连续打卡天数,表t如下表所示: uid    tdate    is_flag 1    2020/2/ ...

  6. sql案例分析:统计连续登陆、日活、蚂蚁森林、排名等

    # 当天新用户hive -e \'select count(1) from hm2.daily_helper \where guid not in (select guid from hm2.hist ...

  7. mysql 连续打卡_MySQL查询连续打卡信息?

    最近多次看到用SQL查询连续打卡信息问题,自己也实践一波.抛开问题本身,也是对MySQL窗口函数和自定义变量用法的一种练习. 01 建表 所用数据库为MySQL8.0,简单而不失一般性,建立一个仅有记 ...

  8. mysql连续打卡次数_MySQL查询连续打卡信息?

    导读:最近多次看到用SQL查询连续打卡信息问题,自己也实践一波.抛开问题本身,也是对MySQL窗口函数和自定义变量用法的一种练习. 00 建表 所用数据库为MySQL8.0,简单而不失一般性,建立一个 ...

  9. 【每日一练:SQL】写一条SQL统计连续三个月金额大于0及每个月的金额

    写一条SQL统计连续在三个月金额大于0及展现每个月的金额 需求: 下面是表FEE,字段是month(月份),service_id(电话号码),fee(出帐金额),请参看下面要求:    Month   ...

最新文章

  1. 简直骚操作,ThreadLocal还能当缓存用
  2. 【转】gdb 调试段错误
  3. Struts2框架原理
  4. CATIA中使用约束时提示“创建的约束是临时的。若希望使他成为永久约束,则需要在单击确定按钮之前激活约束开关。”
  5. 12.swift 元祖
  6. Mybatis-SpringBoot集成/配置
  7. java中使用switch case报错case expressions must be constant expressions
  8. 终于解决“百年一遇”奇怪问题
  9. Windows 11 来了!无缝支持安卓 App,界面却像极了 macOS
  10. 精通Hyperledger之Hyperledger composer建模语言(15)
  11. 5G模块M.2座子管脚和封装分析
  12. JDK动态代理简单实现
  13. 计算机无法对光盘格式化,使用驱动器X:中的光盘之前需要将其格式化,是否需要将其格式化?...
  14. 2013中国旅游网站100强排行榜
  15. 银行家算法的实验报告
  16. 微信登录API使用小结
  17. 考研数学复习笔记——行列式2
  18. EXCEL利用正则匹配去替换内容
  19. python操作数据库教程_python通用数据库操作工具 pydbclib|python基础教程|python入门|python教程...
  20. 获取每日一句,每天发给女朋友。

热门文章

  1. winowsformshost 的构造函数执行符合指定的绑定约束的_C# 应该允许为 struct 定义无参构造函数...
  2. python 关闭窗口事件_python在Linux平台下捕获窗体关闭事件
  3. python查找文字在图片中的位置_图片中的文字竟然能如此快速提取?OCR文字识别功能简直太强大了...
  4. springboot页面乱码问题
  5. Java主线程等待子线程、线程池
  6. Teams新功能更新【六月底】Microsoft Teams: Music on Hold
  7. 【leetcode】109. Convert Sorted List to Binary Search Tree
  8. 深入理解Spring系列之一:开篇
  9. VMware、Pivotal和Google Cloud协力推出全新基于Kubernetes的容器服务——Pivotal Container Service(PKS)...
  10. abap中的弹出窗体函数