算法人必懂的进阶SQL知识,4道面试常考题
1、多列转多行
假设现有一张Hive表,
元数据格式为:字段:
id stirng
tim string数据格式如下:
a,b,c,d 2:00,3:00,4:00,5:00
f,b,c,d 1:10,2:20,3:30,4:40需要变成:
a 2:00
b 3:00
c 4:00
d 5:00
a,b,c,d 2:00,3:00,4:00,5:00
f,b,c,d 1:10,2:20,3:30,4:40
selectid,tim,single_tim
fromdefault.a1lateral view explode(split(tim,',')) t as single_tim
selectid,tim,single_id_index,single_id
fromdefault.a1lateral view posexplode(split(id,',')) t as single_id_index,single_id
selectid,tim,single_id,single_tim
fromdefault.a1lateral view posexplode(split(id,',')) t as single_id_index,single_idlateral view posexplode(split(tim,',')) t as single_tim_index,single_tim
wheresingle_id_index = single_tim_index
2、排序后相邻两行均值
lag(字段名,N) over(partition by 分组字段 order by 排序字段 排序方式)lead(字段名,N) over(partition by 分组字段 order by 排序字段 排序方式)
selectyear,chr,if(pre_val is null,val,(val + pre_val) / 2.0) as avg_val
from
(
selectyear,chr,val,lag(val,1) over(partition by year order by chr asc) as pre_val
fromdefault.a2
) a
3、获取字符串索引列表
1011
0101
=> 取到每一行中1所对应的索引列表,索引从1开始
0101 2,4
1011 1,3,4
selectid,stri,concat_ws(',',collect_list(index)) as indices
from
(selectid,stri,chr,cast(index + 1 as string) as indexfromdefault.abcglateral view posexplode(split(stri,'')) ids as index,chrwherechr = '1'
) a
group byid,stri
4、分块排序
2014,1
2015,1
2017,0
2018,0
2019,1
2020,1
2021,1
2022,0
2023,0
=>
2014,1,1
2015,1,2
2017,0,1
2018,0,2
2019,1,1
2020,1,2
2021,1,3
2022,0,1
2023,0,2
select year,num,row_number() over(partition by min_year order by year asc) as new_rankfrom(select year,base.num as num,min_year,row_number() over(partition by base.year order by min_year desc) as rankfrom (select *from default.a3) baseinner join (select min_year,num,pre_numfrom (select year as min_year,num,lag(num,1) over(order by year) as pre_numfrom default.a3) awhere num!=pre_numor pre_num is null) min_yearon base.num = min_year.numwhere base.year >= min_year.min_year) ccwhere rank = 1order by year
select year as min_year,num,lag(num,1) over(order by year) as pre_numfrom default.a3
select min_year,num,pre_num
from (select year as min_year,num,lag(num,1) over(order by year) as pre_numfrom default.a3) a
where num!=pre_numor pre_num is null
select year,num,min_yearfrom(select year,base.num as num,min_year,row_number() over(partition by base.year order by min_year desc) as rankfrom (select *from default.a3) baseinner join (select min_year,num,pre_numfrom (select year as min_year,num,lag(num,1) over(order by year) as pre_numfrom default.a3) awhere num!=pre_numor pre_num is null) min_yearon base.num = min_year.numwhere base.year >= min_year.min_year) ccwhere rank = 1order by year
◆
精彩推荐
◆
推荐阅读
鸿蒙 OS 的到来,能为我们改变什么?
干货 | OpenCV看这篇就够了,9段代码详解图像变换基本操作
周杰伦的《说好不哭》,20万点评Python来分析
算法人必懂的进阶SQL知识,4道面试常考题
6张拓扑图揭秘中心化交易所的5种行为, 原来中心化比你想象的重要
分布式存储春天已来Storj首登top10; Cardano排名上升; 以太坊比特币活跃地址双下降 | 数据周榜
华为愿出售5G技术渴望对手;苹果将向印度投资10亿美元;华为全联接大会首发计算战略;腾讯自研轻量级物联网操作系统正式开源……
TDD 就是个坑
厉害!接班马云的为何是张勇?
你点的每个“在看”,我都认真当成了喜欢
算法人必懂的进阶SQL知识,4道面试常考题相关推荐
- gc日志一般关注什么_Java架构师必懂的GC日志知识
在Java,Android,C#等中,GC是自动的,而在几种前代编程语言(C,C ++)中,程序员必须明确编写代码才能释放对象. 所以,这对于Java,Android和C#应用程序开发人员来说是一个很 ...
- 光E电4个必懂的理财基础知识
现在越来越多的人意识到理财的重要性.理财不只要有正确的出资,也要有专业的理财办法.做好出资理财的关键所在掌握必要的出资理财根底知识,才华助理财一臂之力. 1.不明白的东西不要碰 这是最重要的一个概念. ...
- 非期望产出的sbm模型_KANO模型:产品人必懂的需求分析法
需求会因人而异,会因文化差异而不同:也会随着时间变化.作为产品设计者,我们应该持续调研需求,对产品进行迭代优化. 在做项目做产品的过程中,作为互联网产品设计师的我们,经常会接到来自PM/领导/业务方等 ...
- KANO模型(卡诺模型):产品人必懂的需求分析法
在做项目做产品的过程中,作为互联网产品设计师的我们,经常会接到来自PM/领导/业务方等等的各种需求. 有的时候,哪怕一个小功能.次次次级页面都会争得不可开交.这个时候怎么办呢?到底应该听谁的呢?哪个需 ...
- 会计人必知的实务基础知识
在实务工作中可能每个财务人员只负责某一个会计工作环节,尽管如此,每个财务人员还是非常有必要对财务工作的大致环节了如指掌. 一.财务工作的大致环节如下: 1.根据原始凭证或原始凭证汇总表填制记账凭证. ...
- 运营人必懂 | TikTok运营指南
"TikTok之前确实很火,现在呢?" 最新数据告诉你: Sensor Tower商店情报数据显示,2022年9月抖音及海外版TikTok在全球App Store和Google P ...
- 心理学:情商高的人必懂的三大沟通技巧
情商高的人意味着会说话,他所说的话让人不由自主的接受,其实情商高的人擅长沟通, 在心理学上来说,也是有套路的: 情商高手交流 1.让人印象深刻,尝试用"补偿称赞技巧" 如果我们想要 ...
- 网络工程师必懂的网络基础知识
✈前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:床长人工智能教程 文章目录 1 ip地址 1.1 ip 地址的作用?ip 地址分类? 1.2. 子网掩码的作用?默认 ...
- 〖编程初学者的自我修养 - 职业规划篇④〗- 优秀职人必懂、必会的职业规划
历时18个月,采访 850+ 得到的需求. 不管你是在校大学生.研究生.还是在职的小伙伴,该专栏有你想要的职业规划.简历.面试的答案. 说明:该文属于 编程初学者的自我修养 专栏,购买任意白宝书体系化 ...
最新文章
- skiplist跳表的 实现
- 洛谷P3572 [POI2014]PTA-Little Bird
- Github标星3K+,超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M
- 如何建立一个数据分析团队?
- RuntimeError: Bool type is not supported by dlpack
- JQuery 动画卷页 -- 返回顶部 动画特效(兼容Chrome)
- Java中try必须要结合catch吗_如何优雅的实现 try/catch 异常块?
- ASP.NET使用ConfigurationSection在Web.Config创建自定义配置节
- 将android界面背景设置为黑色
- 10个最佳的网站和App开发工具
- linux系统取代windows,Linux替代Windows系统软件大比拼
- 板级电源究竟该怎么选型芯片?(实战篇)
- VS Code:推荐插件 - HTML格式化(包括JS、CSS)
- kafka auto.offset.reset参数解析
- 大数(10^9)求欧拉数
- u盘插电脑上不显示怎么办?数据恢复还有希望吗
- 三方协议中的服务器,手把手教你三方协议怎么填
- 正则表达式:必须包含数字,小写,大写,符号
- 赢在测试2:中国软件测试专家访谈录
- Inno Setup软件 打包多个安装包程序