hive hql 交差并集 练习
交差并集
练习
1、
使用hive求出两个数据集的差集
数据:
t1表:
id name
1 zs
2 lst2表:
id name
1 zs
3 ww结果如下:
id name
2 ls
3 ww
SELECT t1.id
,t1.name
FROM t1
LEFT JOIN t2
ON t1.id = t2.id
WHERE t2.id is null union
SELECT t2.id
,t2.name
FROM t2
LEFT JOIN t1 ont t1.id = t2.id
WHERE t1.id is NULL
;
2、
两个表A 和B ,均有key 和value 两个字段,写一个SQL语 句,将B表中的value值置成A表中相同key值对应的value值
数据:
A:
key vlaue
k1 123
k2 234
k3 235
B:key value
k1 111
k2 222
k5 246 使用hive的hql实现,结果是B表数据如下:
k1 123
k2 234
k5 246
SELECT t1.key
,if(t2.key is null,t1.value,t2.value) value
FROM kv2 t1
LEFT JOIN kv1 t2
ON t1.key = t2.key
;
3、
有用户表user(uid,name)以及黑名单表Banuser(uid)
1、用left join方式写sql查出所有不在黑名单的用户信息
2、用not exists方式写sql查出所有不在黑名单的用户信息
--(1)
SELECT user.uid
,user.name
FROM USER
LEFT JOIN banuser
ON user.uid = banuser.uid
WHERE banuser.uid is NULL
;
--(2)
SELECT uid
,name
FROM user
WHERE not exists(
SELECT 1
FROM banuser
WHERE user.uid=banuser.uid)
;
hive hql 交差并集 练习相关推荐
- java集合交运算_java中计算集合的交差并集示例代码
前言 本文主要给大家简单介绍下,如何使用apache commons以及guava的类库来计算集合的交差并集.分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. maven com.go ...
- hive hql 普通查询 练习
普通查询 1. 使用hive的hql查询用户所在部门 dpt表 dpt_id dpt_name 1 产品 2 技术user_dpt表 user_id dpt_id 1 1 2 1 3 2 4 2 5 ...
- hive hql文档_30分钟入门 Hive SQL(HQL 入门篇)
Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...
- hive hql文档_大数据学习路线分享hive的运行方式
大数据学习路线分享hive的运行方式,hive的属性设置: 1.在cli端设置 (只针对当前的session) 3.在java代码中设置 (当前连接) 2.在配置文件中设置 (所有session有效) ...
- hive hql文档_Hive存储过程HQL/SQL(一)–hplsql命令行
关键字:Hive存储过程.HQL/SQL.hplsql命令行.PL/HQL Command Line PL/HQL主要是通过命令行工具来执行一个SQL查询语句或者是一个SQL脚本. 进入hplsql- ...
- hive hql文档_大数据学习不能停,看看如何安装hive快800倍!共572.91M视频文档
前言 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 其优点是学习成本低,可 ...
- Hive hql 经典5道面试题
最近在深入了解Hive,尚硅谷的这5道题很经典,有引导意义,分步解题也很有用,故记录之,方便回看 1.连续问题 如下数据为蚂蚁森林中用户领取的减少碳排放量 找出连续 3 天及以上减少碳排放量在 100 ...
- Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别
Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...
- 将服务器文件加载至hive表中,Hive入门到剖析(四)
10 Hive体系架构 10.1概念 用户接口:用户访问Hive的入口 元数据:Hive的用户信息与表的MetaData 解释器:分析翻译HQL的组件 编译器:编译HQL的组件 优化器:优化HQL的组 ...
- 如何将hive查询结果导出成txt文件
原文地址:https://zhidao.baidu.com/question/241683835498891364.html ------------------------------------- ...
最新文章
- 吴恩达教你读论文:持续而缓慢的学习,才是正道
- 从输入网址到显示网页的全过程分析【转】
- java工资高还是php_java和php哪个工资高
- 零元学Expression Blend 4 ndash; Chapter 21 以实作案例学习MouseDragElementBehavior
- Java Code Geeks和Packt提供的Hadoop书籍赠品
- jquery输入框按下回车提交表单
- Android系统性能优化(56)---APP性能优化
- 书籍推荐:Machine Learning Yearning
- 如何部署林根域、子域和域树
- 首个官方气象数据集公开,已训练出20多个“青出于蓝”的AI
- VisualStudio 2010从分析到实施(3)——使用Use Case Diagram设计系统交互
- 青岛科技大学C语言程序设计,青岛科技大学c语言试题库
- 联想打印机驱动安装报错
- Python 可轻松开发植物大战僵尸游戏(附动态演示+源码分享)
- Distral: Robust multitask reinforcement learning.
- PX4模块设计之十二:High Resolution Timer设计
- 神经网络学说的主要观点,神经网络宏观解释包括
- CF1428F Fruit Sequences
- HTML+CSS画同心圆
- 通过IDM提高QQ群文件下载速度