大数据学习——关于hive中的各种join
准备数据 2,b 3,c 4,d 7,y 8,u2,bb 3,cc 7,yy 9,pp
建表: create table a(id int,name string) row format delimited fields terminated by ',';create table b(id int,name string) row format delimited fields terminated by ',';
导入数据: load data local inpath '/root/hivedata/a.txt' into table a; load data local inpath '/root/hivedata/b.txt' into table b;
inner join 只打印能匹配上的数据,没有匹配上的不输出
select * from a inner join b on a.id =b.id;
left join
select * from a left join b on a.id=b.id;
right join
select * from a right join b on a.id=b.id;
full outer join
select * from a full outer join b on a.id=b.id;
left outer join
left semi join
select * from a left semi join b on a.id=b.id;
相当于
select * from a where a.id exists(select b.id from b); 在hive中效率极低
转载于:https://www.cnblogs.com/feifeicui/p/10284854.html
大数据学习——关于hive中的各种join相关推荐
- 大数据学习之Hive
什么是Hive Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取.转化.加载,这是一种可以存储.查询和分析存储在Hadoop中的大规模数据的机制.hive数据仓库工具能将结构化的数据文件 ...
- 大数据学习,Hive是丢不掉的!Hive练习题50道,你也试试!
建表 create table student(s_id string,s_name string,s_birth string,s_sex string) row format delimited ...
- 大数据学习(08)--Hadoop中的数据仓库Hive
文章目录 目录 1.什么是数据仓库? 1.1数据仓库概念 1.2传统数据仓库面临的挑战 1.3 Hive介绍 1.4 Hive与传统数据库的对比 1.5 Hive在企业中的部署与应用 2.Hive系统 ...
- 大数据学习笔记一:大数据的发展历程--MapReduce,Hive,Yarn,Hadoop,Spark,Flink
大数据学习系列文章:大数据-博客专栏 今天在学习极客时间专栏:<从0开始学大数据> 从预习 01 | 大数据技术发展史:大数据的前世今生到预习 03 | 大数据应用领域:数据驱动一切,系统 ...
- hive hql文档_大数据学习路线分享hive的运行方式
大数据学习路线分享hive的运行方式,hive的属性设置: 1.在cli端设置 (只针对当前的session) 3.在java代码中设置 (当前连接) 2.在配置文件中设置 (所有session有效) ...
- 大数据学习之路-Hive
Hive 1. Hive基本概念 1.1 什么是Hive 1.2 Hive的优缺点 1.2.1 优点 1.2.2 缺点 1.3 Hive架构原理 1.4 Hive和 数据库比较 1.4.1 查询语言 ...
- 大数据学习中应该确立怎样的学习目标
相信所有想要学习或是正在学习大数据相关知识的学员都是不满足于现状,对未来的职业发展有着很高追求的有志青年.那些对大数据学习抱有十足热情的人完成他们的职业理想.大数据学习会涉及到许多课程,每一项课程都不 ...
- 【大数据学习之路之hive】
大数据学习之路之hive hive安装 mysql安装 前言 安装步骤 1.解压文件 2.安装依赖库 3.安装结束后,配置mysql 4.设置开机自启动 5.添加环境变量 6.初始化mysql 7.开 ...
- 大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解
引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...
- 试图加载格式不正确的程序_好程序员大数据学习路线之hive存储格式
好程序员大数据学习路线之hive存储格式,hive的存储格式通常是三种:textfile . sequencefile . rcfile . orc .自定义 set hive.default.fil ...
最新文章
- c++ 负数比较大小_负数的定义(二)
- 学习数据结构 二叉查找树(binary search tree)
- centOS Redhat yum的配置
- python列表各种切片姿势
- php客户端连接远程redis,phpredis客户端连接Redis--华为云DCS for Redis使用经验
- django-oscar相关的模块调研信息汇总
- linux网络编程之用select方法实现io复用(基于udp)
- Object.keys方法拿到对象的key值
- SpringBoot自定义HttpMessageConverter
- element-ui按需引入
- (原創) 網站CSS重新調整,全面支援IE6與FireFox 2.0!! (Web) (CSS)
- 华为鸿蒙系统老手机能用吗_华为发布鸿蒙2.0手机开发者测试版!华为老手机可申请公测...
- python matplotlib包图像配色方案
- python爬取收费音乐_想下载的歌曲太多?嫌麻烦?要付费?戳这,帮你解决---Python爬取酷狗音乐...
- 基于python的漏洞扫描器_基于Python的Web漏洞扫描器
- 用英语推销计算机设备,销售电脑的英语对话
- 谷歌最新版本浏览器如何兼容flash插件
- 海信电视开启开发者模式
- 2020年,生活从“不易”开始
- 网络编辑必知常识:什么是PV、UV和PR值