HIVE表连接(转换成mapreduce作业,提交到hadoop上)

一、Hive等值连接和不等值连接

等值连接(连接条件中为等号):

select e.empno, e.ename,e.sal,d.dnamefrom emp e,dept dwhere e.deptno=d.deptno;

等值连接(条件中是不等号:>,

between and //含有边界,并且小值在前,大值在后 select e.empno,e.ename,e.sal,s.gradefrom emp e,salgrade swhere e.sal between 2000 and 8000;

二、Hive外连接

外连接: (在select语句中,所有没有包含在聚合函数中的列,都必须要出现在grouop by 子句的后面)

外连接(左外连接,右外连接)

左外连接(当我们的连接条件不成立时,连接条件的左边的表依然可以包含在结果中)

右外连接(当我们的连接条件不成立时,连接条件的右边的表依然可以包含在结果中)

//右外接 select d.deptno,d.dname,count(e.empno)from emp eright outer jion dept d on (e.deptno=d.deptno)group by d.deptno, d.dname;

三、Hive的表连接

自连接(自己和自己连接)

(自连接的核心:通过表的别名将一张表视为多张表)

select e.ename,b.enamefrom emp e,emp bwhere e.mgr=b.empno;//mgr是员工上级领导的编号,empno是员工的编号(都是公司员工)

hive内部表和外部表的区别_走近大数据之Hive进阶(四、Hive的表连接)相关推荐

  1. hive load data inpath 空目录_走近大数据之Hive进阶(一、Hive数据的导入)

    一.使用Load语句进行数据的导入 -语法: LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE]INTO TABLE tablename [PARTITIO ...

  2. 解析Android内部存储、外部存储的区别

    1.背景 在开发过程中我们都会使用到手机的内部缓存.外部缓存.但有些开发者对这两个存储区域理解还够透彻,以为手机内置的存储卡(不可手机移除)就是内部存储, 可插拔的SD卡就是外部存储,其实这些理解都是 ...

  3. 大数据之路读书笔记-11事实表设计

    大数据之路读书笔记-11事实表设计 文章目录 大数据之路读书笔记-11事实表设计 11.1 事实表基础 11.1.1 事实表特性 11.1.2 事实表设计原则 11.1.3 事实表设计方法 11.2 ...

  4. 【博学谷学习记录】超强总结,用心分享| 大数据之数仓及Hive介绍

    文章目录 前言 一.数据仓库介绍 (一) 数据仓库的基本概念 (二)数据仓库的主要特征 (三)数据仓库与数据库的区别 二.Hive的概念 (一)Hive的介绍 (二)Hive的架构 (三)Hive与传 ...

  5. 大数据入门教程系列之Hive内置函数及自定义函数

    本篇文章主要介绍Hive内置函数以及自定义UDF函数和UDFT函数,自定义UDF函数通过一个国际转换中文的例子说明. 操作步骤: ①.准备数据和环境 ②.演示Hive内置函数 ③.自定义UDF函数编写 ...

  6. 【大数据学习之路之hive】

    大数据学习之路之hive hive安装 mysql安装 前言 安装步骤 1.解压文件 2.安装依赖库 3.安装结束后,配置mysql 4.设置开机自启动 5.添加环境变量 6.初始化mysql 7.开 ...

  7. 大数据学习笔记35:Hive - 内部表与外部表

    文章目录 一.内部表 1.什么是内部表 2.创建与操作内部表 (1)创建park数据库 (2)在park数据库里创建student表 (3)在student表插入一条记录 (4)通过HDFS Expl ...

  8. 没想到!Excel服务器、excel开发平台、网表产品和云表,区别真的很大!

    用好一个工具很重要,但挑对工具带来的效果比你钻研一个工具数年都来得有意义,这是本人从业多年,实际体验之后得来的结论. 基于EXCEL的开发平台 在几年基层的工作之后,受到老总赏识,成为了公司的信息化工 ...

  9. 内部存储与外部存储的区别

    内部存储: 内部存储不是内存,而是一个位于系统中很特殊的一个位置.放入内部存储中的数据一般都只能被你的应用访问到,且一个应用所创建的所有文件都在应用包名相同的目录下,即/data/data/packa ...

最新文章

  1. shell脚本编程学习笔记(四)shell操作数据库
  2. 20155307 2016-2017-2 《Java程序设计》第10周学习总结
  3. ML之LiR2PolyR4PolyR:使用线性回归LiR、二次多项式回归2PolyR、四次多项式回归4PolyR模型在披萨数据集上拟合(train)、价格回归预测(test)
  4. Android编译32或64位程序
  5. 项目: 图书管理系统 【C++ / C】
  6. VTK:可视化之StructuredDataTypes
  7. FPGA的Veilog HDL语法、框架总结
  8. 发现 ASP.NET Core SignalR
  9. noip2016 蚯蚓
  10. Wordpress 2.91 的一些良好改进
  11. python分布式多进程框架 Ray
  12. leetcode刷题--python
  13. 《版式设计——日本平面设计师参考手册》—第1章置入其他格式的文件
  14. 计算机命令关闭445端口,关闭445端口命令是什么?设置关闭445端口的步骤教程
  15. python监控进程脚本_进程监控的python脚本
  16. 找不到硬盘分区怎么办
  17. 深度学习--Inception-ResNet-v1网络结构
  18. NVIDIA边缘端设备(nano、tx2、xavier等)查看安装的jetpack版本
  19. 基于JAVA准妈妈孕期交流平台计算机毕业设计源码+系统+lw文档+部署
  20. 【开源共享】全网最简单易用的imx6ull烧写工具设计初衷工作原理设计前的思考

热门文章

  1. SpringBoot 2 快速整合 | Hibernate Validator 数据校验
  2. jQuery 历史版本
  3. Python中单引号,双引号,三个单引号,外双单引号内双引号,外双引号内单引号的区别...
  4. 解决 iframe 后退不是主页面后退(浏览器 history)问题
  5. Android 源码分析(三) Service 启动分析
  6. call和apply;this;闭包
  7. A. 面向对象思想介绍
  8. jQuery hover事件
  9. 【图像处理】ISP 图像传感器camera原理
  10. [Asp.Net] Form验证中 user.identity为false