Hadoop生态hive（三）Hive QL介绍

2024-05-15 07:06:07

一、表

创建表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name

CREATE TABLE 创建一个指定名字的表。Hive 创建内部表时，会将数据移动到数据仓库指向的路径；

EXTERNAL 关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径（LOCATION），记录数据所在的路径，不对数据的位置做任何改变

创建表 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
指定数据库表模式（Schemas）:
例：

CREATE TABLE demo1 (id INT,name STRING);

两列：
一列Int类型
一列STRING类型

二、数据类型

简单数据类型

复杂数据类型

例：

Hive 中为了采用复杂数据类型是为了提高访问的速度

三、数据存储格式

TEXTFILE
SEQUENCEFILE
RCFILE
自定义格式

（1）TEXTFILE

分隔符

四、其他操作

（1）删除表 Drop Table
删除一个内部表的同时会同时删除表的元数据和数据。删除一个外部表，只删除元数据而保留数据。
（2）修改表Alter Table
用 ALTER TABLE tbl_name ADD PARTITION …来向一个表中增加分区
用ALTER TABLE tbl_name RENAME TO tbl_name_new 来修改表名
（3）加载数据Load data

LOAD DATA [LOCAL] INPATH 'filepath'
[OVERWRITE] INTO TABLE tablename
[PARTITION (partcol1=val1, partcol2=val2 ...)]

（4）查询语句 Select

SELECT [ALL | DISTINCT] select_expr, select_expr, ...
FROM table_reference
[WHERE where_condition][GROUP BY col_list]
[ CLUSTER BY col_list | [DISTRIBUTE BY col_list] [SORT BY col_list] ][LIMIT number]

例

1. 简单查询

SELECT * FROM t1
SELECT * FROM t1 LIMIT 10
SELECT * FROM sales WHERE amount > 10 AND region = "US"
SELECT DISTINCT col1, col2 FROM t1

2.子查询语句

SELECT t2.col1
FROM  (SELECT col1, SUM(col2) AS col2sum FROM t1 GROUP BY col1
)  t2
WHERE t2.col2sum > 10

Hadoop生态hive（三）Hive QL介绍相关推荐

探秘Hadoop生态6：Hive技术初探与实践入门
数据仓库_总结一,数据类型数据储存库将包括关系数据库.数据仓库.事务数据库.高级数据库系统.一般文件.数据流和万维网.高级数据库系统包括对象-关系数据库和面向特殊应用的数据库,如空间数据库.时间序 ...
Hive(三)hive的高级操作
一.hive的各种join操作语法结构: join_table: table_reference JOIN table_factor [join_condition] | table_referen ...
Hadoop生态Flume（一）介绍
一.概述 Apache Flume是一个分布式,可靠且可用的系统,用于有效地收集,聚合大量日志数据并将其从许多不同的源移动到集中式数据存储中. Apache Flume的使用不仅限于日志数据聚合.由于 ...
Hadoop 生态系列之 1.0 和 2.0 架构
自学大数据有一段时间了,找工作历时一周,找到一家大厂,下周入职,薪资待遇还不错,公司的业务背景自己也很喜欢.趁着还没有入职,给大家争取先把 Hadoop 系列的文章总结完毕,可以当做科普文,也可以当做 ...
Hadoop 生态系列之 Mapreduce
阅读文本大概需要 5 分钟.文章稍长,建议收藏慢慢看. 目前 Hadoop 系列文章的规划就是这样,持续补充完善中- 同时可以访问 https://data.cuteximi.com Hadoop 生 ...
Hadoop 生态系列之 HDFS
目前 Hadoop 系列文章的规划就是这样,持续补充完善中... 同时可以访问 :https://data.cuteximi.com Hadoop 生态系列之1.0和2.0架构 Hadoop 生态系列 ...
Hadoop生态hive（一）介绍
一.Hive是什么起源自facebook由Jeff Hammerbacher领导的团队,构建在Hadoop上的数据仓库框架.设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据.2 ...
Hadoop生态上几个技术的关系与区别：hive、pig、hbase 关系与区别
Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...
Hadoop生态hive（二）安装
一.安装模式内嵌模式:元数据保持在内嵌的Derby模式,只允许一个会话连接本地独立模式:在本地安装Mysql,把元数据放到Mysql内远程模式:元数据放置在远程的Mysql数据库官方文档: ...
hadoop生态下hive安装过程
Hive的安装部署 1.首先在Linux本地,新建/data/hive1目录,用于存放所需文件 (1)mkdir -p /data/hive1 (2)切换目录到/data/hive1下,上传apach ...

最新文章

热门文章