一、表

创建表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name 

CREATE TABLE 创建一个指定名字的表。Hive 创建内部表时,会将数据移动到数据仓库指向的路径;

EXTERNAL 关键字可以让用户创建一个外部表,在建表的同时指定一个指向实际数据的路径(LOCATION),记录数据所在的路径,不对数据的位置做任何改变

创建表 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name 
指定数据库表模式(Schemas):
例:

CREATE TABLE demo1 (id INT,name STRING);

两列:
一列Int类型
一列STRING类型

二、数据类型

简单数据类型

复杂数据类型

例:

Hive 中为了采用复杂数据类型是为了提高访问的速度

三、数据存储格式

TEXTFILE
SEQUENCEFILE
RCFILE
自定义格式

(1)TEXTFILE

分隔符

四、其他操作

(1)删除表 Drop Table
删除一个内部表的同时会同时删除表的元数据和数据。删除一个外部表,只删除元数据而保留数据。
(2)修改表Alter Table
用 ALTER TABLE tbl_name ADD PARTITION …来向一个表中增加分区
用ALTER TABLE tbl_name RENAME TO tbl_name_new 来修改表名
(3)加载数据Load data

LOAD DATA [LOCAL] INPATH 'filepath'
[OVERWRITE] INTO TABLE tablename
[PARTITION (partcol1=val1, partcol2=val2 ...)]

(4)查询语句 Select

SELECT [ALL | DISTINCT] select_expr, select_expr, ...
FROM table_reference
[WHERE where_condition][GROUP BY col_list]
[ CLUSTER BY col_list | [DISTRIBUTE BY col_list] [SORT BY col_list] ][LIMIT number]

1. 简单查询

SELECT * FROM t1
SELECT * FROM t1 LIMIT 10
SELECT * FROM sales WHERE amount > 10 AND region = "US"
SELECT DISTINCT col1, col2 FROM t1

2.子查询语句

SELECT t2.col1
FROM  (SELECT col1, SUM(col2) AS col2sum FROM t1 GROUP BY col1
)  t2
WHERE t2.col2sum > 10

Hadoop生态hive(三)Hive QL介绍相关推荐

  1. 探秘Hadoop生态6:Hive技术初探与实践入门

    数据仓库_总结 一,数据类型 数据储存库将包括关系数据库.数据仓库.事务数据库.高级数据库系统.一般文件.数据流和万维网.高级数据库系统包括对象-关系数据库和面向特殊应用的数据库,如空间数据库.时间序 ...

  2. Hive(三)hive的高级操作

    一.hive的各种join操作 语法结构: join_table: table_reference JOIN table_factor [join_condition] | table_referen ...

  3. Hadoop生态Flume(一)介绍

    一.概述 Apache Flume是一个分布式,可靠且可用的系统,用于有效地收集,聚合大量日志数据并将其从许多不同的源移动到集中式数据存储中. Apache Flume的使用不仅限于日志数据聚合.由于 ...

  4. Hadoop 生态系列之 1.0 和 2.0 架构

    自学大数据有一段时间了,找工作历时一周,找到一家大厂,下周入职,薪资待遇还不错,公司的业务背景自己也很喜欢.趁着还没有入职,给大家争取先把 Hadoop 系列的文章总结完毕,可以当做科普文,也可以当做 ...

  5. Hadoop 生态系列之 Mapreduce

    阅读文本大概需要 5 分钟.文章稍长,建议收藏慢慢看. 目前 Hadoop 系列文章的规划就是这样,持续补充完善中- 同时可以访问 https://data.cuteximi.com Hadoop 生 ...

  6. Hadoop 生态系列之 HDFS

    目前 Hadoop 系列文章的规划就是这样,持续补充完善中... 同时可以访问 :https://data.cuteximi.com Hadoop 生态系列之1.0和2.0架构 Hadoop 生态系列 ...

  7. Hadoop生态hive(一)介绍

    一.Hive是什么 起源自facebook由Jeff Hammerbacher领导的团队,构建在Hadoop上的数据仓库框架.设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据.2 ...

  8. Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别

    Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...

  9. Hadoop生态hive(二)安装

    一.安装模式 内嵌模式:元数据保持在内嵌的Derby模式,只允许一个会话连接  本地独立模式:在本地安装Mysql,把元数据放到Mysql内  远程模式:元数据放置在远程的Mysql数据库 官方文档: ...

  10. hadoop生态下hive安装过程

    Hive的安装部署 1.首先在Linux本地,新建/data/hive1目录,用于存放所需文件 (1)mkdir -p /data/hive1 (2)切换目录到/data/hive1下,上传apach ...

最新文章

  1. int printf(const char* fmt,...)
  2. java中break内外循环_java 中break如何跳出外部循环
  3. 大数据平台建设方案_工信部:全国范围内逐步推进反诈大数据平台建设
  4. 小老板,我学的计算机组成原理告诉我半导体存储器都是断电后丢失的,为什么U盘SSD(固态硬盘)没事呢?
  5. 农村新农保加钱可不可以转城市社保?
  6. linux 笔记(2) 目录直接强行删除rm -rf *(删除当前目录所有的内容)
  7. 不确定性原理的前世今生 · 数学篇(二)
  8. 项目经理的三个立足点
  9. html打字练习测试代码,JS实现简单打字测试
  10. Hadoop报错Permissions incorrectly set for dir /tmp/hadoop-LeiHanhan/nm-local-dir/filecache, should be
  11. ML:可解释性之SHAP值的公式推导(基于原论文利用树类模型的Tree SHAP公式推导)之详细攻略
  12. lnkscape制作logo
  13. 如何利用领英快速开发客户?
  14. 《Gartner2016年度新兴技术成熟度曲线》全解读
  15. JS 数组 isAarray() typeof push() unshift() splice()替换/删除/插入 slice()切片 join() split() reverse concat
  16. 训练集、验证集、测试集以及交叉验证
  17. sql 纵向求和_SQL里边的求和语句怎么写
  18. 生产力、商业价值和敏捷
  19. ie浏览器打不开闪退_卸载并重装IE11后,IE浏览器闪退不能启动,win10 home 系统...
  20. python a股行情_用Python,tushare做一个A股每日收盘行情监测分析(含源代码)

热门文章

  1. leetcode——344. 反转字符串
  2. ndr4108贴片晶振是多少频率_关于山羊挺身你知道多少?这些干货速来了解一下...
  3. [SpringSecurity]HelloWorld入门案例
  4. C++实现邻接矩阵存储的图及dfs遍历
  5. Zookeeper--Watcher机制源码剖析一
  6. Hystrix能解决的问题
  7. Sprig boot自动配置
  8. 2019-03-09-算法-进化(买卖股票的最佳时机 II)
  9. acwing199.余数之和(除法分块)
  10. Libre OJ 「BalticOI 2013」非回文数 数位dp