大数据开发hive数据库常用命令汇总

在大数据学习当中，尤其是Hadoop生态的学习当中，Hive是必备的，也是相对门槛较低，比较好入手的一个组件。今天的大数据开发分享，和大家分享Hive的基础知识点。

Hive简介
根据官方文档的定义，Hive是一种用类SQL语句来协助读写、管理那些存储在分布式存储系统上大数据集的数据仓库软件

1、进入hive数据库：

hive

2、查看hive中的所有数据库：

show databases;

3、用default数据库：

use default;

4、查看所有的表：

show tables;

5、查询表结构：

desc table_name（表名）;

6、查询表数据：

select * from table_name（表名）；

7、创建数据库：

hive> create schema shop_db;

8、验证数据库表：

hive> show databases;

9、删除数据库：

hive> drop database if exists shop_db;

drop schema shop_db;

全部删除相应的表在删除数据库之前：

hive> drop dataBASE if exists shop_db cascade;

10、创建表tb_employee

hive> create table if not exists tb_employee (id int,name string,salary string,destination string)
> comment '员工信息详情表'> row format DELIMITED
> fields terminated by '\t'> lines terminated by '\n'> stored as textfile;

如果增加分区必须在创建表的时候就创建分区，不然就会报错，创建分区的命令>partition by ‘根据哪个字段分区’，

hive> create table tb_employee (id int, name string, dept string)
> PARTITIONED BY (year int)
> row format delimited
> fields terminated by '\t'
> lines terminated by '\n'
> stored as textfile;

stored as textfile文件格式，文件格式在hive中有三种: textfile、Sequencefile、Rcfile。

11、添加数据到表中

hive> load data local inpath '/usr/hadoop/hive/employee.txt' overwrite into table tb_employee;

如果table是个分区表则必须在hql中指定分区

hive> load data local inpath '/usr/hadoop/hive/employee.txt' overwrite into table tb_employee partition(year=2022);

load data:加载数据；

local：本地数据

inpath:文件的地址

overwrite:覆盖表中的数据，注意加overwrite是重写表的数据，不加是追加数据

插入表数据：insert into tb_employee(id,name) values (1,'洪生鹏')；hive只支持插入不支持修改和删除

12、重命名表名：

hive> alter table tb_employee rename to emp;

13、修改tb_employee表中字段name为user_name:

hive> alter table tb_employee change name user_name string;

14、修改tb_employee表中字段salary的数据类型从float改为double：

hive> alter table tb_employee change salary salary double;

15、删除表

hive> drop table table_name;

16、创建视图

hive> create view employee_view as select * from tb_employee where salary>3000;

17、不同类型的连接 join 、left outer join 、right outer join 、full outer join

18、创建外部表：用external关键字

hive> create external table outside_table_name(name string comment '姓名',addr string comment '地址');

19、查询表信息：

desc formatted outside_table_name;

关于大数据开发，Hive基础知识点是必须要掌握的。

唐山徐敏被捕，事件再次反转，“保护伞”要现形了？

大数据开发hive数据库常用命令汇总相关推荐

hive mysql命令,Hive数据库常用命令
收藏一些Hive数据库常用命令,方便平时准备测试数据集. 查看库.创建普通Hive表: show databases; user lch_databases; show tables; create ...
猿创征文｜大数据开发必备的数据采集工具汇总
文章目录前言 1.Flume 适用场景工作方式 2.Flink CDC 适用场景工作方式 3.Sqoop 适用场景工作方式 4.Canal 适用场景工作方式 5.Kettle 适用场景工作 ...
大数据学习笔记——linux常用命令整理
1.常用操作查看当前目录下的所有文件及目录 ls/ll 进入目录 cd 查看当前目录 pwd 结束当前进程 ctrl+c/ctrl+z ctrl + z可以将一个正在前台执行的命令放到后台,并且 ...
小学生自学大数据第一章linux常用命令（一）
目录 1.vi/vim 1.1 是什么 1.2 一般模式 1.3 编辑模式 1.4 指令模式 2.帮助命令 2.1 man 2.2 help 2.3 type 3.文件目录类 3.1 pwd 3.2 ...
MySQL数据库常用命令汇总
-- 查看mysql的当前登陆用户 select user(); -- 列出数据库 show databases; -- 使用数据库 use mysql; describe mysql.user; s ...
大数据之-Hadoop3.x_Yarn_常用命令---大数据之hadoop3.x工作笔记0147
可以看到我们执行wordcount案例,然后可以通过yarn命令查看任务运行情况首先我们去启动集群. 可以看到yarn也启动好了,集群启动好了以后
大数据开发——Hive实战案例
文章目录 1. 创建表结构 1.1 视频表结构 1.2 用户表结构 2. 准备工作 2.1 创建临时表 2.2 创建最终使用表 2.3 对创建表进行解读 3. 业务分析 1. 创建表结构 1.1 视频 ...
大数据之Linux(一):常用命令之cat和head,tail命令结合
目录 1.查看文件所有内容(如果太长一般只显示后面一部分) 2.查看某个文件指定行信息(前n行,后n行) 3.从多少行开始查看文件 tail -n +行号 4.直接用sed命令 1.查看文件所有内容( ...
大数据系列(3)-HDFS 常用命令
目录 1.服务端命令 1.1 appendToFile 追加到文件 1.2 copyFromLocal 从本地拷贝 1.3 copyToLocal 下载文件到本地 1.4 count 统计文件目录. ...

大数据开发hive数据库常用命令汇总

大数据开发hive数据库常用命令汇总相关推荐

最新文章

热门文章